/Tech1h ago

Developer @tensorqt sets a new modded-NanoGPT speedrun record of 2,925 steps to reach 3.2781 validation loss

Parameter-space extrapolation shaved five steps off the previous record.

8746103.8K

#703

Original post

Keller Jordan@kellerjordan0#703inTech

N.B. p-values are as follows: P(invalid) = 2.3e-5 P(non-improvement) = 0.168

Keller Jordan@kellerjordan0

New Modded-NanoGPT optimization SOTA: @tensorqt has achieved a 2925-step run (-5 steps vs. prev SOTA) by adding a late parameter-space extrapolation step to the previous record.

11:37 AM · Jun 20, 2026 · 652 Views

Sentiment

Sentiment building, check back later.

Cluster Engagement

Digg Deeper

No Digg Deeper questions have been answered for this story yet.

Posts from X

Most Activity

VIEWS3.2KBOOKMARKS10LIKES70RETWEETS6REPLIES6

Keller Jordan@kellerjordan0

New Modded-NanoGPT optimization SOTA: @tensorqt has achieved a 2925-step run (-5 steps vs. prev SOTA) by adding a late parameter-space extrapolation step to the previous record.

1h3.2K7010

Florian Brand@xeophon

@kellerjordan0 @tensorqt yoooooo the lich 🐐

Keller Jordan@kellerjordan0

New Modded-NanoGPT optimization SOTA: @tensorqt has achieved a 2925-step run (-5 steps vs. prev SOTA) by adding a late parameter-space extrapolation step to the previous record.

1h33220