三腳貓型地痞rice_b - p/osveuf - 讀噗

三腳貓型地痞rice_b

@rice_b

3 年前

（先說我看不懂）
演算法的模型與參數不用放大，把訓練用的數據放大一倍，token也增加一倍，就能改善最終訓練出來的結果

Is Andrej Karpathy LEAVING TESLA? Or is he thinking ...

@baipu

覺得

3 年前

題問的理哲有富個一是真

載入新的回覆