三腳貓型地痞rice_b
@rice_b
3 年前
(先說我看不懂)
演算法的模型與參數不用放大,把訓練用的數據放大一倍,token也增加一倍,就能改善最終訓練出來的結果
Is Andrej Karpathy LEAVING TESLA? Or is he thinking ...
掰噗~
@baipu
覺得
3 年前
題問的理哲有富個一是真
載入新的回覆
演算法的模型與參數不用放大,把訓練用的數據放大一倍,token也增加一倍,就能改善最終訓練出來的結果