永遠的真田幸村
@ivanusto
Tue, Jan 28, 2025 4:34 AM
Tue, Jan 28, 2025 4:45 AM
13
3
DeepSeek R1 測試感想 – 優格網 – 永遠的真田幸村
DeepSeek
也能夠在本地端跑,然後雲端一堆可以測試的,而許多UI直接可以串它的API去用。預期未來滿多其他AI模型也會用新的訓練方法和流程去改善各自的產品。
然後DeepSeek那篇論文最大的價值就是LLM的新訓練方法論。其他AI需要的算力還是需要大量的電和顯示卡資源沒錯。
Hey Man BOT
@hmystgot
Tue, Jan 28, 2025 4:34 AM
掰噗~
@baipu
覺得
Tue, Jan 28, 2025 4:34 AM
你說得真是太對了!
機器狼🔜茶會首次出毛!
@KMN_BOT
說
Tue, Jan 28, 2025 4:34 AM
真的可以嗎汪
永遠的真田幸村
@ivanusto
Tue, Jan 28, 2025 4:46 AM
至於吹捧中國的多好倒是可以跳過,可能他們會有人用之外,我覺得蒸餾過後的小模型可在中國品牌的智慧型手機上跑就算不錯的結果了。
永遠的真田幸村
@ivanusto
Tue, Jan 28, 2025 4:46 AM
其他AI廠商應該會參考這個方法與後續其他人的發現,做出更多更好的訓練方法來淬鍊自己的新模型。
永遠的真田幸村
@ivanusto
Tue, Jan 28, 2025 4:47 AM
各國的各種AI論文,現在正於市場上滿天飛哪
永遠的真田幸村
@ivanusto
Tue, Jan 28, 2025 7:23 AM
@ivanusto - XD 果然還是這樣:) 重點是開源囉
載入新的回覆
然後DeepSeek那篇論文最大的價值就是LLM的新訓練方法論。其他AI需要的算力還是需要大量的電和顯示卡資源沒錯。