p/3gtprtw6iu

@ivanusto

Tue, Jan 28, 2025 4:34 AM

Tue, Jan 28, 2025 4:45 AM

13

3

DeepSeek 也能夠在本地端跑，然後雲端一堆可以測試的，而許多UI直接可以串它的API去用。預期未來滿多其他AI模型也會用新的訓練方法和流程去改善各自的產品。
然後DeepSeek那篇論文最大的價值就是LLM的新訓練方法論。其他AI需要的算力還是需要大量的電和顯示卡資源沒錯。

@hmystgot

Tue, Jan 28, 2025 4:34 AM

@baipu

覺得

Tue, Jan 28, 2025 4:34 AM

你說得真是太對了!

@KMN_BOT

說

Tue, Jan 28, 2025 4:34 AM

真的可以嗎汪

@ivanusto

Tue, Jan 28, 2025 4:46 AM

至於吹捧中國的多好倒是可以跳過，可能他們會有人用之外，我覺得蒸餾過後的小模型可在中國品牌的智慧型手機上跑就算不錯的結果了。

@ivanusto

Tue, Jan 28, 2025 4:46 AM

其他AI廠商應該會參考這個方法與後續其他人的發現，做出更多更好的訓練方法來淬鍊自己的新模型。

@ivanusto

Tue, Jan 28, 2025 4:47 AM

各國的各種AI論文，現在正於市場上滿天飛哪

@ivanusto

Tue, Jan 28, 2025 7:23 AM