精進波羅蜜
是說接續前噗,其實Deepseek並不是中國第一個大型LLM,當年ChatGPT問世後,百度馬上搞了一個文心一言,不過文心一言一開始破碇太多,因此被噴的很慘。但文心一言進化的很快,目前號稱有2億用戶,是個封閉模型。市場上的領先者都會採封閉模式,如ChatGPT一樣。由於這東西都是一家獨大,因此落後的挑戰者就用開源模式,如臉書的Llama與Deepseek,利用免費開源來建立開發社群,以擊敗領先的封閉模型。而我猜Deepseek開源的目的,在於混淆真假資訊來搞錢。Deepseek在技術上有所突破是真的,所以敢公開原始碼供各方檢驗,但是否真能以如此低廉的價格完成訓練,可能就是假的,因為這你無從查證,但重點劃在搞出聲量就能騙到政府注挹、投資人繼續投錢。
精進波羅蜜
Deepseek並不像文心一言,背後有巨獸百度可以不斷燒錢,所以需要想辦法活下去,騙政府的錢是最快的方式,特別是中國政府現在急需要一個東西,來反擊美國的晶片管制,Deepseek很聰明的拿出自己突破的技術,讓中國政府使用,換來中國政府的重視,中國高層還讓開發者到重要會議上演講,所有的媒體一起吹捧,成功讓美國灰頭土臉。Deepseek立下此等大功,中國政府不多投點錢都說不過去了。
Nomind-無心
不只百度的文心一言,還有阿里巴巴的通義千問、騰訊的Hunyuan、華為的盤古....
Nomind-無心
他們不是缺錢,比較缺晶片
精進波羅蜜
因為外界都知道,Deepseek在禁令開始前,就屯了一萬張的H100,所以沒有人相信Deepseek沒有用,Deepseek也大方承認有部份使用。但Deepseek的戰略價值,是他們試圖證明使用低階的晶片也能訓練出不錯的模型。而中國的成熟製程是越來越便宜的,華為自己就搞了比較低階的AI晶片,想要叫中國的開發者使用。Deepseek的出現,讓中國政府可以向外界證明,這條路是走的通的,也能安撫中國的公司(雖然我不並這麼樂觀)。
精進波羅蜜
我猜Deepseek的下一步,就是號稱完全使用中國國產晶片進行訓練,然後成品利用一些輔助手段,達到不錯的成績,再搭配媒體宣傳,看美國那些想賺中國錢的人,會不會全部跳出來,說美國的晶片禁令沒用,逼使美國政府讓步。這樣中國就能死裡逃生了。
精進波羅蜜
至於國民黨又跳出來扯什麼數位殖民,我覺得是完全搞不清楚狀況。其實台灣真要搞,也很簡單,政府投錢買晶片,一樣能訓練出LLM,網路上一堆公開論文可以抄,這又不是什麼厲害的技術,我只是沒錢買晶片,不然我都辦得到。但這樣作有意義嗎??台灣只要不站錯隊,就能使用所有歐美國家的成果,發展自己有優勢的領域,不用像中國為了挑戰美國的霸權,突破封鎖,把國家的資源虛擲在各個領域,好搞出可以挑戰美國的東西。
tacchang
然後搭配刪預算,真的是得了阿茲海默的老K
そこ曲がったら猫がいる。
tacchang : 他們都玩這招,刪預算再怪你沒能力做到。換句話說,他們藉由捧中國來貶低政府,然後表示必須要靠國民黨才有辦法(但他們只會歐錢)
銀色衝浪手|計然
這麼厲害,那讓他們用386 cpu跑看看
惡魔.麥當勞
Deepseek 比較像日本二戰時的零式戰機,只是外表上像戰機,但各方向都 cut corner。他可以成為類似 chatgpt 的「娛樂閒談」型 AI,但不能在企業上使用,特別自動駕駛,醫學代刀,科研之類都用不上。跑 benchnark 一流,定位是 AI 界造題家。
惡魔.麥當勞
精進波羅蜜 : 我比相信 Alexendr Wong 的講法,是五萬張 H100 而且可能還只是低估。美國政府已經釘住一家越南公司,負責幫 Deepseek 走私晶片。
臭口水怪獸
先圈到錢就是棒
載入新的回覆