精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:04 AM
Sun, Feb 9, 2025 3:08 AM
94
38
是說看到有人在說,要用中國的Deepseek模型為基礎,發展台灣的大型語言模型,個人是覺得這聽起來像詐欺。跟Deepseek一樣,打算騙政府的錢。Deepseek有突破沒錯,但我猜他們的最終目標,是從中國政府騙錢。台灣這邊看來也有人想要如法炮製,而且懶到直接拿Deepseek來騙,比中國那邊的人更爛。拿國外成熟的開源模型,發展繁體中文的版本,這政府早早就在作了,台灣真正有在研究大型語言模型的人,早就下載回來玩到爛了。用的就是目前最熟成,國外最多人用的臉書Llama模型,不才小弟我從2.0版就開始玩,還訓練過爌肉飯百科輔助模型,現在Llama已經發展到了3.0。差別只在於Deepseek全部開源允許商用,但臉書限制若商用一個月超過7億使用,就要來分錢。
Meta釋出Llama 3 國科會:已開放具台灣文化的大型繁體中文模型 | 聯合新聞網
精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:04 AM
基本上你要一個月有七億流量很難啊。
精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:05 AM
國民黨一方面刪國內科學研究的錢,一方面趕搭Deepseek的熱潮,說要用中國的模型來訓練,我真心覺得就兩個字「噁心」。
精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:06 AM
台灣很努力啊,抄的很快,Llama 3剛出來沒有幾天,台灣的繁體中文版就上線了。
精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:07 AM
政府拿來用,不用錢,就不是商用了,臉書也拿你沒辦法。台灣要是有人利用政府的資源,開發出一個月可以有7億使用的商業應用,那也很了不起了。
精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:11 AM
而且你要注意,Deepseek完全開源商用的是R1版,完整的V3版可是沒有喔,相反的臉書是全部開源喔,包括目前最強的405B版本。
怪獸尾巴
@monstertail
Sun, Feb 9, 2025 3:13 AM
Llama已經發展到了3.0,索董的爌肉飯還是沒影。
精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:14 AM
怪獸尾巴
:
精進波羅蜜
@sophist4ever
Sun, Feb 9, 2025 3:17 AM
Sun, Feb 9, 2025 3:17 AM
我是覺得,台灣要是沒有雄心壯志,自己搞一個新的,那就繼續走Llama的路線就好了,真的超精實,覺得臉書的模型在繁體中文上的表現不好,那就在臉書模型的基礎上,進行進一步的發展,商用的事,等真的有人搞出一個月七億流量的商用應用再來想,也還來得及。
股海航行靠剁手
@huashenjohn
Sun, Feb 9, 2025 3:35 AM
壯世代嗎?
真。ikki
@ikkitoushin
Sun, Feb 9, 2025 4:04 AM
不要說破 … 因為他們那票就是這樣發大財的
讓我再想一想~
@thinktwice
Sun, Feb 9, 2025 6:40 AM
台灣在地化的Project TAME基於Llama 3 8B、70B 表現不錯了~
無住生心
@withnoheart
Sun, Feb 9, 2025 7:03 AM
香煎鰈仙喋喋不休
@mahimahimacadamia
Tue, Feb 11, 2025 5:02 AM
翻一下那些喊這種提案最大聲的幾個的背景後,我都笑而不語
香煎鰈仙喋喋不休
@mahimahimacadamia
Tue, Feb 11, 2025 5:03 AM
Tue, Feb 11, 2025 5:06 AM
兩邊政府的錢都想騙,那就加油保重啦
真。ikki
@ikkitoushin
Tue, Feb 11, 2025 5:26 AM
香煎鰈仙喋喋不休
: 他們好像和 寶博士 感情很好 … 已經在找公關了
載入新的回覆
兩邊政府的錢都想騙,那就加油保重啦