p/phq02i

個人用WB＠觀察號

@wbsearch404

Mon, Dec 25, 2023 8:06 AM

27

11

【AI亂象】

@sophist4ever - 是說昨天去上AI課時，講師在講大型語言模型的訓練時，痛罵中研院罵了快二十...

嘻嘻誰抱著什麼目的輸入了些什麼資料去訓練現在市面上這些AI，你會知道嗎

【中研院之前釋出一個號稱強化繁體中文能力的大型語言模型，結果被發現竟然被訓練成了對岸的樣子，不時吐出簡體字與對岸用語，甚至說國慶日是十月一日。中研院被罵以後，立刻下架這個模型，還發了一篇聲明切割。

講師說中研院還有臉說這個案子只花了三十萬，明明就是去下載臉書的LLaMa模型，然後直接拿中國那邊的資料集進行訓練，給三萬塊都嫌多了，研究的態度非常草率。出事就推說是個人的研究，然後研究的目的竟然是「將明清人物的生平進行自動化分析，建構自動化的歷史人物、事件、時間、地點等事理圖譜。」講師痛罵人家發展AI是要上太空，中研院發展AI是要撿骨（以上為該講師的個人意見）。】

個人用WB＠觀察號

@wbsearch404

Mon, Dec 25, 2023 8:06 AM

而且以網上目前中文資料來說文字量最大的範本就是中國喔，因為他們人數最多嘛^^