Ryan Ho
🔥 Hacker News Active 🔥 台灣繁體中文
Meta 利用 LibGen 盜版書籍訓練旗艦 AI 模型 Llama 3 (
The Unbelievable Scale of AI’s Pirated-Books Problem
(★ 64 分)

Meta 在研發旗艦 AI 模型 Llama 3 期間,因需大量高品質文獻以訓練模型,面臨合法授權龐大資料既昂貴又耗時的兩難抉擇。不少內部溝通記錄顯示,當公司與各家出版商洽商授權事宜時,不僅價格高昂,交付資料的時間也長達數週,令團隊轉而利用 LibGen——一個擁有逾 750 萬本書籍和 8100 萬篇論...

Ryan He (@ryanhe)
載入新的回覆