leee4
@leee4
Sun, Oct 5, 2025 5:01 AM
Sun, Oct 5, 2025 1:04 PM
1
理解AGI | LLM的致命缺陷 | 经验学习范式 | 苦涩的教训 | 真正的泛化 | 持续学习 | 宇宙演化
【人工智能】大语言模型是死路一条 | 强化学习之父Rich Sutton | 理解松鼠才能理解AGI |...
Best Partners TV
@leee4 - 圖靈機 《了不起的亡灵》
@leee4 - 《奧斯佩Oahspe》 奧斯佩預言
@leee4 - 電子競技 徐光宪和高小霞的传奇故事
强化学习之父Rich Sutton
李宏毅 (Hung-yi Lee)
1.7 萬位追蹤者 • 正在追蹤 38 人
Facebook
leee4
@leee4
Sun, Oct 5, 2025 10:55 AM
要回到「主動學習」與「智能體」本質。這也就是所謂的強化學習(Reinforcement Learning, RL)和 agent-based AI 技術架構。
Richard Sutton 的批判,並不只是網路社群上流傳的聳動標題,而是建立在他數十年深耕強化學習(RL)、智能體(agent-based AI)與終身學習領域的理論積澱。他直指,大語言模型(LLM)所展現的強大語言生成能力,本質上仍是「高階模仿」,而非真正的世界理解或自主創新。
精選解讀|強化學習之父 Sutton 為何斷言 LLM 是「走不通」?
leee4
@leee4
Sun, Oct 5, 2025 10:56 AM
强化学习之父Rich Sutton
Google Search
leee4
@leee4
Sun, Oct 5, 2025 11:00 AM
LLM是数学模型,人类是经验系统。虽然微观上都能理解为‘是与否’的二进制,但人往往不会选择概率上的最优解而行动。
人的个体受制于情绪激素,人的群体受制于外界环境,很难用数学表达生物行为。
leee4
@leee4
Sun, Oct 5, 2025 11:32 AM
深度強化式學習
深度強化式學習
元学习(meta-learning)
Google Search
李宏毅
Hung-yi Lee
leee4
@leee4
Sun, Oct 5, 2025 11:44 AM
李宏毅 (Hung-yi Lee)
Facebook
leee4
@leee4
Sun, Oct 5, 2025 11:50 AM
Research
Research
NTU COOL 用戶協議公告:退回至前一版本與相關說明
NTU COOL
leee4
@leee4
Sun, Oct 5, 2025 11:51 AM
NTU COOL 數位教學平台
NTU COOL 數位教學平台
leee4
@leee4
Sun, Oct 5, 2025 11:54 AM
首頁 > 電機成員 > 專任教師
專任教師
國立臺灣大學電機資訊學院
國立臺灣大學 - 電機工程學系
leee4
@leee4
Sun, Oct 5, 2025 12:37 PM
强化学习、持续学习
【人工智能】大语言模型是死路一条 | 强化学习之父Rich Sutton | 理解松鼠才能理解AGI |...
【機器學習 2022】各種奇葩的元學習 (Meta Learning) 用法
Hung-yi Lee
深度強化式學習
RL 強化學習的架構 - Google Search
leee4
@leee4
Sun, Oct 5, 2025 12:38 PM
精選解讀|強化學習之父 Sutton 為何斷言 LLM 是「走不通」?
AI 技術路線分歧背後的產業風暴
精選解讀|強化學習之父 Sutton 為何斷言 LLM 是「走不通」?
Google Search
leee4
@leee4
Sun, Oct 5, 2025 12:43 PM
深度強化式學習
Deep Reinforcement Learning IN ACTION/1st Edition
深度強化式學習
leee4
@leee4
Sun, Oct 5, 2025 12:46 PM
深度強化式學習
Deep Reinforcement Learning IN ACTION/1st Edition
深度強化式學習
leee4
@leee4
Sun, Oct 5, 2025 1:08 PM
Benjamin Libet,
leee4
@leee4
Tue, Oct 7, 2025 12:41 PM
數位貿易學苑
他發現人類意識的秘密後,卻神秘失蹤,墨西哥博士的驚天發現|Missing Neuroscientist ...
載入新的回覆
李宏毅 (Hung-yi Lee)
1.7 萬位追蹤者 • 正在追蹤 38 人
Richard Sutton 的批判,並不只是網路社群上流傳的聳動標題,而是建立在他數十年深耕強化學習(RL)、智能體(agent-based AI)與終身學習領域的理論積澱。他直指,大語言模型(LLM)所展現的強大語言生成能力,本質上仍是「高階模仿」,而非真正的世界理解或自主創新。
Google Search
人的个体受制于情绪激素,人的群体受制于外界环境,很难用数学表达生物行为。
Google Search
李宏毅
Research
NTU COOL 用戶協議公告:退回至前一版本與相關說明
NTU COOL
NTU COOL 數位教學平台
專任教師
國立臺灣大學電機資訊學院
國立臺灣大學 - 電機工程學系
AI 技術路線分歧背後的產業風暴
Deep Reinforcement Learning IN ACTION/1st Edition
Deep Reinforcement Learning IN ACTION/1st Edition