Ryan He
大型語言模型在建構世界模型上的限制
Generative AI’s crippling and widespread failure to ...
大型語言模型(LLM)在建立和維護穩健「世界模型」方面存在根本性缺陷,這項問題甚至比其推理能力的不足更為嚴重。所謂的「世界模型」是指系統用來追蹤世界動態的計算框架,它對人類與動物的認知至關重要,在傳統人工智慧和軟體設計中也一直都是核心概念。然而,LLM 卻試圖在沒有這些明確模型的情況下運作,這導致了許多問題。由於 LLM 是「黑箱」,其中沒有明確的資料結構來儲存關於實體的結構化知識,這表示我們無法得知模型中關於某特定事物的知識儲存在何處。這項限制讓它們在生成內...

Ryan He (@ryanhe)
載入新的回覆