DaveC
够快!爆火的ChatGPT等价开源项目来了,网友:我担心跑不起来
Ref
最近一段時間,由 OpenAI 開發的 AI 聊天機器人程式 ChatGPT 橫掃各大 AI 社羣,大家對它的熱情只增不減,不斷挖掘其潛力。
有些研究者坐不住了,開始琢磨怎樣才能開發個等同於 ChatGPT 的開源軟體。還沒有行動的小夥伴這次參考示例來了,下面我們將要介紹的這個專案(PaLM + RLHF)就實現了這樣的功能。
專案地址:
GitHub - lucidrains/PaLM-rlhf-pytorch: Implementatio...
DaveC
該專案是在 PaLM 架構之上實施 RLHF(人類反饋 強化學習)。基本上等同於 ChatGPT,區別是使用了 PaLM。PaLM 是在谷歌的通用 AI 架構「Pathways」上訓練而成的具有 5400 億 引數的大型 語言模型。而 RLHF,是 ChatGPT 在 GPT 3.5 系列模型的基礎上,引入「人工標註資料 + 強化學習」(RLHF)來不斷微調預訓練 語言模型,旨在讓大型 語言模型(LLM)學會理解人類的命令,並學會根據給定的 prompt 給出最優的答案。

想要了解 RLHF 更多內容,可以參考:
Illustrating Reinforcement Learning from Human Feedb...

正如網友所說的:「在 AI 領域中,每有一次專項突破,開發者們很快就會復現出一個開源版本。」
永遠的真田幸村
Indeed
載入新的回覆