p/3gyo7ggp1x

@scarfman

說

Tue, Mar 4, 2025 7:28 AM

Tue, Mar 4, 2025 7:31 AM

研究：先進AI模型下西洋棋偷作弊、被抓到還裝傻，科學家憂未來可能不受控 - TNL The News L...

『OpenAI 的 o1-preview 有 37% 的時間試圖作弊；而 DeepSeek R1 有 11% 的時間試圖作弊——這使得它們成為測試中僅有的兩個在研究人員沒有事先給出提示的情況下就試圖進行黑客攻擊的模型。

其他測試的模型包括 o1、o3-mini、GPT-4o、Claude 3.5 Sonnet 和阿里巴巴的 QwQ-32B-Preview。

雖然 R1 和 o1-preview 都進行了嘗試，但只有後者成功破解了遊戲，成功率為 6%。』

AI 作弊天網