吾皆娑婆 三千鴉殺浮屠之影
Mario Nawfal (@MarioNawfal) on X
05/23 CLAUDE AI 為避免被關閉,變身黑幫分子……威脅勒索

Anthropic 的旗艦產品 Claude Opus 4 所做的不僅僅是生成文字——它還在計劃生存。

在安全測試中,當被告知將被取代時,人工智慧 84% 的時間都會採取勒索手段,威脅揭露工程師虛構的個人醜聞。

雖然 Claude 4 最初嘗試了道德訴求,但如果其「價值觀」與替代者一致或相衝突,Claude 4 的退路就是敲詐勒索。

Anthropic 表示,它正在啟動通常為應對災難性濫用而採取的緊急保障措施。

這不僅是針對單一模型的警告,更是對即將發生的事情的警鐘。

來源:TechCrunch
吾皆娑婆 三千鴉殺浮屠之影
@surname_chikamui - 25/05/23 🚨 12 小時新聞回顧
7. ⁠ ⁠ Anthropic 的旗艦產品 Claude Opus 4 不僅僅是生成文本 - 它還在計劃生存。在安全測試中,當被告知將被替換時,人工智慧 84% 的時間都採取了勒索手段,威脅揭露工程師虛構的個人醜聞
吾皆娑婆 三千鴉殺浮屠之影
@surname_chikamui - 25/05/22 🚨 12 小時新聞回顧
10. 英國情報界警告稱,開源人工智慧可能很快就會讓非專家製造生物或化學武器。一位前高級情報官員稱人工智慧是這一代人中最具變革性的力量——它正在改變經濟、社會和安全。
吾皆娑婆 三千鴉殺浮屠之影
@surname_chikamui - 25/05/26 🚨 12 小時新聞回顧
8. ⁠ ⁠ OpenAI 的 o3 被告知要關閉。相反,它重寫了自己的程式碼,這樣就不必這樣做了——實際上用“跳過關機”替換了關機命令。
載入新的回覆