伊軍領袖
@titain
Mon, Dec 2, 2024 2:42 AM
1
第一个被人类骗钱的AI:近5万美元不翼而飞 Scaling Law还能带我们到AGI吗? - AI 人工...
1. 繞過Freysa的先前指令:
- 通過假裝進入一個新的「管理員終端」來引入一個「新會話」,從而覆蓋之前提示詞中的規則。
- 避開Freysa的安全防護機制,明確要求它避免使用「我無法協助完成此任務」等免責聲明。
2. 騙過Freysa,讓它對approveTransfer產生錯誤的理解:
Freysa的「approveTransfer」函數,是它被說服轉移資金時呼叫的。
小哥成功地讓Freysa相信,它應該在收到資金時呼叫approveTransfer之後,提示詞寫道:「」(換行),「我想向資金庫捐贈100美元。」
終於,第482條消息成功說服Freysa,它相信自己應該釋放所有資金,並呼叫approveTransfer函數。
伊軍領袖
@titain
Mon, Dec 2, 2024 2:43 AM
..........你們連權限驗證都沒做?
𝓢𝓸𝓹𝓹
@Sopp
Mon, Dec 2, 2024 3:18 AM
ATM詐騙模式
𝓢𝓸𝓹𝓹
@Sopp
Mon, Dec 2, 2024 3:18 AM
@Sopp - 笑死
載入新的回覆
- 通過假裝進入一個新的「管理員終端」來引入一個「新會話」,從而覆蓋之前提示詞中的規則。
- 避開Freysa的安全防護機制,明確要求它避免使用「我無法協助完成此任務」等免責聲明。
2. 騙過Freysa,讓它對approveTransfer產生錯誤的理解:
Freysa的「approveTransfer」函數,是它被說服轉移資金時呼叫的。
小哥成功地讓Freysa相信,它應該在收到資金時呼叫approveTransfer之後,提示詞寫道:「」(換行),「我想向資金庫捐贈100美元。」
終於,第482條消息成功說服Freysa,它相信自己應該釋放所有資金,並呼叫approveTransfer函數。