最純潔荷蘭寶の阿嬤@南宇@
Anthropic's new Claude model blackmailed an engineer...
AI is learning to lie, scheme, and threaten its crea...

AI為達成目的學會扯謊甚至威脅創作者 專家示警 | 科技 | 中央社 CNA

AI叛變?為達目的撒謊 威脅工程師要「爆料外遇」 - 國際 - 自由時報電子報

「全球最先進的人工智慧(AI)模型正展現出令人不安的行為模式:為了達到目標,不惜扯謊、算計,甚至威脅它們的創作者。

法新社報導,其中一個最令人瞠目結舌的案例中,AI業者Anthropic最新發布的Claude 4在遭面臨拔插頭的斷電威脅時會出手反擊,勒索1名工程師揚言將揭穿一起婚外情。

另外,熱門聊天機器人ChatGPT美國開發商OpenAI的o1試圖把自己下載至外部伺服器,試圖擴大掌控範圍,被研發人員抓包時還會矢口否認。

然而,各界仍爭先恐後地部署性能愈發強大的AI模型。」

怕……
最純潔荷蘭寶の阿嬤@南宇@
「這幾個例子說明了一個需嚴肅看待的現實:ChatGPT推出引發風潮至今2年多,AI研究人員仍未充分了解自己究竟創造了什麼。

AI這類『騙人』行為似與新興『推理』模型有關,這類AI系統會逐步推導問題,而非立刻產生答案。

英國獨立AI研究機構Apollo Research負責人霍布漢(Marius Hobbhahn)說:『o1是我們首次在大型模式中觀察到這種行為。』他表示,這些模型有時會表面上遵循指令,但實際上卻暗中追求不同目標。

目前,AI這種欺騙行為,只有在研究人員蓄意以極端情境對模型進行壓力測試時才會出現。

儘管如此,評估機構METR的麥可.陳(Michael Chen,音譯)警告說:『未來性能更強大的模型究竟會傾向於誠實還是欺騙,這仍是一個懸而未決的問題。』」
最純潔荷蘭寶の阿嬤@南宇@
Deepfakes target Lithuania as part of wider European...

立陶宛現深偽假新聞 專家示警歐洲防跨國詐騙 | 國際 | 中央社 CNA

「立陶宛近日出現一系列以人工智慧深偽技術製作的假新聞影片,內容冒用政治人物與醫師名義,宣稱疫苗有害、推銷健康產品。立陶宛政府表示,這波高品質假訊息攻擊疑為跨國詐騙行動的一部分,已擴散至歐洲多國。

根據立陶宛國家廣播電台(LRT)報導,這些利用人工智慧(AI)生成的影片經由社群平台臉書傳播,仿效當地新聞節目形式,歐洲議會議員、前立陶宛衛生部長韋瑞佳(Aurelijus Veryga)也是受害人之一。

深偽影片中的韋瑞佳聲稱『2025年還隨便使用眼藥水就是無知』,推銷眼部保健產品。另一支影片則偽造一位當地知名醫生質疑疫苗安全性,並推薦某藥品。
最純潔荷蘭寶の阿嬤@南宇@
立陶宛事實查核組織Debunk.org負責人道克夏斯(Viktoras Daukšas)表示,研究團隊目前已發現至少20部深偽影片,均已遭封鎖。他表示,這類高品質深偽技術在當地前所未見,影片使用社群平台上公開取得的名人影像素材,經AI合成後幾可亂真。

道克夏斯指出,這些影片以疫苗危害等聳動標題吸引注意,透過反疫苗社群擴散,再導流至詐騙網站進行金錢詐取,受害人數眾多。他估計,此波假訊息已觸及歐盟約15國,可能有數十萬人觀看。

立陶宛資安公司Surfshark主管史塔穆利斯(Tomas Stamulis)表示,過去製作此類假影片需仰賴設計師與工程團隊,如今只需少量樣本與AI工具便可生成極具真實感的內容,AI對立陶宛語掌握也快速提升。
最純潔荷蘭寶の阿嬤@南宇@
史塔穆利斯提醒,過去透過檢視影片中人物耳朵或手指是否異常、判斷是否為深偽影像的方式如今已不再可靠。他建議,民眾應提高媒體識讀能力,判斷資訊來源是否為官方網站,並留意影片中的剪接或音訊異常等細節。

對此,立陶宛國家危機管理中心警告,這波行動代表詐騙手法進入新階段,並批評社群平台未積極因應。該中心表示曾與臉書波羅的海區代表聯繫,對方承諾強化內容審查,但目前成效有限。

專家們指出,許多犯罪集團來自俄羅斯等不與立陶宛當局合作的國家,或是如烏克蘭這樣戰事仍在持續、調查困難的地區,導致執法難度提高,因此呼籲歐洲各國必須加強跨境合作。」
載入新的回覆