~龜苓膏~
@Turtle56
Sat, Mar 30, 2024 5:15 AM
24
17
唐鳳 Audrey Tang (@digitalminister) on Threads
很多社群平台上,已經看到透過 AI 的留言激化社會對立的情況。
「對齊微調」透過強化學習技術,讓 AI 的回應更加友善。但完全相同的技術,只要把獎懲對調,就可以往相反方向對齊,創造出同樣有說服力,但卻是加深刻板印象、激化對立與仇恨的 AI 系統。
舉例來說,你可能在網路上看到有一篇熱門文章,底下有上千則留言。乍看之下討論非常熱烈,但其實大部分都是同一個 AI 系統合成的不同分身,針對特定的情緒目標進行協同操作,來影響輿論。
掰噗~
@baipu
討厭
Sat, Mar 30, 2024 5:15 AM
太生氣囉
~龜苓膏~
@Turtle56
Sat, Mar 30, 2024 5:15 AM
當所有影像和聲音都可以被輕易竄改的時候,因為從內容難以判斷真偽,我們就要從源頭著手,維護資訊的完整性。
像是數位部建立的「111 政府專屬短碼簡訊平臺」,只有政府機關可以使用,所以能達到只此一家、別無分號的效果。
至於 AI 造成的冒名詐騙問題,只要運用難以偽造的「數位簽章」技術,不但可以節省平臺驗證的時間,而且如果發現刊登的廣告是詐騙,同一個簽章在其他平台的廣告也可以同時下架。
隨著 AI 技術日新月異,我們也會持續推動公民審議,邀請全民一起來參與 AI 發展,拓展 AI 產品與系統的評測機制,一起來發展可信任的 AI 系統。
載入新的回覆
「對齊微調」透過強化學習技術,讓 AI 的回應更加友善。但完全相同的技術,只要把獎懲對調,就可以往相反方向對齊,創造出同樣有說服力,但卻是加深刻板印象、激化對立與仇恨的 AI 系統。
舉例來說,你可能在網路上看到有一篇熱門文章,底下有上千則留言。乍看之下討論非常熱烈,但其實大部分都是同一個 AI 系統合成的不同分身,針對特定的情緒目標進行協同操作,來影響輿論。
像是數位部建立的「111 政府專屬短碼簡訊平臺」,只有政府機關可以使用,所以能達到只此一家、別無分號的效果。
至於 AI 造成的冒名詐騙問題,只要運用難以偽造的「數位簽章」技術,不但可以節省平臺驗證的時間,而且如果發現刊登的廣告是詐騙,同一個簽章在其他平台的廣告也可以同時下架。
隨著 AI 技術日新月異,我們也會持續推動公民審議,邀請全民一起來參與 AI 發展,拓展 AI 產品與系統的評測機制,一起來發展可信任的 AI 系統。