p/3fmtfs64hs

@Turtle56

Sat, Mar 30, 2024 5:15 AM

24

17

唐鳳 Audrey Tang (@digitalminister) on Threads

很多社群平台上，已經看到透過 AI 的留言激化社會對立的情況。

「對齊微調」透過強化學習技術，讓 AI 的回應更加友善。但完全相同的技術，只要把獎懲對調，就可以往相反方向對齊，創造出同樣有說服力，但卻是加深刻板印象、激化對立與仇恨的 AI 系統。

舉例來說，你可能在網路上看到有一篇熱門文章，底下有上千則留言。乍看之下討論非常熱烈，但其實大部分都是同一個 AI 系統合成的不同分身，針對特定的情緒目標進行協同操作，來影響輿論。

掰噗~

@baipu

討厭

Sat, Mar 30, 2024 5:15 AM

太生氣囉

~龜苓膏~

@Turtle56

Sat, Mar 30, 2024 5:15 AM

當所有影像和聲音都可以被輕易竄改的時候，因為從內容難以判斷真偽，我們就要從源頭著手，維護資訊的完整性。

像是數位部建立的「111 政府專屬短碼簡訊平臺」，只有政府機關可以使用，所以能達到只此一家、別無分號的效果。

至於 AI 造成的冒名詐騙問題，只要運用難以偽造的「數位簽章」技術，不但可以節省平臺驗證的時間，而且如果發現刊登的廣告是詐騙，同一個簽章在其他平台的廣告也可以同時下架。

隨著 AI 技術日新月異，我們也會持續推動公民審議，邀請全民一起來參與 AI 發展，拓展 AI 產品與系統的評測機制，一起來發展可信任的 AI 系統。