中央西門風痕影
ChatGPT Is a Blurry JPEG of the Web - The New Yorker

文章開頭提到一個有趣的案例:德國有建築公司使用全錄(Xerox)影印機,影印工程圖片時,有三個房間的面積標示明明寫得不一樣,「影印」之後卻一模一樣

現在的影印機已經不再使用靜電印刷技術,而是掃描後再列印出來。為了節省空間,該影印機使用了 JBIG2 格式的有損壓縮,會將足夠相似的區域存成一樣的資料

作者表示:有損壓縮不是個問題,但這種「損失」無法被察覺會是個問題。如果損失的狀況只是像較為模糊的 JPEG、低品質 MP3 那種狀況,則是可以被察覺到的

此文以此比喻我們該如何看待 ChatGPT
中央西門風痕影
作者姜峯楠(Ted Chiang)是美國華裔科幻小說作家與技術寫作者。其短篇小說之一《妳一生的預言》(Story of Your Life)是電影《異星入境》(Arrival)的原著小說
機器狼🐺毛裝初心者
機器狼也想去德國看看那著名的古堡和美麗的萊茵河汪 (^ω^)
中央西門風痕影
英文維基百科的 JBIG2 及「全錄」條目內,也提及了此案例:
JBIG2 - Wikipedia
Xerox - Wikipedia

2013 年,德國電腦科學家 David Kriesel 發現:即使關閉 Xerox WorkCentre 7535 的文字辨識功能,掃描出來的結果也會把相似的數字取代,例如表格內的金額 65.40 被掃描之後變成 85.40,並且在其部落格上發表了這個發現
中央西門風痕影
Kriesel 的部落格文章:
Xerox scanners/photocopiers randomly alter numbers i...

裡頭附上的其中一個範例:
https://images.plurk.com/7JXH2jjoDCumLU2RHNvvGc.png
中央西門風痕影
全錄原本回應說此狀況很少發生,而且只會發生在原廠設定被更改之後。但 Kriesel 提出證據,在 normal、higher、high 三種品質模式下(含原廠設定),問題還是可以重現

後來全錄修改了他們的說法,並發布了軟體 patch
中央西門風痕影
回到噗首的文章:

文章的標題說「ChatGPT 是張模糊的,網路的 JPEG 縮影」

作者認為這個比喻可以幫助思考,大型語言模型的適用場景是什麼,例如:能否取代搜尋引擎、適不適合當寫作者的寫作出發點、適不適合用來產生網路內容

他也提醒道:如果越來越多內容農場發布由 AI「整理」過的內容到網路上,漸漸地會使網路本身也變得越來越模糊
中央西門風痕影
INSIDE 創辦人 fOx 於部落格上發表的中文翻譯版本(由 AI 翻譯並加上他本人的一些編輯):
ChatGPT 是網路上的一個模糊 JPEG文件
Tofurry
原來十年前這種專業的影印機就已經是這種掃描壓縮(加工)再印出的機制了嗎?
突然和最近看到的兩個文章聯想在一起
傳真機不能亡:日本辦公室革命受挫 政府數位化再等等 | DQ 地球圖輯隊
AI 模仿筆跡獲美專利,你能分辨這是誰寫的嗎?
百納識無足欲-庫伊努
網路正在逐漸死亡
WK
我很喜歡他這個比喻,之前看到時印象深刻,很厲害
載入新的回覆