~龜苓膏~
Facebook
女兒想要查「蛇 大腦」的資料,中文一下去,全部是各種內容農場、簡體字、多頭蛇的假網頁。

引導她先迴避後告訴她,用英文找,會找到資料。

改用「Snake Brain」,第一張就是蛇的生物構造說明圖。後來我們還順勢找到一個Youtube 影片,有解剖蛇的說明,順道用英聽學了四個單字。

.

▎網路上的中文資料品質低劣無比

中國真的是中文世界的毒瘤,為了洗流量什麼都做的狼性。

網友有討論認為可能受我的搜尋偏好影響。(我平常為了fact check,的確會去查詢中共官方文件)

我想說清楚我的查找方式:我直接找「Google 圖片」,因為生物學直接找圖片、影片最直接。
掰噗~
對不起 (p-tears)
~龜苓膏~
但是Google 圖片搜「蛇 大腦」在chrome無痕裡大家應該一樣:kknews、read01、17qq、itw01 佔多數。

容易出現「雙頭蛇」「多頭蛇」「吃自己」…等容易引起小孩興趣的偽科學消息。

.

▎網際網路的「中文內容」指的是中國人的中文內容

抱歉哦,不是台灣人的中文,中國的內容農場甚至會自帶繁體版,所以外國人會直接把中國的繁體內容農場當成中文的一部份。

台灣人寫東西很在意對錯,文章文字網頁數量比中國少太多。

從比例看,「中文內容」指的是「中國的簡體中文內容」+「中國的繁體中文內容」,而且一文多發做 SEO 的狼性在 AI 時代更嚴重。

.

▎餵養 AI 的中文內容產業
~龜苓膏~
知道 AI 的訓練資料是從網路上爬下來訓練的,最近中國出現一個產業 「AISEO」,幫商家接單,利用 AI 生成百倍數量的網站文章,讓中國的 AI 公司爬去訓練,讓 AI 多背幾次,AI 就記得你家的東西了。

日前,朋友上網查清治時期台灣彰化文人 曾作霖 的詩《珠潭浮嶼》,查到一個「中華__網」(我不想幫他增加流量),把詩中的「艋舺」譯為地名。

我看到「中華」開頭的東西很敏感,Whois一查,果然是2008年在 新網 (Xin Net) 註冊的上海公司,做繁中版吸台灣的流量。

該詩中「艋舺」當然是錯的,因為台灣Google知道珠嶼就是清、日治時期的日月潭拉魯島的漢名。去信糾正。
~龜苓膏~
管理員回覆「……此『韻譯』內容是由AI深度思考後撰寫。……」

深個屁,就是中國人用 DeepSeek 批量生成資料在洗爛中文網路資料

.

2020年舊文新發。
網路中文資料超爛,網路自學、AI 自學,請用英文,這品質會好到恨天高。

要找高品質中文內容,書會正常很多很多。

.
火星燒酒鴨Tony大罷免大成功
我確實用谷歌時,會參考圖片做快速篩選
迷妹SANA隨時死掉
中文圈的搜尋品質一直都不是很好,需要用精準的字才比較好搜尋到目標,例如「蛇 大腦 解剖圖」才能找到有用的生物圖片
若夜is夏問蟬鳴踏晚霞
迷妹SANA隨時死掉 : 現在不一定了,因為中國審查制度,很多文章的圖片都會用AI爛造取代真正的的構圖

還是要用英文,甚至加「真實資料」等等關鍵字內容才有辦法安心查詢

已經是責成負擔等級的問題

關鍵字都不再關鍵字
無住生心
(p-goodluck)
九命
https://images.plurk.com/4G1iYZaGBUtItOS1IfAj91.png
個人google圖片結果,順提,google圖片可以限制國家/地區。
https://images.plurk.com/7D9IJ7ZtcsdVc5I2B8hJ5X.png
廚房煉金術
我搜資料也習慣用英文先找(冷門資料除外),用外文找到的資料不止完整度還能找到其他延伸
台灣國Dolphin
載入新的回覆