~龜苓膏~
@Turtle56
Thu, May 29, 2025 1:26 AM
128
128
Facebook
女兒想要查「蛇 大腦」的資料,中文一下去,全部是各種內容農場、簡體字、多頭蛇的假網頁。
引導她先迴避後告訴她,用英文找,會找到資料。
改用「Snake Brain」,第一張就是蛇的生物構造說明圖。後來我們還順勢找到一個Youtube 影片,有解剖蛇的說明,順道用英聽學了四個單字。
.
▎網路上的中文資料品質低劣無比
中國真的是中文世界的毒瘤,為了洗流量什麼都做的狼性。
網友有討論認為可能受我的搜尋偏好影響。(我平常為了fact check,的確會去查詢中共官方文件)
我想說清楚我的查找方式:我直接找「Google 圖片」,因為生物學直接找圖片、影片最直接。
掰噗~
@baipu
說
Thu, May 29, 2025 1:26 AM
對不起
~龜苓膏~
@Turtle56
Thu, May 29, 2025 1:26 AM
但是Google 圖片搜「蛇 大腦」在chrome無痕裡大家應該一樣:kknews、read01、17qq、itw01 佔多數。
容易出現「雙頭蛇」「多頭蛇」「吃自己」…等容易引起小孩興趣的偽科學消息。
.
▎網際網路的「中文內容」指的是中國人的中文內容
抱歉哦,不是台灣人的中文,中國的內容農場甚至會自帶繁體版,所以外國人會直接把中國的繁體內容農場當成中文的一部份。
台灣人寫東西很在意對錯,文章文字網頁數量比中國少太多。
從比例看,「中文內容」指的是「中國的簡體中文內容」+「中國的繁體中文內容」,而且一文多發做 SEO 的狼性在 AI 時代更嚴重。
.
▎餵養 AI 的中文內容產業
~龜苓膏~
@Turtle56
Thu, May 29, 2025 1:27 AM
知道 AI 的訓練資料是從網路上爬下來訓練的,最近中國出現一個產業 「AISEO」,幫商家接單,利用 AI 生成百倍數量的網站文章,讓中國的 AI 公司爬去訓練,讓 AI 多背幾次,AI 就記得你家的東西了。
日前,朋友上網查清治時期台灣彰化文人 曾作霖 的詩《珠潭浮嶼》,查到一個「中華__網」(我不想幫他增加流量),把詩中的「艋舺」譯為地名。
我看到「中華」開頭的東西很敏感,Whois一查,果然是2008年在 新網 (Xin Net) 註冊的上海公司,做繁中版吸台灣的流量。
該詩中「艋舺」當然是錯的,因為台灣Google知道珠嶼就是清、日治時期的日月潭拉魯島的漢名。去信糾正。
~龜苓膏~
@Turtle56
Thu, May 29, 2025 1:27 AM
管理員回覆「……此『韻譯』內容是由AI深度思考後撰寫。……」
深個屁,就是中國人用 DeepSeek 批量生成資料在洗爛中文網路資料
.
2020年舊文新發。
網路中文資料超爛,網路自學、AI 自學,請用英文,這品質會好到恨天高。
要找高品質中文內容,書會正常很多很多。
.
火星燒酒鴨Tony大罷免大成功
@tonylin620628
Thu, May 29, 2025 1:59 AM
我確實用谷歌時,會參考圖片做快速篩選
迷妹SANA隨時死掉
@m00534
Thu, May 29, 2025 3:42 AM
中文圈的搜尋品質一直都不是很好,需要用精準的字才比較好搜尋到目標,例如「蛇 大腦 解剖圖」才能找到有用的生物圖片
若夜is夏問蟬鳴踏晚霞
@lanceya
Thu, May 29, 2025 4:08 AM
迷妹SANA隨時死掉
: 現在不一定了,因為中國審查制度,很多文章的圖片都會用AI爛造取代真正的的構圖
還是要用英文,甚至加「真實資料」等等關鍵字內容才有辦法安心查詢
已經是責成負擔等級的問題
關鍵字都不再關鍵字
無住生心
@withnoheart
Thu, May 29, 2025 4:18 AM
九命
@pleasegivemeabluerose
Thu, May 29, 2025 8:39 AM
個人google圖片結果,順提,google圖片可以限制國家/地區。
廚房煉金術
@green1030
Thu, May 29, 2025 12:36 PM
我搜資料也習慣用英文先找(冷門資料除外),用外文找到的資料不止完整度還能找到其他延伸
台灣國Dolphin
@Dolphinchien
Thu, May 29, 2025 12:44 PM
載入新的回覆
引導她先迴避後告訴她,用英文找,會找到資料。
改用「Snake Brain」,第一張就是蛇的生物構造說明圖。後來我們還順勢找到一個Youtube 影片,有解剖蛇的說明,順道用英聽學了四個單字。
.
▎網路上的中文資料品質低劣無比
中國真的是中文世界的毒瘤,為了洗流量什麼都做的狼性。
網友有討論認為可能受我的搜尋偏好影響。(我平常為了fact check,的確會去查詢中共官方文件)
我想說清楚我的查找方式:我直接找「Google 圖片」,因為生物學直接找圖片、影片最直接。
容易出現「雙頭蛇」「多頭蛇」「吃自己」…等容易引起小孩興趣的偽科學消息。
.
▎網際網路的「中文內容」指的是中國人的中文內容
抱歉哦,不是台灣人的中文,中國的內容農場甚至會自帶繁體版,所以外國人會直接把中國的繁體內容農場當成中文的一部份。
台灣人寫東西很在意對錯,文章文字網頁數量比中國少太多。
從比例看,「中文內容」指的是「中國的簡體中文內容」+「中國的繁體中文內容」,而且一文多發做 SEO 的狼性在 AI 時代更嚴重。
.
▎餵養 AI 的中文內容產業
日前,朋友上網查清治時期台灣彰化文人 曾作霖 的詩《珠潭浮嶼》,查到一個「中華__網」(我不想幫他增加流量),把詩中的「艋舺」譯為地名。
我看到「中華」開頭的東西很敏感,Whois一查,果然是2008年在 新網 (Xin Net) 註冊的上海公司,做繁中版吸台灣的流量。
該詩中「艋舺」當然是錯的,因為台灣Google知道珠嶼就是清、日治時期的日月潭拉魯島的漢名。去信糾正。
深個屁,就是中國人用 DeepSeek 批量生成資料在洗爛中文網路資料
.
2020年舊文新發。
網路中文資料超爛,網路自學、AI 自學,請用英文,這品質會好到恨天高。
要找高品質中文內容,書會正常很多很多。
.
還是要用英文,甚至加「真實資料」等等關鍵字內容才有辦法安心查詢
已經是責成負擔等級的問題
關鍵字都不再關鍵字
個人google圖片結果,順提,google圖片可以限制國家/地區。