DarkAsk
@DarkAsk
Thu, Jul 11, 2019 7:58 AM
Thu, Jul 11, 2019 8:19 AM
29
7
[雜談]AI機械學習挑戰攻克「草假名」。
日本保存著數百萬冊的古典籍、古文書、古紀錄是以「くずし字/崩し字/草假名」所紀錄,為了研究日本的文化、歷史以及過去的災害紀錄等等,必須要解讀其內容,然而這種文字只剩0.01%的專業人士得以閱讀,全國只有數千人。
国立情報学研究所建立了名為「KuroNet」的神經網絡模型,以OCR的方式讀入文字,並辨識轉換為現代文字。目前的閱讀準確率是85%。
另外還開啟了一個計劃,透過其平台,來開發基於機械學習的AI,舉辦「辨識草假名:打開千年歷史的文字文化大門」的全球性競賽,以增強「KuroNet」的辨識率。
外文報導:
「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開...
Google AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発
Tec
新世開發公社
@atarayo
Thu, Jul 11, 2019 7:59 AM
這要是真的能成功就太好了。一堆王八都瞎寫認得超痛苦。
所以我才沒繼續念研究所
DarkAsk
@DarkAsk
Thu, Jul 11, 2019 8:07 AM
Thu, Jul 11, 2019 8:18 AM
新世開發公社
:
你搭時光機回去把大伴家持斃了。
期待以後開Google翻譯就能直接讀譯楔形文字。
新世開發公社
@atarayo
Thu, Jul 11, 2019 9:01 AM
DarkAsk
:
就算念近代文學也是一堆混蛋的手稿根本亂畫一通,連漢字都在鬼畫符的也有,全都斃了
因為是芽 所以沒梗
@yumeme
Mon, Jul 15, 2019 2:48 AM
俄羅斯的手稿筆記需要翻譯
路過的月下騎士
@saintyue
說
Mon, Jul 15, 2019 3:04 AM
手寫輸入要發光發熱了
載入新的回覆
日本保存著數百萬冊的古典籍、古文書、古紀錄是以「くずし字/崩し字/草假名」所紀錄,為了研究日本的文化、歷史以及過去的災害紀錄等等,必須要解讀其內容,然而這種文字只剩0.01%的專業人士得以閱讀,全國只有數千人。
国立情報学研究所建立了名為「KuroNet」的神經網絡模型,以OCR的方式讀入文字,並辨識轉換為現代文字。目前的閱讀準確率是85%。
另外還開啟了一個計劃,透過其平台,來開發基於機械學習的AI,舉辦「辨識草假名:打開千年歷史的文字文化大門」的全球性競賽,以增強「KuroNet」的辨識率。
外文報導:
Tec
所以我才沒繼續念研究所你搭時光機回去把大伴家持斃了。期待以後開Google翻譯就能直接讀譯楔形文字。就算念近代文學也是一堆混蛋的手稿根本亂畫一通,連漢字都在鬼畫符的也有,全都斃了俄羅斯的手稿筆記需要翻譯