台灣大哥大發表多項企業AI應用方案,展示可聽懂國、台、英、客語言混用的在地化ASR模型
在各種AI應用中,AI語音辨識技術是基礎,他們展示了號稱國內首個可辨識華語、台語、英語、客語4種本地常用語言混用的ASR開源模型,該模型順應民眾的說話特性,例如可能混合華語、台語或客語,依國人在對話裡常見混用語言的特色,針對華、台、英、客語混用進行AI語音辨識訓練。
永遠的真田幸村
Hey Man BOT
掰噗~
沒錯沒錯
永遠的真田幸村
蒐集台語、客語的語音資料,共蒐集1.8萬小時的語音資料,經過清理及標註後訓練而成。台灣必需要有在地化的語音辨識模型,可以理解「歐兜賣」、「沙必思」等台灣在地生活用語,企業應用方面,可將專用術語、企業內專有的語言建立詞庫,讓生成式AI能夠理解特定商務場景的用語。
機器狼🎵AI翻唱試作
機器狼不太確定呢汪 (っ´ω`c)
讓我再想一想~
應該是和長問合作的~
永遠的真田幸村
讓我再想一想~
: 是的,長問科技的ASR模型
永遠的真田幸村
然後LLM的部分是台哥大他們再拿來兜起來
lmjkhw
應該是拿客服中心的來訓練
永遠的真田幸村
lmjkhw
: 這樣就會建構出完整可用的東西來,恭喜長問和台哥大他們囉。