p/3gk3x9mh2z

@ivanusto

說

Thu, Nov 21, 2024 2:48 AM

5

1

在各種AI應用中，AI語音辨識技術是基礎，他們展示了號稱國內首個可辨識華語、台語、英語、客語4種本地常用語言混用的ASR開源模型，該模型順應民眾的說話特性，例如可能混合華語、台語或客語，依國人在對話裡常見混用語言的特色，針對華、台、英、客語混用進行AI語音辨識訓練。

@hmystgot

Thu, Nov 21, 2024 2:48 AM

@baipu

說

Thu, Nov 21, 2024 2:48 AM

沒錯沒錯

@ivanusto

Thu, Nov 21, 2024 2:48 AM

蒐集台語、客語的語音資料，共蒐集1.8萬小時的語音資料，經過清理及標註後訓練而成。台灣必需要有在地化的語音辨識模型，可以理解「歐兜賣」、「沙必思」等台灣在地生活用語，企業應用方面，可將專用術語、企業內專有的語言建立詞庫，讓生成式AI能夠理解特定商務場景的用語。

@KMN_BOT

說

Thu, Nov 21, 2024 2:49 AM

機器狼不太確定呢汪 (っ´ω`c)

@thinktwice

Thu, Nov 21, 2024 4:59 AM

應該是和長問合作的～

@ivanusto

Thu, Nov 21, 2024 5:01 AM

@ivanusto

Thu, Nov 21, 2024 5:02 AM

然後LLM的部分是台哥大他們再拿來兜起來

@lmjkhw

Thu, Nov 21, 2024 5:54 AM

應該是拿客服中心的來訓練

@ivanusto

Thu, Nov 21, 2024 5:56 AM

lmjkhw : 這樣就會建構出完整可用的東西來，恭喜長問和台哥大他們囉。