DaveC
許湛然 on Facebook
開源來得太快就像龍捲風

由聯發創新基地實習生 周成康 與我共同完成的 Breeze ASR 25 (內部代號:Twister)語音辨識模型 今天正式釋出!

Breeze ASR 25 採用whisper-large架構,強化中文情境以及中英混用情境,適合用於字幕生成等工作流。

Breeze ASR 25 的訓練資料皆取樣自寬鬆自由軟體授權條款的數據集,中文部分完全採用BreezyVoice產製的合成語音。實驗結果證實,合成語音對於自然語音有不錯的取代效果。

論文:https://arxiv.org/...
模型:
MediaTek-Research/Breeze-ASR-25 · Hugging Face
DaveC
https://images.plurk.com/1UMfMQtEbLjHu6YrvZ7zgg.jpg
載入新的回覆