Ryan He
@koungho
Wed, May 7, 2025 1:52 AM
1
潛在空間 (latent spaces) 中的口音:人工智慧 (AI) 如何感知英語口音強度
Accents in Latent Spaces: How AI Hears Accent Streng...
在 BoldVoice(一款以 AI (人工智慧) 驅動的口音輔導應用)中,團隊提出「口音指紋嵌入」概念:將英語語音輸入至內部大型語音模型後,獲得 768×12 維的隱向量表示。為瞭解模型如何量化口音強度,團隊以多達千筆講者語音資料構建「潛在空間」,並透過部分最小平方法回歸(PLS 回歸)找出與人工評分高度相關的口音強度方向,接著運用二維 UMAP (Uniform Manifold Approximation and Projection) 維度縮減,將該特徵投影到平...
Ryan He (@ryanhe)
載入新的回覆
在 BoldVoice(一款以 AI (人工智慧) 驅動的口音輔導應用)中,團隊提出「口音指紋嵌入」概念:將英語語音輸入至內部大型語音模型後,獲得 768×12 維的隱向量表示。為瞭解模型如何量化口音強度,團隊以多達千筆講者語音資料構建「潛在空間」,並透過部分最小平方法回歸(PLS 回歸)找出與人工評分高度相關的口音強度方向,接著運用二維 UMAP (Uniform Manifold Approximation and Projection) 維度縮減,將該特徵投影到平...