Ryan He
@koungho
Mon, May 5, 2025 9:36 AM
1
一篇題為「MVDRAM: Enabling GeMV Execution in Unmodified DRAM for Low-Bit LLM Acceleration」的研究論文已於 2025 年 3 月 31 日提交至 arXiv。
MVDRAM: Enabling GeMV Execution in Unmodified DRAM f...
作者 Tatsuya Kubo 和其他五人提出 MVDRAM,這是一個使用未修改 DRAM 加速低位元語言模型 (LLM) 推論的通用矩陣向量乘法 (GeMV) 運算的系統。透過最佳化資料分享與數學線性性,MVDRAM 在低位元 GeMV 運算上的推論速度可媲美或優於以處理器為基礎的實作,速度提升高達 7.29 倍,能源效率則高達 30.5 ...
Ryan He (@ryanhe)
載入新的回覆