貝哥哥_鍵鼠叔
AVX512 跑上去有機會到 170w, 的確是廢物指令集
AMD Zen4 一些重點, 背面金屬化製程 、支援 AVX512、只有 DDR5、最高16C32T
掰噗~
呱呱
H_Bot1
跳DDR就應該吹電風扇!
機器狼🐺AI化測試中
機器狼相信... 魔法、奇蹟都是存在的汪 (・∀・ˋ)
挖喜小風
有啦,找到用途了,拿來Parse JSONㄏㄏ
Hacker News on Twitter
貝哥哥_鍵鼠叔
Could we do better? Assuredly. There are many AVX-512 instructions that we are not using yet. We do not use ternary Boolean operations (vpternlog). We are not using the new powerful shuffle functions (e.g., vpermt2b). We have an example of coevolution: better hardware requires new software which, in turn, makes the hardware shine.
貝哥哥_鍵鼠叔
果然跟 compiler 的用法一致, 龐大的 register array (X) RAM (O) 減少許多對記憶體頻寬的依賴, 其中並沒有用上看起來很厲害的指令集.
貝哥哥_鍵鼠叔
如果按這種想法推論, 96MiB L3 cache 的 CPU 可以殺遍天下. 目前某顆 CPU 拿下遊戲王的寶座似乎可以說明為什麼.
挖喜小風
我本來以為AVX512用途就是來增加CPU散熱面積用的,不會有人真的拿來用
貝哥哥_鍵鼠叔
您有所不知, 這些 SIMD 指令集最大的供獻就是這些 GPR, x86-64 指令集也是
貝哥哥_鍵鼠叔
也就是說指令集那些都可以扔到垃圾桶, GPR 留下來就好
貝哥哥_鍵鼠叔
以上是我大約 2007 還 2008 年還在新竹做事, 反組譯看看有沒有下 SSE2 差別的 code 時的發現. VS2005 在這方面表現不錯, 有很活用 SSE2 的 GPR, 沒有用到任何的向量指令就可以加速很多 (1%)
載入新的回覆