Chúgiâu
VS2019 沒有測量 CPU cache miss, branch prediction miss 之類的功能,只有陽春的 CPU 使用率。

Windows 沒有像 Linux 有 perf 可以直接用,所以找了 Intel VTune Profiler 來使用並測量,還不錯用。

下三均為查表修改物件欄位。

不超過 cacheline 的 data 放在關聯式容器。
https://images.plurk.com/24SZzHr3H0KMyE61N5O6Pt.png

超過 cacheline 的 data 放在連續記憶體空間。
https://images.plurk.com/29EIrbAvpuKsHBm60tCcbj.png

不超過 cacheline 的 data 放在連續記憶體空間。
https://images.plurk.com/61hExQ2cnyUHVHOa6rIF14.png

下續)
掰噗~
修改好花時間@@
Chúgiâu
資料表放在關聯式容器,不管表有沒有超過一個 cacheline size,結果幾乎一樣。
Chúgiâu
有沒有做 CPU cache friendly 的效能差距十分明顯。
載入新的回覆