Append.ko
@Append
Fri, Nov 8, 2024 11:26 AM
1
[note] orca的mpi 我之前選用的binding方式顯然不對 development queue 如果只送1job會異常緩慢 進去top會發現他只用single core在工作 所有process全都bind上同一個core 這邊應該要設法做出bind to none
Append.ko
@Append
Fri, Nov 8, 2024 11:58 AM
完全想反了,應該要做出的是bind to core
Append.ko
@Append
Wed, Nov 13, 2024 6:08 AM
欸...結果還是需要bind to none 真奇怪 為什麼之前會卡住...
Append.ko
@Append
Wed, Nov 13, 2024 2:24 PM
整理一下
目前回到 bind-to none 這樣在allocate full node的時候會正確運作
不過很奇妙的是
如果我現在只拿了16core/112core,即使其他沒有被allocate,
他仍然會只用一個core來跑 (?!)
好我沒有證據說他是一個 但從速度上/top上看起來應該是一個或兩個
這讓我覺得 我在這個情況是不是其實有被限制能用哪些core?
也因此在occupy full node的時候自然迴避了這個問題
載入新的回覆
目前回到 bind-to none 這樣在allocate full node的時候會正確運作
不過很奇妙的是
如果我現在只拿了16core/112core,即使其他沒有被allocate,
他仍然會只用一個core來跑 (?!)
好我沒有證據說他是一個 但從速度上/top上看起來應該是一個或兩個
這讓我覺得 我在這個情況是不是其實有被限制能用哪些core?
也因此在occupy full node的時候自然迴避了這個問題