三腳貓型地痞rice_b - p/ojxqv7 - 讀噗

三腳貓型地痞rice_b

@rice_b

Mon, Sep 13, 2021 1:23 AM

1

（做紀錄用，先說我看不懂）這個討論是做ai訓練晶片的新創公司Tenstorrent所辦，請一位研究rl（reinforcement learning）的教授來說明怎麼加快rl
這位教授說，最近幾年不少公司發現rl成熟到可以實用，這要拜兩個新發現所賜，一個是attention，一個是memory，這兩項讓rl突飛猛進，許多公司投入資金來研究rl
我不知道現在nn（神經網路）已經發展到這個地步了

Accelerating Reinforcement Learning

@baipu

想

Mon, Sep 13, 2021 1:24 AM

Hmm....

三腳貓型地痞rice_b

@rice_b

Mon, Sep 13, 2021 1:59 AM

adas系統乍看之下很適合用rl，因為有得分機制，你在遊戲環境中，不要撞車就可以當成得分條件，快速通過十字路口左轉也可以得分，如果撞到車，撞到人，就可以扣分，用分數機制來確認這個算法模型的性能有沒有改善

三腳貓型地痞rice_b

@rice_b

Mon, Sep 13, 2021 2:28 AM

這裡面有一段講得很有趣，主持人他說現在可以用pytorch寫一個簡單的程式，來實驗控制dc馬達（！電動車嗎？還是電風扇？），不用昂貴的商業軟體Matlab做分析

載入新的回覆