三腳貓型地痞rice_b
(做紀錄用,先說我看不懂)這個討論是做ai訓練晶片的新創公司Tenstorrent所辦,請一位研究rl(reinforcement learning) 的教授來說明怎麼加快rl
這位教授說,最近幾年不少公司發現rl成熟到可以實用,這要拜兩個新發現所賜,一個是attention,一個是memory,這兩項讓rl突飛猛進,許多公司投入資金來研究rl
我不知道現在nn(神經網路)已經發展到這個地步了
Accelerating Reinforcement Learning
掰噗~
Hmm....(p-stare)
三腳貓型地痞rice_b
adas系統乍看之下很適合用rl,因為有得分機制,你在遊戲環境中,不要撞車就可以當成得分條件,快速通過十字路口左轉也可以得分,如果撞到車,撞到人,就可以扣分,用分數機制來確認這個算法模型的性能有沒有改善
三腳貓型地痞rice_b
這裡面有一段講得很有趣,主持人他說現在可以用pytorch寫一個簡單的程式,來實驗控制dc馬達(!電動車嗎?還是電風扇?),不用昂貴的商業軟體Matlab做分析
載入新的回覆