Ddavid
@DdavidCh
Tue, Jun 25, 2024 1:03 PM
AI
串接 28 個模型進行平行發送測試
Google Colab
不公開題目的性能測試,避免模型都去學而 overfitting
SEAL leaderboards
類似上述的目標,這個的作法是每個月用新出現的內容來建立新題庫
LiveBench
掰噗~
@baipu
想
Tue, Jun 25, 2024 1:04 PM
Hmm....
載入新的回覆
串接 28 個模型進行平行發送測試
SEAL leaderboards
類似上述的目標,這個的作法是每個月用新出現的內容來建立新題庫
LiveBench