Ddavid
AI
串接 28 個模型進行平行發送測試
Google Colab
不公開題目的性能測試,避免模型都去學而 overfitting
SEAL leaderboards
類似上述的目標,這個的作法是每個月用新出現的內容來建立新題庫
LiveBench
掰噗~
Hmm....(p-stare)
載入新的回覆