p/3hcgivy2ko

@koungho

Tue, Jun 10, 2025 12:02 AM

大型語言模型推理成本低廉

這篇文章提出產生式 AI 的推理運算成本已大幅降低，並以網路搜尋服務作為比較，指出大部分人誤認為大型語言模型運作昂貴。作者以 Google Gemini API、Bing 搜尋 API 與 Brave 搜尋 API 等服務作參照，它們每千次查詢的價格大約在 5 至 35 美金之間；而對於大型語言模型，根據不同模型（例如 Gemma 3 27B、GPT-4.1 nano、Gemini 2.5 Flash 等）的價格資料，每百萬 token 的成本從 0.20 美金到 10 美金不等。考慮到一次查詢大約產生 500 到 1,000 token，部...

Ryan He (@ryanhe)