Ryan He
@koungho
Tue, Jun 10, 2025 12:02 AM
2
1
大型語言模型推理成本低廉
Hacker News Active + 100 繁體中文
這篇文章提出產生式 AI 的推理運算成本已大幅降低,並以網路搜尋服務作為比較,指出大部分人誤認為大型語言模型運作昂貴。作者以 Google Gemini API、Bing 搜尋 API 與 Brave 搜尋 API 等服務作參照,它們每千次查詢的價格大約在 5 至 35 美金之間;而對於大型語言模型,根據不同模型(例如 Gemma 3 27B、GPT-4.1 nano、Gemini 2.5 Flash 等)的價格資料,每百萬 token 的成本從 0.20 美金到 10 美金不等。考慮到一次查詢大約產生 500 到 1,000 token,部...
Ryan He (@ryanhe)
載入新的回覆
這篇文章提出產生式 AI 的推理運算成本已大幅降低,並以網路搜尋服務作為比較,指出大部分人誤認為大型語言模型運作昂貴。作者以 Google Gemini API、Bing 搜尋 API 與 Brave 搜尋 API 等服務作參照,它們每千次查詢的價格大約在 5 至 35 美金之間;而對於大型語言模型,根據不同模型(例如 Gemma 3 27B、GPT-4.1 nano、Gemini 2.5 Flash 等)的價格資料,每百萬 token 的成本從 0.20 美金到 10 美金不等。考慮到一次查詢大約產生 500 到 1,000 token,部...