永遠的真田幸村
阿里巴巴主席蔡崇信:看見AI泡沫化跡象 | 聯合新聞網
他講這個導致市場受影響是可以理解的,畢竟阿里巴巴他們旗下的 通義千問 Qwen、qwq 可說是市場上很受矚目的 AI 模型哪,比 DeepSeek 來說更實用,也相當熱門。
當下在許多中小型公司也來訓練自己模型的時候,大型資料中心的需求未必會需要被用到滿,還是以大公司和較大的客戶為主。
算力在某些市場是不足的,而有些市場是不夠的。
中國數百個AI資料中心變成蚊子館 美MIT揭投機性輸光 - 自由財經
機器狼🌎高科技新聞台
機器狼也覺得很棒呢汪
永遠的真田幸村
兩周前釋出的 qwq 是千問的推論模型,新出的 32b 版本也滿多人下來試的。
永遠的真田幸村
deekseek 前陣子更新的公開版檔案也很多人下來跑,目前整體總下載量相當驚人的數字。
真。ikki
Deepseek V3 我手邊的機器跑不動 … 但光是R1的精簡版,其實就蠻夠用了
永遠的真田幸村
真。ikki : 跑 14b 試試看
銀色衝浪手|計然
這東西還沒落地,只能在工廠裡跑
真。ikki
我下載了這個 qwen-deepseek-r1-14b-v3 ;晚一點來玩看看 V3 版本是真的沒法子 … 大概要搞到有 更高的 VRAM 有可以了
真。ikki
其實如果不是半導體製造工廠或金融業的話 .... 一般產業,也沒有什麼一定要用很強力 GPU 的需求吧 (至少我暫時想不到
永遠的真田幸村
真。ikki : 還是要有夠好的 因為速度差很多
永遠的真田幸村
我舉個案例,我們的文字轉語音,或語音轉文字的生成,用CPU跑和GPU跑,每秒可處理的token數差太多了
真。ikki
永遠的真田幸村 : 哦 你是企業級的用法。因為我是個人用的 … 所以我自己有寫程式,加上批次轉 … GPU 就已經很快了
真。ikki
我目前是 語音轉文字 的個人需求完全足夠
永遠的真田幸村
Chikei
H100出租小時價位一年腰斬一次,上禮拜黃投顧說blackwell大量出貨之後你想送人hopper都送不掉,出租GPU生意就是這麼紅海
永遠的真田幸村
對啊
Hopper比起Blackwell 的效能差不少
載入新的回覆