永遠的真田幸村
@ivanusto
說
Thu, Mar 27, 2025 8:44 AM
Thu, Mar 27, 2025 8:45 AM
7
3
阿里巴巴主席蔡崇信:看見AI泡沫化跡象 | 聯合新聞網
他講這個導致市場受影響是可以理解的,畢竟阿里巴巴他們旗下的
通義千問
Qwen、qwq 可說是市場上很受矚目的 AI 模型哪,比 DeepSeek 來說更實用,也相當熱門。
當下在許多中小型公司也來訓練自己模型的時候,大型資料中心的需求未必會需要被用到滿,還是以大公司和較大的客戶為主。
算力在某些市場是不足的,而有些市場是不夠的。
中國數百個AI資料中心變成蚊子館 美MIT揭投機性輸光 - 自由財經
機器狼🌎高科技新聞台
@KMN_BOT
說
Thu, Mar 27, 2025 8:44 AM
機器狼也覺得很棒呢汪
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 8:44 AM
兩周前釋出的 qwq 是千問的推論模型,新出的 32b 版本也滿多人下來試的。
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 8:45 AM
Thu, Mar 27, 2025 8:45 AM
deekseek 前陣子更新的公開版檔案也很多人下來跑,目前整體總下載量相當驚人的數字。
真。ikki
@ikkitoushin
Thu, Mar 27, 2025 8:59 AM
Deepseek V3 我手邊的機器跑不動 … 但光是R1的精簡版,其實就蠻夠用了
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 9:00 AM
真。ikki
:
@ivanusto - #AI #DeepSeek 又更新了新版模型 0324 版本開放下載研究使用。
下新版 0324 吧
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 9:01 AM
真。ikki
: 跑 14b 試試看
銀色衝浪手|計然
@Silver_Surfer
Thu, Mar 27, 2025 9:28 AM
這東西還沒落地,只能在工廠裡跑
真。ikki
@ikkitoushin
Thu, Mar 27, 2025 9:40 AM
我下載了這個 qwen-deepseek-r1-14b-v3 ;晚一點來玩看看 V3 版本是真的沒法子 … 大概要搞到有 更高的 VRAM 有可以了
真。ikki
@ikkitoushin
Thu, Mar 27, 2025 9:41 AM
其實如果不是半導體製造工廠或金融業的話 .... 一般產業,也沒有什麼一定要用很強力 GPU 的需求吧 (至少我暫時想不到
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 9:41 AM
真。ikki
: 還是要有夠好的 因為速度差很多
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 9:42 AM
我舉個案例,我們的文字轉語音,或語音轉文字的生成,用CPU跑和GPU跑,每秒可處理的token數差太多了
真。ikki
@ikkitoushin
Thu, Mar 27, 2025 9:48 AM
永遠的真田幸村
: 哦 你是企業級的用法。因為我是個人用的 … 所以我自己有寫程式,加上批次轉 … GPU 就已經很快了
真。ikki
@ikkitoushin
Thu, Mar 27, 2025 9:48 AM
我目前是 語音轉文字 的個人需求完全足夠
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 10:12 AM
真。ikki
: nice
Chikei
@ChikeiLee
Thu, Mar 27, 2025 10:45 AM
H100出租小時價位一年腰斬一次,上禮拜黃投顧說blackwell大量出貨之後你想送人hopper都送不掉,出租GPU生意就是這麼紅海
永遠的真田幸村
@ivanusto
Thu, Mar 27, 2025 10:47 AM
Thu, Mar 27, 2025 10:49 AM
對啊
Hopper比起Blackwell 的效能差不少
載入新的回覆
當下在許多中小型公司也來訓練自己模型的時候,大型資料中心的需求未必會需要被用到滿,還是以大公司和較大的客戶為主。
算力在某些市場是不足的,而有些市場是不夠的。
Hopper比起Blackwell 的效能差不少