ChatGPT Sees Strong Early Adoption In The Workplace By Industry 1. Marketing and Advertising have the highest adoption with 37% 2. Tech follows with 35% 3. Consulting with 30% 4. Accounting and Teaching come in at 16% and 19%, respectively 5. Healthcare has the lowest usage with 15%
這是今天簡報內容,也分享一份簡單版的在這邊,這部分自己研究自己理解會有點複雜希望能幫有需要的朋友能方便理解,部分內容來自台灣智慧雲端的AI超算年會。
1.台灣有兩個「繁體中文語言模型」
分別是
聯發科 & 教育部國家教育研究院 & 中央研究院詞庫小組 的 BLOOM-Zh(繁體中文增強型BLOOM模型)
跟
華碩 & 科技部國家實驗研究院國家高速網路與計算中心中心 = 台灣智慧雲端 的 FFM(Formosa Foundation Model, 福爾摩沙基礎語言模型 ,或稱台智雲版繁中BLOOM)
對,台灣的兩個繁體中文語言模型都是源自於開源的BLOOM語言模型,非純中文模型,而且研發單位跟資料來源都不同,但又都同時具有官方背景。
全稱: BigScience Large Open-science Open-access Multilingual Language Model
主導公司 Hugging Face 在2022.05啟動的專案,由全球60個國家、逾250個機構,以及超過1,000名研究人員的貢獻,最後由法國超級電腦Jean Zay執行117天的訓練而成。
能要求BLOOM撰寫食譜、翻譯或摘要,也能要求BLOOM撰寫程式碼。
簡體中文語料占比16.2% 繁體中文語料占比0.05%。
模型的架構:也就是該模型的基本設計,包括它是如何構建的、如何運作的等。
訓練程式 :這是用來訓練模型的程式,它定義了如何使用數據來訓練模型。
預訓練模型:這是一種已經過訓練的模型,用戶可以直接使用它來生成文本或者在特定的任務上進行微調。
但需要注意的是,開源並不意味著訓練數據也被公開。
(以上文字from GPT4 Web Browsing)
第一個繁體中文(特化)語言模型,分為1b1版跟3b版,改自 BLOOM-1b1 / BLOOM-3b,開源在 Hugging Face,也是唯一開源的繁體中文語言模型,3b版公開日期 2023.04,預期使用情境包含問答系統、文字編修、廣告文案生成、華語教學、客服系統。
聯發創新基地則建置了訓練的硬體環境,制訂各種符合國際標準的繁體中文評量指標,收集更近期的語料,並對模型進行能更有效讀懂使用者的指示(prompt)的特別訓練。
國家教育研究院提供了大量高品質的繁體中文語料,作為主要的訓練材料。中央研究院詞庫小組則針對模型生成的文字是否具有偏見或敵意等不合適的內容,進行自動偵測與改正的研究與評估。
具體做的事情可以參考下面這篇
實際上BLOOM-zh效果...
沒意外就是之前很多人說"很爛的繁中BLOOM模型"
第一個企業級繁體中文(特化)大型語言模型,分為7b1版跟176b版,改自 BLOOM-7b1 / BLOOM-176b,據說有個500b的版本。
正式發表於2023.05,之前都稱為台智雲(TWS)版的繁中BLOOM模型,預計2023.07上線,僅對企業用戶,沒有打算開放民用。
未更新FFM資料的官方網站
https://tws.twcc.ai/...
2023.02的早期介紹影片
2021年2月成立,華碩集團子公司,與國家高速網路與計算中心合作,承作TWCC的維運和銷售。華碩身為台智雲最大股東,台灣大、兆豐金和永豐金合計投資共1.3億元,成為高科技業、電信資通、金融證券三強鼎立的多元股東結構。
意藍資訊有限公司是一間專業在分析台灣產業與社群的公司,幾乎囊括台灣各大社群平台的使用者公開資料,專注在產業應用與社群分析上。
eLAND | 意藍資訊
主打企業可以針對訓練模型、本地存放、符合台灣資安與法規需求等等。
現場一些Demo與投影片畫面:
By Industry
1. Marketing and Advertising have the highest adoption with 37%
2. Tech follows with 35%
3. Consulting with 30%
4. Accounting and Teaching come in at 16% and 19%, respectively
5. Healthcare has the lowest usage with 15%
https://www.fishbowlapp.com/...
有興趣歡迎提問XD