二維資料框
讀嘛讀嘛
書名:中文打字機
作者:墨磊寧(Thomas S. Mullaney)
類型:文化史
讀墨電子書 AP 連結:
中文打字機:機械書寫時代的漢字輸入進化史 - 墨磊寧 | Readmoo 讀墨電子書

活在電腦時代的華文(以下為配合此書書名,改使用「中文」)使用者如我,似乎已然相當習慣透過電腦輸入法打字。
大多數中文輸入法的共通點都是在按下幾個按鍵之後挑取候選字,便能得到自己想要的、正確的字。
但在電腦發明以前呢?在那個還沒有選取視窗的年代,要實現一臺中文打字機似乎只能把數以萬計的漢字全塞進機器中。

在現代化的路上,使用漢字的這項特點成為了中文的「缺陷」,中文在技術發展中被排除,中文打字機的發明也晚了一步。

本書探討了中文打字機的歷史,而除了中文打字機本身的各種嘗試外,還要先從打字機的歷史、更早的印刷術和電報開始說起。
二維資料框
我自己有好些身分都跟中文輸入這個主題脫離不了關係。

當研究助理在整理元代書籍數位化時,因為需要如實呈現鈔本文字,常會要使用 Unicode Extension B 這區的字。

當工程師時常在讀舊檔案時遇到亂碼,更是不能不知 BIG5、CP950、UTF-8 這些編碼。

另外,身兼業餘的語言愛好者,回鶻蒙文和滿文這種直式字母、希伯來文和阿拉伯文等由右書寫至左的閃族語言文字在電腦呈現上的困難也是自己一直覺得麻煩的。

在這樣的過程中,會強烈感受到漢字(及其他跟主流字母撰寫邏輯相異的字母)在電腦時代數位化的艱難。
在這些文字被賦予編碼前,是沒辦法被以文字方式呈現查看的,
而即使編碼了,在弄出統一碼前還是有著各種嘗試,才走到了現在的路。
二維資料框
事實上,目前仍有部分軟體和功能並不支援 Unicode 擴充區,無法正常解讀。
二維資料框
而作為一個對鍵盤有興趣的聽打員,即使並不懂倉頡或大易輸入法,仍會知道這是臺灣人從小用的鍵盤上標記著的符號。
(臺灣鍵盤上常見的四種不同符號分別代表英文、注音、倉頡字碼、大易字碼)

也自然會知道英文鍵盤承襲了打字機時代的發明,例如我們稱為 QWERTY 的這種英文字母配列(即第一排左上前六個字母)其實最初的設定是要讓人「打不快」,常連用的字母打散才不會造成機器卡住,最後沿用到了電腦時代。

像是 Shift 按鍵切換大小寫、像是中國把 Enter 翻譯成「回車」 (Carriage Return) 也都是因襲打字機。

"TYPEWRITER"(打字機)這個詞會用到的所有字母 W E R T Y I P 全部都在 QWERTY 配列的第一行,打字機直到今日依然藏在了鍵盤中。
二維資料框
雖然現在不太使用打字機了,但如今的 QWERTY 鍵盤生態還是很大程度繼承了當年最主流的雷明頓打字機的樣貌:而對中文來說,中文打字機的發明則是電腦輸入法的前哨戰,也是中文圈一次又一次試圖將漢字放進現代發展的歷程之一。

對上述內容有興趣的,可以參考這兩篇文章:
解開鍵盤的身世密碼(上):QWERTY與大易輸入的社會史 - The News Lens 關鍵評論網
解開鍵盤的身世密碼(下):倉頡與注音輸入的文化史 - The News Lens 關鍵評論網
(其中上篇的後段就有淺談到一些中文打字機的歷史)
二維資料框
提到「中文打字機」,大家腦袋是有畫面的嗎?

如果是沒見過真實存在過的中文打字機的人,那麼腦袋第一個想像出的「打字機」畫面,應該是雷明頓的單鍵盤打字機,不過事實上,以英文打字機而言,在雷明頓吃下市場大餅前,市面上是有相當多不同形式的打字機的。

雷明頓打字機長這樣:
奇美博物館-藏品資料

其他的一些打字機包含了:
無按鍵式索引打字機之 Google 搜尋結果
雙索引打字機之 Google 搜尋結果

泰國也曾有雙排的 A Smith Premier Typewriter。
二維資料框
當我們被單鍵盤打字機限制了對打字機的想像,那麼可能會認為中文打字機無法符合打字機的標準。

他們收集了所有的物質與符號資源,對漢字發起無情且全方位的字元圍剿,從技術語言上排擠中文。從那時起,擔負起所有中文打字技術之「不可能性」重責的是漢字,而不是單鍵盤打字基本身形式上的任何侷限。

中文在十九、二十世紀被視為落後,廢除漢字以和西方接軌的討論數見不鮮,然而,或許應該要反過來說,其實是單鍵盤打字機無法符合中文打字機的標準。

作者引了一段胡適的話:「夫打字機為文字而造,非文字為打字機而造者也。以不能作打字機之故,而遂欲廢文字,其愚真出鑿趾適履者之上千萬倍矣。」

後來主流的中文打字機長這樣:
中文打字機-文化部國家文化記憶庫
二維資料框
有關中文打字機的運作方式可以參考兩部影片:
Operating a Double Pigeon Chinese typewriter 双鸽牌中文打字...
Curators on Camera: An iconic Chinese typewriter

不得不說透過影片可以很快了解它的操作原理,書裏面純粹靠文字敘述真的很難理解XDDD
什麼按壓打字桿、活字送到卡字桿、打字桿和金屬回位的,問題是這東西本身就超級顛覆想像的,完全無法透過文字猜到正確做法啊XD
二維資料框
它扛住了標準化西方打字機施加的的壓力。西方打字機製造商發現他們無力迫使中文調整,以便適用於這些外國設備,這點對傳統全球標準的概念形成挑戰。

書中先舉不同類型的打字機為例,還有阿拉伯文和暹羅文(泰文)打字機*,為的是鬆動讀者對腦袋根深柢固的雷明頓單鍵盤打字機的認知,直到很後面才帶出中文打字機的樣貌,不過因為這本書原先設計是西方讀者為主,我想如果是要給漢字圈的人閱讀,那麼,直接點入重點可能比較有助於我們去想像。

所以我先提供中文打字機的實際成品,讓大家腦袋有些畫面,這樣再回頭看發明歷程可能更明白中間的嘗試。
二維資料框
*作者有提到,因為暹羅文的打字機沒辦法容納全部的暹羅字母,所以他們大膽地捨棄掉使用其中兩個字母,後來這兩個字母就真的不再使用,可能提到這點有隱含打字機和文字互相影響,但我實際去檢視(我看不懂泰文,純粹靠 google 翻譯),有可能是這兩個字母在當時本就鮮少使用,後來因為不再區分發音而逐漸被淘汰,或許跟打字機並沒有完全的關係。

應該有一部分的人聽過林語堂也曾發明打字機,但說實在的,就算我知道這件事,我依然不曾去查林語堂發明的明快打字機究竟長什麼樣子,甚至我也是直到看了這本書,才認真地去看各種打字機實際運作的方式,實在是工藝極致,設計得好漂亮,這段先按下後面再提。
二維資料框
如同上面所述,《中文打字機》由史丹福大學歷史系教授墨磊寧所寫,主要也是一本寫給西方人的書,因此裏面費了相當篇幅去解釋一些中文的性質,身為一個中文使用者,有些對我來說是天經地義的事情,可從西方視角來看卻提醒了自己,這些背後都是一門一門的學問。

例如,作者開頭先用 2008 年北京奧運的入場順序來講中文排序(2008 年奧運使用的是簡體字筆畫來作為排序)如何顛覆西方的字母排序法。

當然我們都知道還可以按照注音順序、拼音順序等等,但對跟中文不熟的西方人而言,光是使用筆畫排序,就需要大費筆墨解釋一陣。

因此,西方人幻想中的中文打字機是由幾萬個漢字組成、需要好幾個人一起操作的龐大、笨重機器。
二維資料框
甚至,作者提到 1995 年時,仍有西方論壇的討論者認為中文電腦打字需要用成千上萬個字符操作。

看到這段我對他們的無知感到火大,不過對他們來說,確實是打什麼出現什麼相當直觀(一如他們使用打字機的方式),而不像我們需要 IME(Input Method Editor,即輸入法編輯器),需要透過噗首所述之「輸入—候選—確認」步驟才能打字。

當然有關 IME 的介紹,本書作者也是需要花一大篇來截圖解釋給讀者,但對我們是再日常不過的生活。
二維資料框
當我們進入十九世紀以及字母中心的資訊科技鼎盛時代時,這個時代卻將漢字置於客觀的劣勢之中,就算在這種時局下漢字也從未成為獨特或持久的一道「謎題」。相反地,中文「謎樣」的本質一直存在於旁觀者眼中以及特定的技術語言脈絡下——它從來都不是任何漢字本身固有的特質那麼簡單。

從印刷排字、電報到中文打字機,為了要讓中文字和科技接軌,「常用字」、「拼合主義」、「代碼」是三種策略。

常用字就是只選擇最常使用的字母,將它們放在最容易取得的位置,或是像打字機中捨棄使用頻率較低的罕見字,只保留最重要的漢字。
二維資料框
拼合主義則主要利用各種偏旁(像是形聲字由聲符跟形符組成)把漢字拆成更基本的單元,但這部分會遇到的問題對我們而言自然也是容易想像的:美學上這樣拼湊出來的字或許會看起來不自然。例如蕩字跟湯字的「湯」大小不同,不只是在上面加一個「艹」這麼簡單的事。

至於代碼的部分,使用電報為例可能比較好理解,漢字電報建立了一套「文字—數字」轉換簿,將漢字轉成一套代碼標準;而也有西方發明家嘗試發明全部都是注音的打字機,或許算是代碼的一種,然而注音不像日文假名,本身並不適合拿來進行直接閱讀,是以最後仍然失敗告終。

然而,儘管有這些方式,漢字的現代化還是相當艱難,像是電報使用代碼而不是明碼傳送曾經受到懲罰等等。
二維資料框
順帶一提,「中文拼合」這部分在電腦世界存在專有討論叫作 IDS(Ideographic Description Character,表意文字描述字元),包含了各種漢字組合的關係,有興趣的可以參考:
表意文字描述字元 - 維基百科,自由的百科全書

一樣是因為以前研究鈔本需要看很多不同的資料,有一些我覺得有趣的拆解提供參考如下:
https://github.com/... (這個只收《說文》的字)
字形IDSデータ (日文漢字 IDS)
https://github.com/... (有別於全字庫的拆解,我覺得有些拆得很漂亮)
二維資料框
書中各章節大概就是這樣,從打字機歷史、「常用字、拼合主義、代碼」在各時代的嘗試等等的,帶出不同中文打字機的發明。

這段話可能稍微可以做為濃縮總結:
https://images.plurk.com/2cQOhTxKaSGuIWva5SaZfk.jpg

不過很可惜地是,早年幾個傳教士(謝衛樓)、留美學生們(周厚坤和祁暄)等人的打字機都沒有獲得成功,但還是有趣的嘗試。

謝衛樓的打字機長得相當有趣:
《漢字王國》:一場塑造現代中國的語言革命
(謝衛樓打字機即此文封面)
二維資料框
最後真正流行起來的舒式華文打字機、雙鴿牌中文打字機則是改良(仿造)自日本人發明的萬能打字機,實際操作如上面提供之影片。

打字人員可以依據自己的常用字替換字跟更改順序,並且讓身體去習慣操作,換成現在人比較好懂的例子,可能有點像是ㄅ半傳統注音輸入法的使用者可以記下固定候選字的順序吧。

萬能打字機在中國流行的過程也和日本、中國在戰爭時期的複雜歷史關係有關,畢竟文字是政治宣傳的手段之一。

這段有關萬能打字機流行的過程我自己覺得是作者在描述上有些可惜的地方,畢竟前面花了很多篇幅描述中文打字機的各種測試,但最後日本的萬能打字機就這樣突然地出現,而沒有日本漢字打字機的早期發明歷史(大概就是直接從純假名到漢字這麼地突兀),這點在郭文華教授替本書所寫導讀中也有稍微提到:「這裡作者對日文打字機早期歷史著墨不多,且有所取捨。」
二維資料框
儘管如此,這本書還是從各個面向去討論「中文打字機」發明前後的脈絡,且每段都加上了社會科學方面的論證,例如文字檢索和使用者的關聯等等,甚至連打字員的性別議題討論都囊括在書中,這些有點難寫摘要,有興趣的民眾還是自己去閱讀吧XDD
光寫出上面這些、查相關資料、選定引用段落、確認架構我就已經花了三個小時,直接是看書時間的一半,決定快點寫完結束這一切跟這本書道別XDD
二維資料框
雖然主要客群可能是西方人,透過本書內容去推翻、撼動他們對中文的既有錯誤認知;然而身為中文使用者的我自己讀這本書還是可以看到各種歷史嘗試,算是頗有收穫。
我自己得到最大的啟示是上面寫到的:「從西方視角來看提醒自己,這些我們習以為常的事情背後都是一門一門的學問。」

「墨磊寧提示了一個我一直試圖透過藝術研究進行的課題。這本書不是關於工具本身,而是關於中國書寫文化的特點。」——徐冰,《天書》作者
(《天書》是徐冰的藝術作品,刻意使用一些似是而非的偏旁組合來喚醒觀眾的文字意識。我自己覺得那個天書文字長得有點像西夏文就是了

《天書》介紹:
「最多字的藏品」:徐冰《天書》的魅力 以偽文字顛覆漢字體系【10個香港藝術館之最・8】 - The Cu...
二維資料框
另外寫三個特別想提的點:

一是曾有人拿俄國小說的角色數量之多跟日文打字機的字元做比較,我自己覺得很好笑XD

二是提到了後設距離。

因為中文打字機需要在字盤中選取字,所以打字人員會依據常用詞組頻率來調整漢字位置,在訓練上讓身體去習慣字與字之間的關係,例如跟中國共產黨官方文宣有關者,可能「共、產、黨」這幾個字就會放在一起,這樣看來還真的帶有一點電腦科學中自然語言處理的味道,像是 WordNet 或是計算文字向量距離的 word2vec。

作者自己的寫作計畫是寫了中文打字機之後再寫一本中文電腦,有提到預測性文本的內容,我一開始對於什麼都要跟 AI 扯上關係還滿不以為然的(???),但看到上面這種打字員調整漢字位置的地方還是覺得從這個角度切入文字的距離關係很精妙XD
二維資料框
第三點,也是全書裏面最讓我感到震驚的,是林語堂的明快打字機。

我看它的專利書配上作者描述的文字直接看到哭。

大概就是這麼美。

明快打字機的專利書:https://patentimages.storage.googleapis.com/...

明快打字機原型機後來被丟掉,最後彷彿船過水無痕,然而,雖然無疾而終、雖然弄得林語堂負債,但林語堂為現代輸入法作出的貢獻讓人肅然起敬。

要把字全部拆解成打三個鍵能精準地剛剛好出現八個以下的候選字,而且是要一般人可以理解的拆法,背後該付出多少心力啊!
(拆解字的方式對倉頡、大易、嘸蝦米的使用者來說可能比較好想像)

能夠在打字機設計中仿造出一個類似現在輸入法的候選功能,真的太美了,現在還是光打下這段文字就起雞皮疙瘩。
二維資料框
後續有人按照專利書重新複製了明快打字機,可以參考這個影片:
【何同学】我们做了一个中文打字机...
(中國人製作,介意者勿點)

藝術,完全的藝術。
二維資料框
最後回來提一下讀電子書遇到的一件事。
書中有提到一位十九世紀的學者 Guillaume Pauthier,但他的譯名第一字一直無法顯示,我上網查了一下一般譯作𤔣鐵(有些人的瀏覽工具可能會顯示不出來,總之此字是上爫下叟),所以這個人名不能顯示的問題,就是我前面提到的不支援 Unicode 擴充區的問題(此字編碼 U24523 正是 Unicode Ext-B),所以這條路還有得走呢。
二維資料框
最後補上兩個作者的演講:
比較早期的
A Chinese Typewriter in Silicon Valley
比較近期的
Tom Mullaney: The Chinese Typewriter: A History
二維資料框
也來補補之前的閱讀噗:
@heterogeneous - #閱讀五四三 #作品放大鏡 電子書可以直接跳到註腳再跳回來的功能超讚!...

OK 打這噗打到跳過午餐,看戲都要遲到了,救命XDDDDDDDDDDD
載入新的回覆