引子
你有沒(méi)有想過(guò)一個(gè)問(wèn)題:
漢字有上萬(wàn)個(gè),電腦鍵盤卻只有幾十個(gè)字母,我們是怎么把“你好”打到屏幕上的?
在這個(gè)人人習(xí)慣打字的時(shí)代,輸入漢字似乎再自然不過(guò)。但其實(shí),漢字從古老的毛筆、印刷術(shù)一路走來(lái),直到成功“住進(jìn)”電腦屏幕,背后經(jīng)歷了無(wú)數(shù)人的努力與技術(shù)的革新。
國(guó)立交通大學(xué)的一套試驗(yàn)漢字鍵盤
漢字輸入法的起點(diǎn):拼音只是后來(lái)者
我們今天常用的拼音輸入法,其實(shí)并不是最早的漢字輸入方式。
在20世紀(jì)80年代電腦剛剛走入中國(guó)時(shí),中文打字是一件“高技術(shù)”活:
最早是字根輸入法,如五筆、鄭碼:根據(jù)漢字結(jié)構(gòu)進(jìn)行編碼輸入;
也有人用筆畫輸入法,比如“橫橫豎撇捺”打出“永”;
拼音輸入法后來(lái)才憑借“易學(xué)好用”走上主流。
而這一切的前提是:電腦首先得能“看懂”漢字。
五筆字根表86+98版
電腦眼中的漢字:不是筆畫,而是“數(shù)字”
西方字母只有幾十個(gè),但漢字有七八萬(wàn)個(gè),如何在計(jì)算機(jī)里儲(chǔ)存和調(diào)動(dòng)?
這就需要一種標(biāo)準(zhǔn)的“編碼”方式——最有代表性的,就是編碼(1981年發(fā)布):
它為中國(guó)最常用的6763個(gè)漢字建立了編號(hào)系統(tǒng);
每一個(gè)漢字都對(duì)應(yīng)兩個(gè)字節(jié)的“數(shù)字代碼”,電腦用這些數(shù)字來(lái)“認(rèn)識(shí)”和“顯示”漢字;
后來(lái)又發(fā)展出了GBK、UTF-8等更廣泛的編碼標(biāo)準(zhǔn)。
一句話:在電腦眼里,‘漢’不是漢,是“0xBA-0xBA”。
簡(jiǎn)體中文編碼表
輸入法的演化史:從專業(yè)到全民
早期輸入法是一種“技術(shù)門檻”,但后來(lái)逐漸變得“全民化”:
五筆輸入法曾在90年代風(fēng)靡,學(xué)習(xí)門檻高但效率極高,受到專業(yè)打字員歡迎;
搜狗拼音的崛起代表了智能輸入法時(shí)代的到來(lái):詞庫(kù)更新快、自動(dòng)聯(lián)想、語(yǔ)境理解;
現(xiàn)在的輸入法還能語(yǔ)音識(shí)別、手寫輸入、AI聯(lián)想,甚至根據(jù)用戶習(xí)慣“學(xué)會(huì)說(shuō)話”。
輸入法界面
不只是打字,它改變了我們說(shuō)話的方式
你是否發(fā)現(xiàn):
打字時(shí)更喜歡用“表情包”和“拼音縮寫”表達(dá)情緒;
某些詞語(yǔ)打多了,腦海里優(yōu)先想到的是“它怎么打”,而不是“它怎么寫”;
語(yǔ)言變得更“口語(yǔ)化”、更短平快。
電腦打字不僅改變了寫字方式,也在悄悄重塑我們的語(yǔ)言習(xí)慣。
老式打印機(jī)
結(jié)語(yǔ)
漢字作為世界上最復(fù)雜的文字之一,能在數(shù)字時(shí)代安然“轉(zhuǎn)生”,靠的不只是拼音輸入法的便利,更是數(shù)十年程序員、語(yǔ)言學(xué)家、產(chǎn)品設(shè)計(jì)者的努力。
今天,每一次我們敲下“你好”,其實(shí)都是一場(chǎng)古老文明與現(xiàn)代技術(shù)的默契合作。



