漢字是不是一種好的文字?(10.5節)三大古典文字的基本單位是語素字

10.5 三大古典文字的基本單位是語素字

詞的定義困擾了中國語言學界幾十年,我們嘗試在這裏較細緻地分析其箇中原因。(第一部分至第十部分)

第一部分 詞是不是口語最重要的元素?

今天,中國語言學界常常用“詞”一語以及由詞衍生出來的詞滙來描述語言,例如語詞、詞語、詞根、詞幹、詞綴、詞組、詞序等。這些詞滙中的“詞”,大概都譯自西方語言學界所稱的 word。英語的 word 主要有三種意思:(1)説出來的詞;(2)寫出來的詞;(3)說話。中國語言學界受了 word 前兩種意思的影響,所以中國語言學界所用的“詞”亦有兩種意思:(1)口語中的詞;(2)書面語中的詞。例如:《中國大百科全書.語言文字》說:“條目標題多數是一個詞,例如“語言”、“成語”;一部分是詞組,例如“計算機情報檢索”。”條目標題屬於書面語,所以上述的“詞”和“詞組”應該屬於書面語。因此在中文中,詞是指口語中的詞,還是指書面語中的詞,要由上下文來決定。

由於認識到口語的產生遠早於書面語,以及口語是書面語的根本,所以不少西方語言學者都以為:(1)詞是口語的元素,在文字產生前,詞一早已經於口語中存在;(2)公元七世紀,當英國人懂得用拉丁字母寫其口語時,就自然會把口語中的詞按其元音和輔音讀音逐一拼寫出來。是先有口語中的詞,才產生書面語中的詞。口語中的一組詞是一連串的聲音,不用分隔開;寫成文字時,只須用空間把這個詞組中的詞分隔開便可以。

西方學者對詞的看法,從表面看似乎很有道理。可是,若說文字須用空間把口語中的詞分隔開,那就首先要弄清楚甚麽是詞。在未有文字之前,說話是一連串的聲音,可以一口氣說出來,中間不用停頓。寫成文字時,為甚麽要用空間把字符分隔開呢?

在未有文字之前,大家主要是用說話來溝通。講者一有話要説,就可以隨口說出來,而聽者亦會一聽即明。説話既然一聽即明,所以人們不會刻意去分析説話的組成部分。我們推斷,在未有文字之前,人類雖然不用把說話刻意分析,但在下意識中卻知道各個組成部分的意思,以及它們之間在語法上的關係。當然,他們並沒有“詞”或“語素”的講法。事實上,當獨立創造的三大古典文字──蘇美爾文、古埃及文和古漢文──發展至成熟的階段時,仍沒有任何符號或空間把西方學者所稱的詞分隔開。

在三大古典文字中,一個“字”由一個或若干個字符構成。單一個字符可獨立成字;若一個字由若干個字符構成,則稱為合體字。在蘇美爾文和古漢文中,一個“字”基本上代表一個語素,可以稱為語素字 (morphogram);但在古埃及文中,一個“字”則由一個或若干個語素字組成,代表一個詞。三大古典文字基本上是以語素字為主,原因可能跟下面三點有關。

第一,根據語言學者保守的估計,五萬多年前,遠在三大古典文字產生之前,人類的各個語言都已發展成熟,都已成為高效能的以聲傳意的聽覺符號系統。人們主要是用説話來傳達各種不同的意思。語素是最小的有意義的説話單位,語素可以說是説話的元素。説話時,人們會按照約定成俗的語法規則把語素一個接一個的説出來。有了足夠數量的語素以及一套語法規則,人們就可以較為明確和細緻地表達各種不同的意思。

第二,蘇美爾人、古埃及人和古漢人在聽本族人説話時,相信跟我們今天一樣,會一聽就明白説話的意思。之所以能一聽即明,主要是因為人們都能自然而然地把其母語分析至一個一個基本的有意義的説話單位,即是語素。當蘇美爾人、古埃及人和古漢人嘗試把説話寫下來時,就會有意識地把説話分析成語素,然後用字符按語序把語素逐一寫出來,這便是三大古典文字用字符把說話寫下來的方法。當他們閱讀一段較長的文字時,便要決定應該在何處停頓,即所謂斷句的問題。由於一個字符基本上代表一個語素,所以在一段文字中語素之間的界限尚算清楚。當人們再利用母語來幫助閱讀,便較容易決定在何處停頓,所以總的來説斷句並不構成很大的問題。

第三,蘇美爾人、古埃及人和古漢人都不會把一段文字分成一個一個“詞”,然後用空間或分隔符號把“詞” 分隔開。若說詞是口語最重要的的元素,從三大古典文字把口語寫出來的方法,可以看到這種說法是很難成立的。

第二部分 三大古典文字都是綜合運用義符和音符來書寫語素的文字

現以一塊壓寫於公元前二千年左右(中國的夏朝初年)的小泥板(見下面圖三十九)為例,來看看蘇美爾文為何要分行寫出來。泥板上一共有十五個楔形字,分三行寫出來,行序是由右至左,字序是從上而下。為簡單起見,現只討論頭兩行中的九個楔形字。第一行只有兩個字,最後一個字表示這裏有個停頓;第二行則有七個字,最後一個字亦表示這裏有個停頓。為了清楚顯示這九個字的語序、字形、字音和字義,下面表十把這九個字按語序由左至右列出來。這九個字如果不分兩行寫出來,讀者在閱讀時就要自行決定在哪裏停頓。由於這九個字在泥板上分兩行寫出來,顯示了兩個停頓之處,讀者有了這個斷句上的幫助,在閱讀這九個字時就會變得較為容易。

圖三十九   公元前二千年的蘇美爾楔形文字

從下面表十可以看到,除了第一個楔形字的讀音沒有標示之外,其餘八個楔形字的讀音都是單音節,會較難再細分為兩個有意義的讀音。除了第四個楔形字之外,每一個楔形字似乎都只代表一個語素。第四個楔形字有可能代表由兩個常用語素融合而成的“詞”,一個語素表示代詞‘牠’,另一個語素表示屬有關係‘的’,這兩個語素融合成一個詞,表示 ‘牠的’。這個表示 ‘牠的’的詞只有一個單音節的讀音,蘇美爾人大概不能把這個詞再細分,所以用一個音符來寫出其讀音。第八個楔形字(見下圖)是蘇美爾文的〈食〉字,它是一個合體字,由兩個字符組成的會意字演化而成(見下圖),一個字符表示‘口’,一個字符表示‘碗’,合成一個會意字(見下圖),相當明確地表示‘食’的意思。

蘇美爾楔形〈食〉字

下面表十中的每一個楔形字都可視為一個“字”,跟口語中的語素掛勾,一個“字”基本上代表一個語素。由於字與字之間的界限頗為清楚,蘇美爾人可以把字一個接一個的讀出來。這亦有助蘇美爾人較容易明白文字的内容。

表十 蘇美爾文字的分析

下面圖四十顯示古埃及法老王圖特摩斯三世稱號的碑銘體寫法。圖特摩斯三世戰績顯赫,於公元前 1479 至 1426 年間(中國的商朝)統治整個埃及,其稱號一共有七個詞組,表示七個名字,由左至右排列。稱號中有兩個王名框,框内的字符自成一個詞組;兩個王名框之間有兩個字符,亦自成一個詞組。所以,稱號中這三個詞組是很容易認出來的。其餘四個詞組之間的界限,並沒有上述三個詞組那樣明顯,但由於這四個詞組的寫法常常出現在古埃及文中,古埃及人在見到圖四十中的稱號時,會很容易把稱號中的詞組認出來,然後一個接一個地閱讀,並會在每個詞組之後稍作停頓。

圖四十  法老王圖特摩斯三世稱號的寫法

下面表十一把這七個詞組清楚分隔開來。每一個詞組內的字符,基本上都是按語序把詞組中的語素逐一寫出來,但有時候會有例外。現以詞組 1、2、4、5的寫法為例,來說明古埃及人怎樣用碑銘體字符把古埃及語寫出來。

表十一 法老王圖特摩斯三世稱號的分析

詞組 1 有兩個符號。左邊的符號是旗幡的義符,古埃及人從神廟的旗幡,聯想起神,所以用旗幡代表 {神} 這個詞。 {神} 這個詞在古埃及語中讀 /ncr/,由兩個語素組成,第一個語素屬詞滙語素,緊接其後的語素是表示主格的語法語素,所以代表 {神} 這個詞的旗幡義符就讀 /ncr/。右邊的符號是心和氣管的義符,讀 /nfr/,跟 {良善} 的古埃及語讀音相同或相近,所以假借用作音符,代表 {良善} 這個較為抽象的詞。 {良善} 這個詞同樣由兩個語素組成,第一個語素屬詞滙語素,緊接其後的語素亦是表示主格的語法語素,我們可以説,詞組 1 有兩個“詞字” (logogram)。這兩個字是等高的竪長形,其他詞組的高度要跟它們看齊,讓整行的符號排列整齊。

詞組 2 解作‘兩地之主’,把 {主人}、{土地}  和 {兩} 這三個詞寫出來。上端的符號是籃子的義符,讀 /nb/,跟 {主人}  這個詞的古埃及語讀音相同或相近,於是假借用作音符,代表 {主人} 這個詞。{主人} 這個詞由兩個語素組成,第一個語素屬詞滙語素,緊接其後的語素是表示主格的語法語素。中間的符號是土地的義符,讀 /tɁ/,因為 {土地} 這個詞在古埃及語中讀 /tɁ/。 {土地} 這個詞亦是由兩個語素組成,第一個語素屬詞滙語素,緊接其後的語素是表示屬格的語法語素。 {兩} 的古埃及語讀音是 /wj/。兩塊土地讀 /tɁwj/,表示‘上埃及和下埃及’。古埃及人在這裏並沒有用一個義符或音符來代表 {兩} 這個詞,而是把中間的符號再寫一次,上下排列,表示‘兩地’這個詞組。當籃子的義符和兩塊土地的符號上下放置的時候,整個詞組的結構便相當對稱和容易辨認,而‘兩地之主’的意義亦相當明顯。我們可以説,詞組 2 有兩個“詞字”,一個“字”表示 {主人} 這個詞 ,一個“字”表示 {兩地} 這個詞組 。

詞組 4 有三個符號,放在一個橫置的王名框內。王名框專用來圈著法老王的名字,有保護法老王的含義。左端的符號是太陽的義符,表示‘太陽神’,讀 /rʕ/,因為 {太陽} 這個詞在古埃及語中讀 /rʕ/。{太陽} 這個詞由兩個語素組成,第一個語素屬詞滙語素,緊接其後的語素是表示格的語法語素。中間的符號是棋盤的義符,讀 /mn/,跟古埃及語的動詞 {保持} 同音,所以假借用作音符,代表 {保持} 這個動詞。右端的符號是甲蟲的義符,讀 /xpr/,跟古埃及語的 {存在} 這個詞同音,於是假借用作音符,代表 {存在} 這個詞。整個詞組表示‘願太陽神恆存永固’。這個詞組的語序是 /mn + xpr + rʕ/,若按語序排列,太陽神的符號應該放在詞組的最尾位置,但古埃及人卻把它放在第一位,以表示對太陽神的尊敬。我們可以説,詞組 4 有三個“詞字”。

詞組 5 有兩個符號,左邊的符號是鴨的義符,讀 /sɁ/,跟古埃及語的 {兒子} 這個詞同音,於是假借用作音符,代表 {兒子} 這個詞。{兒子} 這個詞由兩個語素組成,第一個語素屬詞滙語素,緊接其後的語素是表示格的語法語素。右上角的符號是太陽的義符,其詞滙意思跟詞組 4 的一樣,都是‘太陽神’的意思,但語法意思稍有不同。詞組 5 的第二個符號屬生格 (亦可稱為屬格),表示‘太陽神所生的’。詞組5的符號按語序排列,讀 /sɁ + rʕ/,意思是‘太陽神之子’。詞組 5 若跟詞組 4 一樣把太陽的義符放在第一位,整個詞組的意思就會變成‘兒子所生的太陽神’,所以古埃及人不會把太陽的義符放在詞組 5 的第一位。我們可以説,詞組 5 有兩個“詞字”。

詞組 1 左邊的旗幡符號,代表 {神} 這個詞,在古埃及語中讀 /ncr/,屬單數和陽性。如果要表示‘女神’這個詞,會在旗幡符號後面加上表示陰性的饅頭音符。如果要表示‘眾神’這個詞,會在旗幡符號後面加上表示複數的小雞音符。古埃及人書寫古埃及語的動詞時,一般會用音符把其讀音寫出來,古埃及人似乎並不能夠把一個動詞進一步分析為兩個或多個語素。

下面圖四十一中的甲骨文,屬最古老的古漢文。從圖四十一可以看到,甲骨上面的整段文字並沒有任何符號顯示停頓的位置。由於甲骨文是按語序把古漢語中的語素遂一寫出來,一個字基本上代表一個語素,字與字之間的界限很清楚,所以讀者在閱讀文字時,可以利用其口語的知識,來決定停頓的地方。

圖四十一 龜甲上的甲骨文

現以上圖甲骨右上角的五行甲骨文,來談談斷句的問題。這五行甲骨文用今天的漢字可以寫成:

甲申卜殼貞婦好娩嘉王占曰其唯丁娩嘉其唯庚娩引吉

這段文字的意思大概是:甲申日問卜,貞人殼問:婦好快要分娩,會生男嗎?王觀察卜紋後判斷說:如果在丁日分娩,就會生男;如果在庚日分娩,就長久吉利。

古漢人在閱讀這段文字時,憑着其古漢語口語知識,應該會作出以下停頓:

甲申卜   殼貞   婦好娩   嘉   王占曰    其唯丁娩  嘉   其唯庚娩   引吉

語素有音有義,而字代表語素,所以字有形、音、義。現在簡略說説上述 23 個古漢字的形音義。首先說字形。這 23 個字的寫法,與今天的寫法分別頗大,一般人很難辨認。字音方面,三千多年前的讀音和今天的讀音當然很不同,但估計一個漢字只讀一個音節的現象,三千多年前已存在。漢字讀單音節,至今仍保持不變。至於字義方面,很多字的古義和今義基本上相同。字的古今用法或有所不同,但很多字的基本意義卻維持不變。漢字在形、音、義三方面都有演變,但以形和音的演變較大,而義方面的演變則較小,很多字的本義基本上都能保持不變。

上文 9.3.3 節所介紹的中國古文獻,包括西周大盂鼎銘文、馬王堆漢墓中的帛書《老子乙本》和王羲之的《快雪時晴帖》,都沒有使用標點符號來顯示停頓之處。沒有標點符號的幫助,讀者便要學習如何斷句。由於古漢文是語素文字,一個字基本上代表一個語素,字與字之間的界限很清楚,所以總的來説,斷句的問題還是不大。

從三大古典文字可以看到,蘇美爾人、古埃及人和古漢人似乎都嘗試把說話分析至最小的有意義的單位,並按語序用盡可能清楚的符號寫出來。說話中最小的有意義的單位,今天的語文學者稱為語素。生活於幾千年前的古人雖然沒有語素的講法,但他們的文字其實已經做到一個字基本上代表一個語素。蘇美爾文、古埃及文和古漢文都希望能夠把口語中的語素清楚和明確地寫出來,而這三種文字為語素造字時起初都是使用以形表義的方法,即是利用字符的形狀來表示語素的意思。一些語素的意思比較抽象,不容易採用以形表義的造字法,因而產生了假借同音字的方法。但是,借用同音字與借用義近字一樣,都會引起一形多用的問題,即是一個字形用來代表多個語素。為了解決一形多用的問題,便產生了音義兼表的形聲字。形聲字屬合體字。有了形聲的方法,很多語素便能清楚和明確地寫出來。古埃及文和古漢文都充份利用了形聲的方法,但在泥板上壓寫出來的蘇美爾文,卻不容易成功造出形體較為複雜的形聲字,不得不多用同音假借的方法。但如剛才所述,這會引起一形多用的問題,蘇美爾人往往要靠上文下理來決定符號究竟代表哪一個語素。三大古典文字在形聲字的數量上雖有所不同,但都可説是綜合運用義符和音符來書寫語素的文字。

第三部分 腓尼基文是特殊類型的音節文字

現在介紹一段純用音符寫出來的腓尼基文,用以說明西方學者所說的“詞”是如何產生的。腓尼基文源於古埃及文中的所謂單輔音字母。古埃及文有三種音符,其中的單輔音字母是最簡單那種音符,一共有二十四個。西方學者認為,一個單輔音字母代表一個輔音。我們認為這種說法是不對的。現以古埃及文其中一個單輔音字母(饅頭音符,見下圖),來說明這種音符的性質。

饅頭音符這個所謂單輔音字母,其實源自一個表示‘饅頭’的象形符號,古埃及人一見到這個符號,就知道符號是指饅頭,他們叫饅頭做 /ta:/、/ti:/ 或 /tu:/,{饅頭} 這名詞的讀音會因其“格”的不同而有異。{饅頭} 在句子中作主詞用時屬“主格”(如 {這饅頭真好吃}),作賓詞用時屬“賓格” (如 {我喜歡吃饅頭}), 作領有詞用時屬“屬格”(如 {這饅頭的皮很薄})。{饅頭} 這名詞因“格”的不同而讀成 /ta:/、/ti:/ 或 /tu:/,所以代表這名詞的饅頭象形符號自然便有 /ta:/、/ti:/、/tu:/ 這三個讀音。當饅頭象形符號假借用作音符時,自然亦有 /ta:/、/ti:/、/tu:/ 這三個讀音。由於 /ta/ 跟 /ta:/ 、/ti/ 跟 /ti:/、/tu/ 跟 /tu:/ 相比,讀音只是稍短,但韻母相同,所以當饅頭象形符號假借用作音符時,亦可用來表示 /ta/ 、/ti/、/tu/ 這三個短音。對古埃及人來説,饅頭音符有六個“音”,但只有三個韻。饅頭音符所表示的六個音: /ta/、/ti/、/tu/、/ta:/、/ti:/、/tu:/,用現代語音學術語來説,開頭的輔音相同,而結尾的元音則有六個。西方學者認為,饅頭音符代表開頭的輔音 /t/。我們認為,古埃及人不會這樣看待饅頭音符,他們會覺得 /ta/、/ti/、/tu/、/ta:/、/ti:/、/tu:/ 是六個不同的音,每一個音都是一個整體,不會像西方學者般把這些音分析為輔音和元音。

源於古埃及文單輔音字母的腓尼基字母,其實是一種特殊類型的音節符號,而不是西方學者所說的代表單個輔音的字母。腓尼基文一共有22個字母,每個字母都代表八個音節,音節開頭的聲母相同,後面的韻母則不同。現以其中一個字母(見下圖) 為例來説明其音值,它代表 /ba/、/bi/、/bu/、/ba:/、/bi:/、/bu:/、/be:/、/bo:/ 這八個音節。

現存最古老的腓尼基文,是刻寫在阿希拉姆王石棺上的文字。這段刻寫於公元前一千年左右(中國的西周初年)的文字,便是用這種特殊類型的音節符號寫成的,符號見下面表十二。表十二共分四行,每一行中的字符都要按腓尼基文的書寫方向,從右往左讀過去。第一行是用腓尼基字母寫出來的石棺文。第二行是用國際音標把腓尼基字母的聲母讀音標示出來,聲母後面的元音讀音則沒有標示。按西方學者說,這段石棺文一共有 15 個詞,這裏用灰底把這 15 個詞分隔開。第三行把這 15 個詞譯成中文。第四行是用中文把石棺文意譯出來。

表十二 阿希拉姆王石棺文的分析

從上表第一行的石棺文可以看到,腓尼基人只是用字母把石棺文的口語讀法遂個音節寫出來,並按照用口語把石棺文讀出來時的自然停頓處,用斷句符號(見下圖)  分隔開該段口語中的詞組,而不是用該符號分隔開詞組中個別的詞。

腓尼基人在書寫其口語時,相信跟蘇美爾人、古埃及人和古漢人一樣,會嘗試把口語中的語素按語序遂一寫出來。由於口語中的語素是無間斷地、一連串地說出來的,所以寫出來的語素亦沒有任何符號把它們分隔開。由於大家對腓尼基文非常陌生,腓尼基人把語素中的音節一個接一個地寫出來是否容易閱讀是很難判斷的。現在退而求其次,用同樣是字母文字的英文把石棺文在下面無間斷地譯寫出來,讓讀者看看這種寫法是否容易閱讀。

THISSARCOPHAGUSWASMADEBYITTOBALSONOFAHIRAMKINGOFGOBELFORAHIRAMHISFATHERASHISABODEINETERNITY

上面的英譯石棺文若按照腓尼基人的方法去斷句,便會寫成如下所示的句子。相信大家都同意,下面一句讀起來會比上面一句沒有分隔符號的英譯句子較為容易。

THISSARCOPHAGUS|WASMADEBYITTOBAL|SONOFAHIRAM|KINGOFGOBEL|FORAHIRAM|HISFATHER|ASHISABODE|INETERNITY

表十二中的石棺文便是處於用斷句符號分隔開詞組這個文字發展的階段。至於該段腓尼基文是否需要再細分,令文字變得更容易閱讀,那便有待腓尼基人進一步去探索了。

第四部分 最原始的古希臘音段文字

現在介紹由腓尼基音節文字蛻變出來的古希臘音段文字。下面圖四十二中的希臘文,是迄今已發現的最古老希臘字母文字,由右至左刻寫在一個酒瓶的肩上,書寫方向跟腓尼基文一樣。腓尼基字母把語素中的音節逐一寫出來,而古老希臘字母則把語素中的音段 (即元音和輔音) 逐一寫出來。這個酒瓶出土於雅典城外一個叫做雙塔門 (Dipylon) 的地方,酒瓶上的文字估計寫於公元前約 740 年(中國的東周初年)。下圖四十三所顯示的,是從酒瓶肩上抽離出來的古希臘音段文字:

圖四十二  在雙塔門 (Dipylon) 出土的酒瓶

圖四十三   酒瓶肩上的希臘字母文字

酒瓶上的文字一共有 47 個字母。現把這段文字按圖四十三中的希臘字母描繪出來,字母下面是注音和譯文。

表十三 最古老的希臘字母文字

從表十三可以看到,酒瓶頸上的希臘文字把語素中的音段一連串地寫在一起,並沒有使用任何分隔符號,所以不容易分辨出哪個是語素、詞或詞組。如果這段文字譯為英文,而又不用詞組分隔符號,就會寫成如下面所示的一段文字:

英譯句一:

WHOEVERNOWOFALLDANCERSDANCESMOSTNIMBLYSHALLGETTHISVASEASHISPRIZE

英、美人士閱讀這句沒有詞組分隔符號的句子時,應該沒有太大困難,但需要一些時間把句子分拆開。相信古希臘人在閱讀表十三中的酒瓶文字時,亦會覺得有需要把句子細分。古希臘人在閱讀這段酒瓶文字時,估計會根據他們說古希臘語的習慣,在句子中適當的地方稍作停頓。酒瓶文字的英譯句一若用詞組分隔符號把句子切分,就會寫成下面英譯句二。

英譯句二:

WHOEVERNOW | OFALLDANCERS | DANCESMOSTNIMBLY | SHALLGETTHISVASE | ASHISPRIZE

英、美人士在閱讀上面一句時,相信會在詞組分隔符號所示的地方自然而然地稍作停頓。英、美人士會覺得,英譯句二比句一易讀,但仍然會覺得句二的閱讀單位太長。希臘人很有可能經過類似英譯句二的階段,而且亦會覺得詞組的閱讀單位太長,讀起來有點吃力。希臘人繼後自然會想辦法去解決閱讀單位太長的問題。

如果音段文字能夠自然發展,在使用者不斷反覆試驗中,慢慢就會找到一個長短適中的閱讀單位。要找到這個理想長度的閱讀單位,需要相當漫長的時間,並非一朝一夕就能達到。

希臘人是音段文字的先行者,他們切分句子的經驗和成果,已經為所有音段文字奠下基礎。西方學者稱音段文字的理想閱讀單位為 orthographic word。英譯句二的詞組如果以 orthographic word 為單位來細分,寫成下面的英譯句三,閱讀效果就會更理想。

英譯句三:

WHOEVER NOW OF ALL DANCERS DANCES MOST NIMBLY SHALL GET THIS VASE AS HIS PRIZE.

英譯句三的大寫字母進一步發展,演變成英譯句四中的小寫字母,有些字母有上延部(ascenders),有些字母有下延部(descenders),增加了字母形體的變化,令字母形體各異,閱讀效果便更為理想。

英譯句四:

Whoever now of all dancers dances most nimbly shall get this vase as his prize.

熟悉英文的人在閱讀英譯句四時,會很快便把各個字認出來,繼而取得文字的意思。一種音段文字要經過很長時間的發展才能達到這樣的閱讀效果。

英譯句四中的用空間分隔開來的 15 個書寫單位,是英語文字發展到今天為止的產物,這種書寫單位本身亦需要有一種叫法,英國人稱之為 word。word 原先泛指所說的話,英國人覺得書本中用空間分隔開來的書寫單位,既然是把說話寫出來,所以借用 word 來稱呼這種書寫單位,word  的含義於是擴闊了,同時指說話和用空間分隔開來的書寫單位。後來 word  主要用來指英語文字的書寫單位。其實,是先有了用空間分隔開來的書寫單位,然後發覺這些書寫單位要有一個叫法,以便溝通,於是借用了原本指說話的 word  來叫這些書寫單位。

在人類還未有口語之前, 所有事物都沒有任何稱謂。有了口語之後,人類就對所認識到的各種事物分別給予稱謂,以便日常溝通。文字是有了口語很久之後才產生的新事物,同樣需要有一種叫法,以便和其他事物分辨開來。英國人有了 word 這個稱謂,用來指英語文字的書寫單位。word 這個書寫單位是視覺符號,原本只是為了閱讀上的方便而用空間把它們分隔開來。說話是一連串有意義的聲音,基本上是由一連串有意義的語素組成。如果用一連串的音符把一連串的語素寫出來,這樣寫出來的文字就很難把一連串的語素分辨開來。最簡單的解決辦法是用分隔符號或空間把這些語素分隔開。英語文字初創時,已經可以參考拉丁文分詞連寫的做法,所以很早便能夠在實際使用中試驗出哪些語素要連寫在一起、哪些語素要分隔開來,令到讀者更容易取得文字的意思。

人類在未有文字之前,一般無須刻意分析口語。後來有了文字,字符與口語單位掛勾。在原創的古老文字中,一個字符代表一個有意義的口語單位,這是很自然的事。這個口語單位在大多數的情況下是一個語素,很少是一個詞組。一個字符已經是一個有意義的書寫單位,所以字符與字符之間無須用空間分隔開。人類後來發展出表示音節和音段的表音文字,一個字符代表一個音節或一個音段,字符從表義的符號,變成一個表音的符號(即音符)。在原創的語素文字中,一個字基本上代表一個語素,而字和字之間的界限一般是很清楚的。但是,在表音文字中,一個音符一般不能代表一個語素,一個代表語素或詞的字由數目不等的音符構成,所以在表音文字的最原始階段中,字和字之間的界限一般是不清楚的。但字和字之間的界限要清楚,才容易辨認出是哪一個字,然後取得其意思。字和字之間的界限如果不清楚,就不容易把字認出來,閱讀時亦會較為費勁。上文所述的腓尼基石棺文和古希臘酒瓶文字,便能充份顯示雛形的表音文字在這方面的不足之處。

說話時,語素或詞是一連串地說出來的。表音文字把口語寫出來時,最初也是把語素或詞的讀音連寫在一起。在日常生活中,我們在聽一連串地說出來的語素或詞時,好像毫不費勁就明白其意思,為甚麽用音符把同樣的說話一連串地寫出來時,讀者卻要花一番工夫才明白其意思呢?答案相信涉及聽覺和視覺兩種不同媒介的分別。我們的看法是,人類接收聽覺訊號和視覺訊號的機制是有所不同的。一連串的語素或詞說出來時,聽者不用顧慮語素或詞之間的界限問題,在實際環境中會一聽就明對方的意思。但石棺文和酒瓶文字讓我們知道,當代表語素或詞的字由數目不等的音符構成,而這些構成字的音符又是一連串地寫在一起時,字和字之間的界限是不清楚的。所以表音文字要想辦法清楚顯示字的界限,讀者才容易知道所寫是何字。此外,語素或詞最好有一個獨特的字形來表示其讀音。因此,所有表音文字都會朝着下面兩方面去發展:(一)清楚顯示字的界限;(二)音符在表音之餘,最好能構成一個獨特的字形。

表音文字中的音符本身沒有意義,一般要與其他音符組合,才能成為有意義的書面語單位。閱讀的目的是要明白文字的意思,所以首先要認出這些有意義的書寫單位。這些書寫單位要切分成適當的大小才容易辨認,以提高閱讀的效率。英國人稱這些分隔開來的書寫單位為 word。word 可以只代表一個語素,例如 {cat}、{able},也可以代表若干個有密切關係的語素,例如 {cats} ({cat} + {s})、{unable} ({un} + {able})。無論是代表一個或若干個語素,都可說是代表一個詞,例如 {cat}、{cats}、{able}、{unable}。

英語文字分隔 word 的標準,可能首先是按說話的語感,把字母分成一組組,然後看看其閱讀效果。英國人的語感,源自他們對英語的親切認知。這種認知包括他們對英語中各個語素的意思以及語素之間的關係的理解。有了這種理解,就容易把寫出來的字母分成一組一組,這些字母組合是否需要調整,相信視乎閱讀的效果而定。字母的組合經過長時期的反覆試驗,就會漸漸取得共識,達至約定俗成的 word。

word 這個因閱讀需要而產生的書寫單位,在英語中有時候反過來用來指詞這個口語的單位。word 有時指寫出來的詞,有時指説出來的詞。這種做法,在日常生活中並不會引起甚麽問題,但在語言分析上卻要把寫出來的詞和説出來的詞分清楚。很多西方語言學者以為 word 是未有文字之前就早已存在的口語單位,文字只不過是把 word 這個口語單位寫出來。這種看法是本未倒置、倒果為因,因為口語單位的 word 其實是根據切分後的文字而得來的。

word 引致概念混淆的原因,可以從下表看出來:

表十四 英語 word 引致概念混淆的原因

組成英語口語的語詞,在説話中原本沒有分隔開來

用拉丁字母寫成的英語文字,起初亦沒有把英語語詞分隔開來

 用拉丁字母寫成的英語文字,有需要用空間把字母分成一組組,以便閱讀

經反覆試驗後,切分成長短合適的閱讀單位

 這些最適合閱讀的單位,亦同時成為書寫單位

這些書寫單位稱為 word 或 written word,即用字母寫出來的單詞

原本在説話中沒有分隔開來的語詞,按 written word 的大小來切分

 按 written word 切分出來的口語單位,亦叫做 word 或 spoken word

word 既指寫出來的單詞 (written word),又指説出來的單詞 (spoken word)

説出來的單詞原本是源於寫出來的單詞,

但學者一般卻認為寫出來的單詞是源於説出來的單詞

上文所述的石棺文和酒瓶文字這兩種表音文字,在創造文字時,跟三大古典文字一樣,都是嘗試把說話中最小的有意義單位寫出來,但表音文字會遇到字的界限不夠清晰的問題。三大古典文字主要是使用象形、假借和形聲這三種方法所造出的字符,把說話中這些有意義的單位寫出來,基本上都能做到一個字符代表一個語素,字與字之間的界限頗為清楚,所以總的來説不難把字辨認出來。但如上文所述,石棺文和酒瓶文字這兩種表音文字讓我們知道,當代表語素或詞的字由數目不等的音符構成,而這些構成字的音符又是一連串地寫在一起時,字和字之間的界限是不清楚的。所以表音文字要想辦法清楚顯示字的界限,讀者才容易知道所寫是何字。為此,表音文字首先把音符按語素或詞的大小分成一組一組,令到一組音符代表一個語素或詞,以方便讀者較容易看到語素或詞的意思。所以在英語文字中,一個代表詞的字把一個或若干個語素寫出來,英國人稱之為 word,而 word 與 word 之間要用空間分隔開來,以便閱讀。詞 (word) 這個觀念便是這樣產生的。用拉丁字母書寫英語自然有需要分詞連寫,分詞連寫可以說是英語文字自然發展出來的產物。

英語語詞的寫法,在十七世紀中葉已基本穩定下來,到了十八世紀中葉就幾乎穩定不變。酒瓶文字的英譯句子:Whoever now of all dancers dances most nimbly shall get this vase as his prize.,是英語詞經過長時期演變後所達至的標準寫法。在演變期間,得找出一種理想的拼法,把詞的讀音寫出來;此外還要決定哪些語素要連寫在一起,以提高閱讀的效益。

第五部分 英語詞是由一個或若干個語素構成

酒瓶文字的英譯句子一共有十五個詞,其中有四個詞是由兩個或多個語素構成,而另外的十一個詞則是由一個語素構成。由兩個或多個語素構成的四個詞是:{Whoever}、{dancers}、{dances}、{nimbly}。這四個詞的語素組成部分是:{Who} + {ever}、{dance} + {er} + {s}、{dance} + {s}、{nimble} + {ly}。現在談談為甚麽這四個詞中的語素會連寫在一起。

在今天的英文中,whoever 和 who ever 有不同的意思和用法。例如在以下句子中:Whoever runs the 100-metre race in less than 9.58 seconds will set a new world record. ,Whoever 便不能分開寫成 Who ever,因為 who ever在詞類、用法和意思上,跟 whoever 都有所不同。英語人士一看上面句子便知道句首的Whoever …在意思和用法上都等同 Anyone who …,亦很快便明白句子的大意是‘誰不用 9.58 秒就跑完一百公尺,誰就會締造一個新的世界紀錄’。至於 who ever 的意思和用法,可參考以下的句子:Jim Hines was the first man who ever ran the 100-metre race in less than 10 seconds.。句子的大意是‘在所有曾經在十秒內跑完一百公尺的人當中,Jim Hines 是第一個’。在句子中,who 是關係代詞,指剛剛提及的 man;ever 是‘曾經’的意思。在whoever 的寫法演變出來之前,whoever 只能寫成 who ever, 那時候,who ever 的意思便只能靠上下文來弄清楚。

在今天的英文中,whoever 主要有兩種不同的意思。如上文所述,一種意思是 anyone who ;另一種意思是 no matter who。所以 whoever 並不僅是由 who 和 ever 這兩個字的意思合併而成。當人們有需要用英語表達 anyone who 和 no matter who 的意思時,就自然產生了 whoever 的說法和寫法。ever 的基本意思是‘曾經’,在 who、 what、when、where、how 後面使用時,漸漸衍生了‘任何一(個/樣/次/處/種’或‘無論是’的意思,因而產生了 whatever、whenever、wherever、however 等的說法和寫法。

說話時,如果想強調疑問詞 who、what、when、where、how 的意思,可以在後面加 ever。以 who 為例,若在後面加 ever,就有 ‘究竟是誰’的意思,説成 /hu:‘evər/,説話者為了強調 who ,會把緊跟其後的 ever 中的 ev- 讀得重一些,表示詫異、不屑等意思。換句話説,在英語的演變過程中,在 who 後面使用的 ever,已產生了‘任何一個’、‘無論是’和‘究竟是’的衍生義。順帶一提,在英語中,若想強調 who,亦可以說成 who on earth。

現在談談 /hu:‘evər/ ‘究竟是誰’的寫法。有些人會把 who 和 ever 連寫在一起,如下面一句:Whoever told you such a ridiculous idea? (Macmillan Dictionary);但是,有些人認為這裏的 Whoever 分開寫成 Who ever 才合符規範,如下面一句:Who ever heard of such a silly idea? (Eckersley)。這兩種寫法各有其優點。在第一句中,who 和 ever 連寫在一起,清楚表示不是這兩個詞通常的意思,而是一個強調 who 的詞。但如上文所述,whoever 已經有 anyone who 和 no matter who兩種意思。如果把who 和 ever 連寫在一起來強調 who,那就多添了一種意思,whoever 究竟是哪一種意思,要靠上下文來分辨。在第二句中,who 和 ever 分開來寫,避免跟 whoever 的兩種主要意思混淆,但who ever 這種寫法卻又跟這兩個詞的通常意思‘有誰曾經’難以分辨開來,要靠上下文來分辨。

綜合上文所述,在英語書面語中,若想強調 who,有人把 who 和 ever 連寫成一個詞,亦有人分開寫成兩個詞。由此可見,所謂“詞”(word),並非在標準書面語產生之前便以經存在,而是由書面語決定是一個詞還是兩個詞。至於是一個詞還是兩個詞的寫法最終會成為主流,那就要看哪一種寫法會被大多數人接受。

今天,英文用 blackboard 一詞來指課室中的黑板,這個詞相信最初是按 black 和 board 的字面意思分開寫成 black board 兩個詞的。後來產生了 blackboard 的寫法, 和 black board 分工,於是 blackboard 專用來指課室中的黑板,而 black board 則泛指黑色的板。隨着社會的發展,課室中一些黑板被綠色的板替換,但這些綠色的板仍可沿用 blackboard 這舊稱,雖然亦有人叫這些板做 greenboard 或 chalkboard。

現在談談 {dancers} 這個複數名詞的寫法。{dancers} 由 {dance} + {er} + {s} 三個語素構成,動詞 {dance} 加後綴 {er}, 構成一個單數名詞 {dancer},再在其後加上表示複數的語法語素 {s}。在英語中,很多動詞的後面可以加上後綴 {er},用來指與動詞有關的人或物;寫成文字時,動詞和後綴 {er} 會連寫在一起,構成一個單數名詞,例子多不勝數,如:teacher、writer、hunter、singer、ruler、cutter、duster、eraser。這些詞由兩個語素組成,開頭的語素屬於動詞的根本形式,收尾的語素表示人或物,兩者的關係相當密切,連寫在一起時,兩個語素的意思都一目了然,所以在英語文字中,動詞加 {er} 約定成俗地連寫在一起,成為英語拼寫的一條定律。至於單數名詞加複數語素 {s} ,則是英語構成複數名詞的一條很基本的方式。上述的單數名詞 teacher、writer… 若在後面加複數語素 {s},在英語文字中就會連寫成:teachers、writers、hunters、singers、rulers、cutters、dusters、erasers, 三個語素連寫在一起,各自的面目仍能保持着,整個字的意思亦很清楚。因此,單數名詞加複數語素 {s} 約定成俗地連寫在一起,成為英語拼寫的另一條定律。由上面兩條拼寫定律亦可見到分詞連寫的好處。

現在接着談 {dances} 的寫法。{dances} 可以是複數名詞,由單數名詞 {dance} 和表示複數的 {s} 組成,但從酒瓶文字英譯句的上下文可以得知,這裏的 {dances} 其實是由動詞 {dance} 和表示‘現在時’和‘主語屬第三身單數’的 {s} 組成,在文字中連寫成 dances。動詞 {dance} 在英語文字中的寫法只有四種:dance、dances、dancing、danced。dance 由一個動詞的詞滙語素構成,而 dances、dancing 和 danced 則都是把一個動詞的詞滙語素和一個動詞的語法語素連寫而成。dance 是動詞的根本形式,屬詞滙語素;dances 是動詞的詞滙語素 dance- 加表示‘現在時’和‘主語屬第三身單數’的語法語素 -s;dancing 是動詞的現在分詞,由動詞的詞滙語素 dance- 和表示‘現在分詞’的語法語素 -ing 組成;danced 這種寫法是由詞滙語素 dance- 和語法語素 -ed 組成,表示‘過去時’或‘過去分詞’。動詞的詞滙語素和語法語素連寫在一起,各自的面目仍能保持着,整個字的意思亦很清楚。因此,動詞跟名詞一樣,詞滙語素和語法語素約定成俗地連寫在一起,是英語拼寫的一條定律。

有些英語動詞卻有五種寫法,例如:give、gives、giving、gave、given。give、gives、giving 這三種寫法跟 dance、dances、dancing 一樣,但 gave、given 的寫法卻跟 danced 不一樣。gave 是動詞 give 的過去時,而 given 是動詞 give 的過去分詞,這兩種寫法分別把 give 的過去時和過去分詞的口語講法拼寫出來。讀者一見到 give、gives、giving、gave、given,就知道這五個字的詞滙語素是 give,亦知道它們各自的語法語素。對讀者來說,這些字的意思和用法都很清楚。

最後談談為甚麽 {nimble} + {ly} 會連寫在一起。在英語中,構成副詞最普遍的方法是在形容詞之後加上後綴 {ly},在書面語中會約定成俗地連寫在一起,這是英語拼寫另一條定律。例子不勝枚舉,如:pure + ly → purely;sincere + ly → sincerely;shy + ly → shyly;simple + ly → simply;idle + ly → idly;terrible + ly → terribly;happy + ly → happily;busy + ly → busily;lucky + ly → luckily。在這些字中,形容詞和後綴連寫後,這兩種語素的面目仍能清晰可辨,整個字的詞類和意思亦相當清楚。

在英語中,名詞之後加上後綴 {ly},可以構成形容詞,例子亦頗多,如:friend + ly → friendly;father + ly → fatherly;time + ly → timely;home + ly → homely。一個以 -ly 結尾的英文字,雖然大都是副詞,但有時會是形容詞。

在英語文字中,很多字尾部的寫法,顯示了這些字所屬的詞類,這有助讀者更容易掌握句子的結構,提高閱讀的效益。現在下面隨意舉一些例子,列於下面表十五,供讀者參考:

表十五 英語用後綴表示詞類的方法

動詞加後綴 -ment 構成名詞動詞加後綴 -ance 構成名詞形容詞或名詞加後綴 -ize 構成動詞形容詞加後綴 -en 構成動詞動詞加後綴 -able 構成形容詞
payment statement development governmentallowance importance appearance attendancemodernize socialize materialize magnetizeshorten broaden widen deepeneatable admirable curable laughable

如上文所述,酒瓶文字的英譯句子: Whoever now of all dancers dances most nimbly shall get this vase as his prize.,一共有十五個詞,其中四個連寫成的詞(以斜體顯示)已經討論過,現在討論其餘十一個詞。這十一個詞屬常用詞,除了 his 之外 [1],都只有一個語素,用二至五個字母寫出其讀音,在句子中可以單獨地寫出來,與其他詞分隔開,字形都很短,亦頗為獨特,很容易認出來。例如句子中的主要動詞 get 和單數名詞 vase 、 prize 便是以大家最熟悉的根本形式出現;此外,now、of、all、most、shall、this、as 和 his 都是最常用的詞。英文讀寫能力强的人一見到這些詞,就很清楚其本身的意思和用法。這些詞的另一好處是可以靈活地跟其他詞搭配。


[1]  his ‘他的’可以看成是由代名詞 he ‘他’及其屬格‘的’融合而成。

第六部分 英語文字是怎樣演化出詞這個書寫單位的?

酒瓶文字譯成英文時,如果像古希臘原文那樣把語素連寫在一起,便會寫成下面句子 (1)(古希臘原文是用大寫字母寫出來,英譯句子理應亦要用大寫字母,但因為讀者最慣常看到的是小寫字母,這裏一律用小寫字母):

(1) whoevernowofalldancersdancesmostnimblyshallgetthisvaseashisprize

句子這樣寫出來,其閱讀效果明顯不理想。英語的語素由一個或若干個音段(即元音和輔音)構成,音段的數目多寡不一,從上面的句子,不容易看到每一個語素的界限,更遑論看出各個語素的意思。英語文字是怎樣解決這個問題的?

用拉丁字母拼寫英語的歷史,是從公元七世紀初開始的(中國的隋朝)。公元 597 年,教宗額我略一世 (Pope Gregory the Great) 命奧古斯丁 (Augustine) 率領四十人從羅馬往英格蘭傳揚福音。傳教團在英格蘭東南部肯特郡 (Kent) 登陸後,便開始教當地人讀拉丁文譯成的聖經,肯特郡不少人皈依天主教,包括其國王埃塞爾伯特 (Æðelberht)。傳教團並且協助埃塞爾伯特訂立法律,在 616 年他駕崩之前,便已制定了第一條用英語寫成的法令。可惜這些制定於公元七世紀的英語法令,只能見於十二世紀寫成的手抄本。由於原文失傳,沒有人知道七世紀時英語究竟是如何拼寫的。

公元六世紀末,當羅馬天主教士在英國東南部傳福音時,愛爾蘭天主教傳教士則在英格蘭北部建立修道院和學校,大力弘揚基督教,教當地青少年拉丁文。學習拉丁文的英國人越來越多,那些精通拉丁文的英國人,便是把拉丁文翻譯成古英文的最佳人選。在英語文字發展史上,愛爾蘭天主教傳教士亦扮演了一個重要的角色。

公元十世紀,用拉丁字母拼寫的英語文字經過三百年的發展,產生了一個以西部撒克遜文為基礎的、寫法比較統一的古英語文字系統。埃爾弗里克修士 (Abbot Ælfric) 是當時最著名的古英語散文作家,他於公元 990 年左右(中國的北宋初年)把《主禱文》從拉丁文譯成古英文,下面圖四十四是他一位助手的手抄本 [1]。從這個手抄本,可以看到十世紀時英語是如何拼寫的。

圖四十四  《主禱文》古英文十世紀手抄本

[1] 該手抄本現藏於劍橋大學圖書館,手抄本的圖片摘自 D.G.Scragg, A History of English Spelling, Manchester University Press, 1974, Plate 1。

圖四十四中的《主禱文》古英文譯文,由上面數起第九行開始。下面圖四十五是該《主禱文》的第一句。從這一句譯文的拼寫法可以看到,古英文並不是分詞連寫的。

四十五  主禱文》第一句

《主禱文》的中文譯本有很多種,其中一個簡易的版本把第一句譯成:我們在天上的父,願人都尊你的名為聖。從圖四十五可以看到,原文句子所用的手寫字母頗為古老。如果用較近代的字母來寫,第一句便會寫成:〈Þu urefæder • Þeeart onheofonum• Sy Þin namagehalgod • 〉。如果依照這種寫法直譯成近代英語文字,便會寫成:〈Thou ourfather • thatart inheaven • be thy namehallowed • 〉。原文第一句有三個小圓點,把句子分為三段,每個點號顯示句子唸出來時的自然停頓處。

下面表十六是《主禱文》首句第一段的拼寫分析。左欄顯示原文及其拼寫分析;右欄是備註,指出左欄中的原文及其拼寫分析要注意的地方。

表十六《主禱文》首句第一段的拼寫分析


下面表十七是《主禱文》首句第二段的拼寫分析,左欄和右欄的作用已介紹過,不贅。

表十七  《主禱文》首句第二段的拼寫分析

下面表十八是《主禱文》首句第三段的拼寫分析。

十八  主禱文》首句第三段的拼寫分析

從《主禱文》十世紀英譯本的第一句可以看到,其手寫字母的形狀除了跟今天的字母有些分別之外,它用空間分隔開來的書寫單位經常是代表詞組的。圖四十四中的《主禱文》譯自十世紀的拉丁文版本。十世紀的拉丁文其實已經歷了一千三百多年的發展,而十世紀的英文則只有三百多年的歷史。拉丁文和英文都是音段文字,都要決定如何分詞連寫,以便閱讀。公元十世紀,當英國人把拉丁文譯成英文時,他們自然會參考拉丁文在分詞連寫上的做法。從圖四十五中《主禱文》的第一句可以看到,那些用空間分隔開來的書寫單位往往代表一個詞組,而不是一個詞,例如:urefæder、Þeeart、onheofonum、namehallowed。

《主禱文》的英譯本發展至1200年左右(中國的南宋末年),有西部撒克遜地區版本把第一句譯成下圖中的寫法 [1]

[1] The manuscript is now in the Bodleian Library. The picture of the manuscript is excerpted from DGScragg , A History of English Spelling , Manchester University Press, 1974, Figure 1.

這一句是從第一行最後一個字開始的,直至第三行第一個字。為了方便讀者閱讀,現把這句中的字母轉寫成較為近代的字母:〈Fader ure Þu Þe ert on heofene. Sye Þin name ʒe hal ged.〉。從這句《主禱文》可以看到,除了最後的三個字 ʒe hal ged,1200年左右寫成的古英文,在分詞連寫方面已經很接近現代英文。ʒe hal ged 這三個字,今天會寫成 hallowed 一個字。

《主禱文》的英譯本發展至 1400 年左右(中國的明朝初年),有版本把第一句譯成下圖中的寫法 [1]

圖四十七 1400 年英譯《主禱文》第一句

[1] 該手抄本現藏於大英博物館,手抄本的圖片摘自 D.G.Scragg, A History of English Spelling, Manchester University Press, 1974, Plate 5。

這一句是從第一行第四個字開始的,直至第三行第一個字。現把這句中的字母轉寫成較為近代的字母:〈Oure fadir Þat art ĩ heuenys: halewid be Þi name.〉。從這句《主禱文》可以看到,1400 年左右寫成的古英文,在分詞連寫方面已經很接近現代英文。


第七部分 從 1477 年印製的第一份英文廣告到富蘭克林於 1775 年寫的信

1476 年,英國人威廉.卡克斯頓 (William Caxton) 把歐洲活字印刷術引入英格蘭。他在倫敦西敏寺租用一角作書店用,售賣他的印刷品。1477年,他出版了一些宗教儀式須知的書籍,供神職人員用,並印製了下面所示的單張,宣傳這些印刷品又好又便宜。

圖四十八 (a) 1477 年印製的第一份英文廣告

從上圖單張可以看到,當時的拉丁字母印刷體,跟今天常見的印刷體如 Times Roman 或多或少有別。為了方便閱讀,現把宣傳單張所用的印刷體,轉換成下面的現代印刷體:

圖四十八 (b) 轉換為現代印刷體的第一份英文廣告

現在用英文的現代拼寫法把第一份英文廣告中的詞寫出來,讓讀者看看十五世紀和現代的英文拼寫法有甚麽分別。

圖四十八 (c) 用現代拼寫法寫出來的第一份英文廣告

如果把圖四十八 (b) 和 (c) 相比較,便會發覺以下兩點:第一,在分詞連寫方面,早在十五世紀下半葉,當代的英文便已找到了長短適中、最適合閱讀的書寫單位,這個書寫單位的大小,可以説跟今天的英文基本上是一樣的,唯一的例外是圖四十八 (b) 第五行中的 in to,in to 進一步發展,會連寫成 into,變得更容易閱讀。

第二,關於詞的拼寫法,從圖四十八 (b) 可以看到,廣告中大多數詞的拼寫法,跟今天的標準拼寫法(見圖四十八 (c) 灰底的英文字)或多或少有別。例如 cheap 這個字,在廣告中卻拼成 chepe。在十五、十六世紀出版的英文書中,同一個英語詞的拼寫法往往有多種,例如 pity 這個英文字,在當時便可以印刷成:pity、pyty、pitie、pytie、pittie、pyttye 等。印刷技工有時為了排版方便,會選擇一個長短合適的異體字。可是,百花齊放的拼寫法並不方便閱讀,人們於是覺得拼寫法有規範化的需要。英語詞的拼寫法發展到十七世紀中葉已頗為規範化,但要到十八世紀中葉才完全標準化,從此基本穩定不變。這裏順帶一提,廣告下端的 Supplico stet cedula 是拉丁文,意思是‘請勿移除此單張’。

現在介紹美國開國元勛之一富蘭克林 (Benjamin Franklin) (1706 ~1790)(中國的清朝) 所寫的一封親筆信。富蘭克林於 1775 年給英國國會議員威廉 • 斯特拉漢寫了一封信,在信中強烈譴責英國軍隊血腥鎮壓美國殖民地。斯特拉漢是富蘭克林的摯友,但斯特拉漢支持英國政府的立場,富蘭克林於是在信中表明要跟他決裂。但這封信卻一直未有寄出去。以下是這封沒有寄出的手寫信 [1]


[1]  美國國務院存有一份富蘭克林於 1775 年寫給斯特拉漢的複寫信件,而圖四十九 (a) 中的信則複製自該複寫件。

圖四十九 (a)    富蘭克林於 1775 年寫給斯特拉漢的信

由於手寫體一般比印刷體較難閱讀,現將圖四十九 (a) 手寫的信轉換成圖四十九 (b) 的印刷本,以便閱讀。我們除了採用今天最常見的 Times Roman 字體外,還希望在編輯手寫本時能盡量保持其格式。

圖四十九 (b)    以印刷字體顯示的富蘭克林的信

如果把圖四十九 (a) 和 (b) 相比較,便可以看到以下三點。第一,在富蘭克林手寫的信中,不少詞都是很隨意地連寫在一起的。在美國立國史上,這封寫於美國宣告獨立前一年的信是一件重要的文獻。從十八世紀末葉直到今天,不少學者把富蘭克林這封手寫的信轉換成印刷本,以方便讀者閱讀。因此,圖四十九 (a) 手寫信的印刷版本可以説是數以百計的,其中包括圖四十九 (b) 我們所提供的版本。這些版本彼此之間有或多或少的差異。但是,大家都會不約而同地把手寫信中很多連寫在一起的“詞” 用空間分隔開來,例如信開首第一句,在印刷版本中會這樣出現: “You are a Member of Parliament, ”、 “You are a member of Parliament,” 或  “You are a member of parliament,”。可見在分詞連寫方面,大家的做法是十分一致的。

第二,英語文字發展至十八世紀中葉,“詞”的拼寫法已完全標準化,跟今天基本上沒有分別。富蘭克林把英語詞寫出來時,其拼寫法跟今天是完全一樣的,例如信開首第一句: “You are a Member of Parliament, ”,富蘭克林的拼寫法跟今天完全一樣。

第三,十八世紀中葉,不少人在書寫英語時,為了強調某些名詞的重要性,會把名詞第一個字母用大寫字母書寫。例如富蘭克林把信開首第二句寫成: “You have begun to burn our Towns, and murder our People.”。但是,這一句在今天大概會寫成: “You have begun to burn our towns and murder our people.”。

第八部分 概論音段文字的發展過程

從酒瓶文字到富蘭克林的親筆信,可以粗畧地看到音段文字在分詞連寫上的發展過程。酒瓶文字屬於音段文字最原始的階段,書寫酒瓶文字的古希臘人只不過是用字母把語素的讀音順序地寫出來,簡單直接地把說話這種聲音媒體轉換成文字這種視覺媒體,初步解決了用字母把說話寫下來的問題。但在古希臘字母文字中,一個語素是由一個或若干字母寫出來的,若用字母把這些語素全部連寫在一起,語素之間的界限就不容易看清楚,閱讀這樣寫出來的文字,便不容易一下子就明白其意思。這個問題是所有音段文字都會遇到以及需要解決的。英語文字是音段文字,從其發展的過程可以看到英國人是怎樣解決這個分詞連寫的問題。

從寫於公元十世紀的《主禱文》第一句可以看到,英國人是按唸誦句子時的自然停頓處把句子分為三段,用圓點把這三段分隔開來。下面的英文句子,便是由上述的《主禱文》第一句轉寫而成的。從這句轉寫成的句子,可以看到上述《主禱文》第一句是怎樣寫成的。

〈Thou ourfather • thatart inheaven • be thy namehallowed •〉

            從上面的英文句子可以看到,每一段唸誦出來的話都有好幾個語素。當書寫者把這些語素用字母寫出來時,他把一些語素跟別的語素或連寫在一起,如 ourfather;或分隔開來寫,如 be thy。連寫與否,似乎是看語素之間的關係是否密切而定,例如第一段中的 our,它跟 father 的關係就比它跟 Thou 的關係較為密切,所以 our 跟 father 連寫在一起,而跟 Thou 則分開。在分詞連寫上,這時期的英文仍然處於發展的初階段,語素是否需要連寫,之後尚要經過反覆嘗試才能摸索出大家都接受的寫法。

公元 1200 年,英國人已初步找到了長短適中、最適合閱讀的書寫單位,這個書寫單位在今天被英、美人士稱為“詞” (word)。詞由一個或若干個語素構成,詞似乎是為了方便閱讀音段文字而產生的。詞的合適長度涉及語素的分合,是要靠不斷摸索才能定下來的。

從卡克斯頓 1477 年所印製的第一份英文廣告可以看到,英語文字在分詞連寫上的做法基本上已大定,可以説和今天沒有甚麽分別。但是,各個詞的寫法還未完全統一,同一個詞可以有很多種拼寫法。

從富蘭克林寫於 1775 年的信可以看到,英文字的拼寫法在那時已經完全統一,除了個別名詞大寫之外,跟今天英文字的拼寫法是完全一樣的。

英語文字在分詞連寫上雖說是大定,但其演化並不是完全停頓下來的。在英語文字中,一些有較密切關係的詞,起初是分寫的,例如:electronic mail,後來因為常用而覺得 electronic 這個詞無論在說和寫方面都比較冗長,所以簡寫成 e-mail,e 後面用短橫 – 把 mail 聯繫起來,表示這兩個詞的關係是密切的。e-mail 這個詞,後來因為實在太常用而寫成 email。在英語文字中,很多連寫成的詞相信都是經過類似的過程而產生的。例如:water proof → water-proof → waterproof;air port → air-port → airport;white wash → white-wash → whitewash。

第九部分   詞的定義困擾了中國語言學界幾十年1

美國語言學家L. 布龍菲爾德 (Leonard Bloomfield)(1887 ~ 1949)在上世紀三十年代給“詞”(word)下了一個經典的定義:“詞是最小的自由形式”(a word is a minimum free form)。[1] 這個定義影響了西方乃至全世界的語言學界,包括中國語言學界在內。對於布氏這個定義,語言學者歷來有不少爭論。我們在這裏嘗試把該定義較細緻地分析,看看它為何引起不少爭論。


[1]  Leonard Bloomfield, Language, Great Britain: George Allen & Unwin Ltd., 1933, p.178

布氏既然把“詞”定義為“最小的自由形式”,我們就要問:甚麽是形式?甚麽是最小的形式?甚麽是自由形式?甚麽是最小的自由形式?

布氏把“有穩定語義的語言形式”(a linguistic form with a constant meaning)這詞組,簡稱為“形式”(form)。形式有大有小,為方便分析,一般把最大的形式定為句子。布氏所舉的例句“Poor John ran away.”(可憐的約翰逃走了),便屬於最大的形式。按照英語語法,這個句子可以分析成“Poor John”和“ran away”兩個詞組(phrase),而“Poor John”和“ran away”這兩個詞組則可分別分析成“Poor”和“John”以及“ran”和“away”這四個詞。詞仍然可以再細分成一個一個語素,詞可以説是由一個或若干個語素構成。按布氏説,“Poor John ran away.”這個英語句子有五個語素:poor、John、ran [1]、a-、way。前三個詞分別由poor、John、ran 這三個語素構成,最後一個詞則由 a- 和 way 這兩個語素構成 。句子、詞組、詞和語素都是“形式”,都是有音有義的語言形式。語素是最小的音義結合體,不能再細分為更小的音義結合體。語素是“最小的形式”。

[1]  布氏視 ran 為一個語素,我們卻認為 ran 可以看成是由 run 這個動詞的原生語素和表示過去式的語素融合而成,所以 ran 可以視作兩個語素。在英語中,動詞的過去式很多時由動詞的原生語素加後綴 -ed合成,例如:walked、jumped、landed、played等。這些動詞一般會分析成兩個語素。

綜合上文所述,句子屬於最大的形式,由一個或若干個詞組構成;詞組是次大的形式,由一個或若干個詞構成;詞是較小的形式,由一個或若干個語素構成;語素是最小的形式,不能再細分為更小的有音有義的語言單位。句子的結構可分析成如下圖所示:

句子

詞組

語素

圖五十  句子的結構   

按布氏說,形式有兩種:一種是“黏着形式”(bound form),另一種是“自由形式”(free form)。他說:“一個從來不會單獨地說出來的語言形式,便是一個黏着形式”(A linguistic form which is never spoken alone is a bound form.)[1];例如:playing 和 dancing 中的後綴 -ing,是一個有音有義的語素,它讀 /-iŋ/,表示‘動作在進行中’,由於 -ing 在英語中從來不會單獨地說出來、不會單獨成句,所以 -ing 是黏着形式。布氏緊接着說,如果不是黏着形式,便是自由形式。布氏說,“以句子出現的形式便是自由形式。”(Forms which occur as sentences are free forms.)[2] 從布氏就有關自由形式的論述來推斷,他似乎是想説,在日常的對話當中,自由形式有時候會單獨地說出來,且能單獨成句。自由形式有大有小,最大的是句子,例如 Poor John ran away;較小的是詞組,例如 Poor John;最小的是詞,例如 John。這些自由形式都可以單獨地說出來,都可以單獨成句。按布氏說,詞是最小的自由形式,有時候會單獨地說出來,且能單獨成句。


[1]  Bloomfield, op.sic., p.160

[2]  Ibid., p.178

現在再利用布氏所舉的例句“Poor John ran away.”,來進一步説明甚麽是“自由形式”的語素和“黏着形式”的語素。這例句由五個語素組成:poor、John、ran、a-、way,最後那兩個語素:a- 和 -way,構成副詞away。a- 是前綴, way 是前綴後面的名詞,away 表示‘離開所處的地方’。a- 源自古英語的前置詞 on,包含on、in、into、to、toward 的意思,置於名詞之前,輕讀成 /ə/,構成一個一個作副詞用的詞組,這些詞組後來演化成一個一個詞,例如ashore、aside、apart等。布氏認為,像前綴 a- 這一類語素,是從來不會單獨地說出來、從來不會單獨成句的,而必須黏附着一個詞或自由語素(例如“way”)方能說出來。他稱 a- 這類語素為“黏着形式”的語素,簡稱“黏着語素”。

講到黏着語素,不能不提英語的語法語素或詞綴。在英語中,複數名詞很多時是由單數名詞加表示‘複數’的語法語素 {s} 構成,例如 cat、dog、church + {s} → cats、dogs、churches。這裏的 {s} 便是黏着語素,而且正如布氏所說,是從來不會單獨地說出來的。英語的過去式動詞則很多時是由動詞的根本形式加表示‘過去式’的語法語素 {ed} 構成,例如walk、play、want + {ed} → walked、played、wanted。這裏的 {ed} 也是黏着語素,且亦如布氏所說,是從來不會單獨地說出來的。上文表十五中所列舉的五個後綴,亦屬於黏着語素。這些語法語素或詞綴若單獨地說出來,聽者會聽到一頭霧水,完全聽不懂其意思。

英語有不少語素屬於布氏所說的黏着語素,上文已舉了一些例子。按布氏說,黏着語素是從來不會單獨地說出來的。但是,語言學者J. Mugdan指出,在日常對話中,可能會有人把黏着語素 non 單獨地說出來,例如有人問:Did you mean inflammable or nonflammable ?(你想說易燃抑或不易燃?) 可以答:Non.(不)。[1] inflammable這個詞解作‘易燃的’,由動詞 inflame 衍生出來。動詞 inflame是 set aflame 的意思,即‘點燃’。可是,英語另有一個同音的前綴 in- ,卻是‘不’的意思,例如 inexpensive‘不貴’、incapable‘不能夠’、incredible‘難以置信’,所以 inflammable 這個詞可能會令人誤以為是‘不易燃’的意思,因而產生了“Did you mean inflammable or nonflammable ? ” 這問題。我們認為,這問題最自然的回答是 Nonflammable,但光説 Non 也可以接受。

[1]  J. Mugdan, Morphological Units, in The Encyclopedia of Language and Linguistics, ed.R.E.Asher, Vol.5, 2543-2553

布氏說,黏着語素是從來不會單獨地說出來、從來不會單獨成句的。我們認為,黏着語素既然是不會單獨地說出來,它當然不會單獨成句。在詞方面,布氏說自由語素可以單獨成詞,如 run,但詞亦可以由自由語素和黏着語素組成,如 runs、running。布氏認為,所有的詞都可以單獨成句。我們覺得這種說法未免過於籠統。語言學者J. Mugdan指出,英語第三身單數、現在式動詞是不大可能單獨成句的,例如 sings。問:What does he do for a living? 答:He sings. 或 Sing.。但不會答:Sings.。我們認為,英語有很多詞是不大可能單獨成句的,例如:a、the、although。

能夠單獨成句的詞是有的,在某些情況下,詞是一個很簡短的表達方式,例如:yes、no、damn、oops、why、how。一種語言創造一個新詞時,是想表達某一種意思,至於這個詞是否能單獨成句,並不是詞的必備條件。布氏認為詞都能單獨成句,似乎超出造詞的基本要求。

如果用布氏所說的詞來分析漢語的句子,會遇到甚麽問題呢?例如 “他是圖書館管理員” 這一句,究竟有多少個詞呢?這一句可以分析成:“他 + 是 + 圖書館管理員”。“他”和“是”都是詞,由單一個自由語素所構成。“圖書館管理員”則是詞組,可視為由“圖書館管理員”一個詞構成;亦可視為由 “圖書館”和“管理員”這兩個詞構成。“圖書館”可視為由“圖書”這自由形式的詞和 “館”這黏着語素構成;“管理員”可視為由“管理”這自由形式的詞和 “員”這黏着語素構成。如果上文下理清楚,“圖書館管理員”可以壓縮為 “館員”。一般漢語人士都沒有布氏分析句子的觀念,但憑藉其母語的語感,大概會把“圖書館管理員”分析為“圖書館”和“管理員”兩個詞或兩個詞組。他們可能在其他場合聽到“圖書館長”和“倉庫管理員”的說法,而把“圖書館管理員”視為兩個單位的組合:“圖書館 + 管理員”。漢語人士把句子做到這樣的分析已經足夠,無須理會這些語言單位是否屬於布氏所說的“詞”。

在布氏的年代,英語文字已經十分規範化,詞這個書寫單位已經穩定下來很多年了。布氏的盲點,跟很多西方語言學者一樣,是誤以為詞這個單位是口語單位,在英語文字產生之前已存在於口語。從上文所述的古希臘酒瓶文字以及《主禱文》不同時期的英譯本可以看到,“詞”這個英語書寫單位其實是需要很長時間的醖釀才能定出來的。詞把一個或若干個語素寫出來,詞與詞之間用空間分隔開,造成長短不一的英文字,以方便閱讀。語素之間怎樣組合成詞,要視乎句子的結構和閱讀的效果而定,而這就需要經過長時間的醖釀才能定出來。

第十部分   詞的定義困擾了中國語言學界幾十年(2)

英語文字是音段文字,如果把句子中的語素全部連寫在一起,這樣寫出來的文字顯然是不容易閱讀的,所以有需要把句子細分為較容易閱讀的詞組或詞。英語中的詞滙語素和語法語素經常緊密地聚合在一起,所以當英語寫成音段文字時,這兩種語素自然會連寫在一起,構成一個一個詞。漢語文字是語素文字,一個漢字基本上代表一個漢語語素,每一個字都佔據一個方塊的空間,字與字之間的界限相當清楚,所以即使把句子中的漢字一連串地寫出來,在閱讀方面也不會造成很大的困難。

最早用拉丁字母拼寫漢語的人,是十九世紀鴉片戰爭之後來華傳道的外國教士。他們把《聖經》先譯成當地的方言,再用羅馬字母(即拉丁字母)拼寫這些漢語方言,這樣寫出來的漢語文字便稱為教會羅馬字。值得注意的是,在各種教會羅馬字中,詞中的語素是用短橫連起來的。至於句中哪些語素需要連寫,大家的做法並不一致。由此可見,漢語詞的拼寫法起初並沒有一個標準寫法可以依循,而是要經過長時間的使用才能達至一個約定俗成、標準的寫法。講起漢語拼音,大家最熟悉的方案當然是制定於二十世紀五十年代的法定《漢語拼音方案》。在漢語分詞連寫方面,語言學者尹斌庸在其〈漢語拼音正詞法〉中說,“用漢語拼音字母拼寫普通話語詞……最主要的原則是‘分詞連寫’……。制訂分詞連寫的規則除了參考語法上的詞類區分外,還要考慮聽覺心理(語感)和視覺心理的要求。…… 漢語拼音正詞法制訂以後,有一個通過群眾書寫實踐並不斷修改補充完善的過程,也就是約定俗成的過程。"[1]《漢語拼音方案》制定至今有六十多年,作為補充性的文字,已有一定的實踐經驗,但用拼音字母寫出來的漢語詞,要達至約定俗成的規範寫法,仍然有一段非常漫長的路要走。

[1]《中國大百科全書:語言文字》,1998,北京:中國大百科全書出版社,第 159 頁

用拼音字母書寫漢語時,在分詞連寫上會遇到甚麽困難呢?現在再用“他是圖書館管理員”這一句來討論這問題。理論上,這一句可以有下面四種寫法:

(1) Tā shì tú shū guǎn guǎn lǐ yuan.

(2) Tā shì túshūguǎn guǎnlǐyuán.

(3) Tā shì túshū guǎn guǎnlǐ yuan.

(4) Tā shì túshūguǎnguǎnlǐyuán.

現遂一討論每一種寫法在分詞連寫上所會遇到的問題。

從句 (1) Tā shì tú shū guǎn guǎn lǐ yuan. 可以看到,這句子一共有八個詞。漢語拼音字母把句中每一個詞的讀音拼寫出來,詞與詞之間用空間分隔開,句中的每一個詞都只由一個單音節語素構成,所以每一個詞都可以說是單音詞。句 (1) 中有兩個詞 {館} 和 {管},單獨唸時是同音的,所以同樣寫成 guǎn,但意思不同,要靠上下文來決定。但請注意,其餘的詞亦可能跟另一些詞同音,所以其意思亦要靠上下文來決定。

從下面表十九可以看出,句 (1) 中的每一個單音詞,都有若干個跟它同音的詞,少則有 3個,多則可達 34 個,例如 {館} 這個詞,跟它同音的詞有3個:{管}、{莞}、{琯}。“他是圖書館管理員”這一句若寫成:Tā shì tú shū guǎn guǎn lǐ yuan.,其閱讀效果顯然比用漢字寫差很多,因為每一個用拼音字母寫出來的字都代表若干個詞,例如 shì 這個字,可以代表三十多個單音詞。相信讀者須要先把句子唸出來,然後才能明白句子的意思。如果把句子由頭讀落去,頭三個字可以有以下幾個意思: ‘他試圖……’、‘她試圖……’、‘他仕途……’、‘她仕途……’。當然,句子越往下讀,它所表達的意思就會越來越明確。但讀者要把句 (1) 差不多讀完方能明白整句的意思。

十九   (1) 中的單音詞同音的詞

shìshūguǎnguǎnyuán
  
  
  
  
趿   
   
    
    
    
    
    
     
     
     
      
      
      
       
       
       
       
       
       
       
       
       
       
       
       
       
       

不少人批評漢字難記難學,原因之一是要學的漢字太多,所以建議減少漢字的數量。減少漢字數量最極端的做法是使用一個筆劃最少、字形最簡單的漢字做音節符號,來代表所有同一個讀音的單音詞,例如用〈它〉來代表最左欄的 10 個讀 tā 音的詞。如果一以貫之地使用這個方法來寫漢語,漢語文字便會變成音節文字。普通話有 1277 個音節 [1],所以寫普通話便只需使用 1277 個音節符號,要學習的符號就會大大減少。如果用上面表十九中筆劃最少的漢字來寫出“他是圖書館管理員”這一句中的每一個音節,這句話便會寫成:〈它士徒殳莞莞李元〉。要閱讀這樣寫出來的文字顯然並不容易,讀者首先要把句子讀一遍,方能弄清楚句子的意思。以第一個音節符號〈它〉為例,它代表的詞有 10 個,表達 10 種不同的基本意思。〈它〉究竟代表哪一個詞,要交由上下文來決定。音節文字若分詞連寫,對閱讀會有一定的幫助。但這樣寫出來的音節文字仍然不容易閱讀,各個詞的意思很多時仍然要靠上下文來決定,閱讀的效率會比傳統漢字遜色得多。(代續)


[1] 趙元任,Language and Symbolic systems, U.S.A. : Cambridge University Press, 1968, p.210

Views: 242

Leave a Reply

Your email address will not be published. Required fields are marked *