1 婆羅米文的起源
腓尼基文衍生了阿拉米文 (Aramaic),而阿拉米文影響了古波斯文 (Old Persian)、北印度的佉盧文 (Kharosthī) 和婆羅米文 (Brāhmī)。婆羅米文跟腓尼基文一樣,是深具影響力的文字,本文會扼要介紹其造字原理。
當閃語字母文字遇上梵語口語分析的傳統
公元前六世紀(中國的春秋後期),波斯帝國統治了今日的巴基斯坦北部和阿富汗東部,但官方文字卻用屬閃語字母文字的阿拉米文。學者大都認為,當時居住在這地區的人,受到阿拉米文的影響,創造了佉盧文來書寫當地的通俗語 (Prakrit)。婆羅米文產生的年代則不確定,一說產生於公元前七世紀(春秋中期),比佉盧文更早,另一說則認為婆羅米文是受了佉盧文的影響而產生的。
從婆羅米文和佉盧文的性質來看,阿拉米文對它們的影響是很明顯的。這兩種古印度文字,相信都是結合了阿拉米文的造字法和梵語語音分類的知識而創造出來的。婆羅米文和佉盧文的形狀雖然不同,但性質相若,屬於同一類型的音節文字。這兩套字母,雖然都是在阿拉米文的基礎上發展出來的音節文字,但它們的性質卻有異於阿拉米文。
梵語專家季羨林說:“印度古代極重祭祀。祭神要唱頌歌,頌歌多取自吠陀” (《中國大百科全書:語言文字》〈波你尼〉一欄)。吠陀 (the Vedas) 是古印度人的聖典,在梵語 (Sanskrit) 中解作‘知識’。吠陀經收錄了很多頌歌,其中大部分估計早於公元前一千年(中國的周朝初期)之前已經產生了,用當時的梵語創作而成。唱頌歌和唸經文所用的梵語,那時候還未有梵文把它寫下來,主持祭祀的婆羅門 (Brahmin) ,只能靠記憶用梵語把頌歌和經文唱誦出來。梵語經過許多個世代的師徒口耳相傳之後,跟日常口語比較,無論在語法、詞彙或語音上,相信都有所不同。
婆羅門為了確保頌歌唱得正確,把古代梵語進行精密分析,包括把梵語音節歸類和排列。而且,為了便於傳授這些語音知識,估計會創造一些易於背誦的口訣,把音節分類的知識,世代口耳相傳。
婆羅門學習了阿拉米文的原理後,會嘗試用阿拉米字母來寫梵語。由於他們已經有了口語分析的知識,所以會很容易明白阿拉米字母是音節符號,並知道每一個阿拉米音節可分為前後兩截。前截讀音是聲母 (即輔音),後截讀音是較響亮的韻母 (這裏是元音)。每一個阿拉米字母代表幾個同一聲母的音節。音節的聲母只要相同,即使韻母不同,也用同一個字母來表示。婆羅門基本上採用了這個表示音節的方法,即是基本上用一個符號來代表幾個同一聲母的音節。可是,這種表音方法對梵語來說並不足夠。
音節的聲母相同而韻母不同,對婆羅門來說,是幾個不同的音節,有需要分辨開來,只用一個字母來表示並不足夠。婆羅門在阿拉米文的影響之下,用一個基本字母,來代表韻母是 /_a/ 的音節。聲母相同而韻母不是 /_a/ 的其他各個音節,則在基本字母的周邊掛上不同的附加符號來區別。細節見下文。
2 婆羅米文的音節符號
阿拉米字母和婆羅米字母的異同
阿拉米文和婆羅米文俱是有廣泛影響力的文字。兩者的字母都是音節符號,但並不屬於同一類型,阿拉米字母的讀音不固定,而婆羅米字母則有固定的讀音。阿拉米文是閃語字母文字,一個字母代表幾個以同一個 C (輔音)開頭的音節,後截的 V (元音)無論是 /a/、/i/、 /u/……,字母的形狀仍保持不變。婆羅米文是梵語文字,一個字母只有一種讀法。婆羅米文有 32 個代表 /_a/ 音節的基本字母。如果音節不是 /_a/,而是其他音節,例如 /_i/、 /_u/,就會在基本字母的周邊掛上不同的附加符號來表示。
婆羅米字母的排列次序,很有系統和具科學性,跟似乎是隨意排列的阿拉米字母很不同。從婆羅米字母表可以看到,這些音節字母是按聲母的發音位置和發音方法來排列。音節之所以這樣歸類和排列,是因為婆羅門對梵語語音已經做了相當全面和細緻的分析。
下面表 1 和表 2 是婆羅米文兩個基本字母表。表 1 列出表示元音音節的字母,表 2 則列出表示 /_a/ 音節的字母。為方便讀者,字母讀音用拉丁字母寫出來。
阿拉米語並沒有光是元音的音節(可稱為 V 音節),所以阿拉米文沒有光表示元音的字母。梵語則有光是元音的音節,所以婆羅米文需要創造元音音節字母。婆羅米元音音節字母的排列次序顯示,元音音節排列的次序基本上是:a, i, u, e, o 。
表 1 中的第一個婆羅米字母,表示 /a/ 音,形狀有點像阿拉米文中反置的 〈_ʔ〉。〈_ʔ〉是阿拉米字母表中的第一個字母,表 1 中的第一個婆羅米字母相信源自〈_ʔ〉。〈_ʔ〉這個字母本來代表 /ʔa/ 等音節,婆羅門受了母語的影響,覺得阿拉米語的 /ʔa/ 音,跟梵語的 /a/ 音最相似,所以用表 1 中的第一個婆羅米字母來代表 /a/ 音。第二個婆羅米字母表示長 /a/ 音,明顯是從第一個婆羅米字母變化出來的。其他的元音字母則似乎是婆羅門自創的。
表 1 中的第三個和第七個婆羅米字母,分別表示 /i/ 音和 /e/ 音,而第七個字母似乎是把第三個字母的三點連接而成。第五個和最後的婆羅米字母,則分別表示 /u/ 和 /o/,而最後的字母似乎是從第五個字母變化出來的。表 1 中的第一、第三和第五個字母是基本字母,代表三個最基本的元音:/a/、/i/、/u/;其餘六個字母似乎是從這三個字母衍生出來的。
下表列出另外 32 個婆羅米字母,分別代表 32 個梵語音節。每個字母只有一個音節讀音。這 32 個字母的韻母讀音相同,都是讀 /_a/,但聲母讀音則不相同。這 32 個字母是婆羅米文最基本的音節符號;其他的音節符號,除了表 1 中的元音符號之外,都是從這 32 個基本字母變化出來的。
婆羅米字母歸類和排列的方法
從表 2 中的音節字母的排列次序來看,婆羅門按字母的聲母讀音,把字母分為三大類。字母 1 至 25 屬於第一類,字母 26 至 29 屬第二類,字母 30 至 33 屬第三類。
第一類字母的讀音有以下的特色。發音時,由肺部出來的氣流,在口腔內遇到阻塞,再經口腔或鼻腔釋放。經口腔釋放出來的音今日稱為塞音,經鼻腔釋放的則稱為鼻音。最右列的字母 10, 15, 20, 25 屬鼻音字母,其餘的都是塞音字母。
第一類字母發音時,氣流在口腔內不同的位置遇到阻塞。第一類字母可以按這些阻塞點再細分。阻塞點在口腔最內的是喉音,接着由內往外排列,依次是腭音、頂音、齒音和唇音。表 2 中的喉音、腭音、頂音、齒音和唇音,今日語音學分別稱為後腭音、前腭音、翹舌音、齒音和唇音。
字母 1 至 5 的音節讀音,開頭的部分是喉音,除了第五個是鼻音外,其餘四個按現代的叫法是後腭塞音。第 1 個是不送氣清音,第 2 個是送氣清音,第 3 個是不送氣濁音,第 4 個是送氣濁音。第 1 和第 2 個音,很多語言都有類似的音,例如普通話 {尬} 和 {卡} 開頭的 /k/ 音和 /kh/ 音。第 3 個音在其他語言也很普遍,如法語 gare 開頭的 /ɡ/ 音。 第 4 個送氣濁音,在其他語言中不多見。發這個音時,聲帶要顫動,並同時送出大量氣流,像較重的喘氣聲。
表 2 中的 1 至 25 個音節字母,其開頭部分的讀音,可以按行或按列歸類。左邊第一列的五個塞音可歸為一類,即字母 1 (喉), 6 (腭), 11 (頂), 16 (齒)和 21 (唇)。今日稱這五個塞音為不送氣清音。第二至第四列亦各有五個可歸為一類的塞音,今日分別稱為送氣清音、不送氣濁音和送氣濁音。至於第五列的音,如上文所述,屬鼻音。
第二類是 26 至 29 的半元音字母,其音節讀音的開頭部分有以下特點。發音時,從肺部出來的氣流,經過口腔時,幾乎沒有遇到甚麼阻礙,可以比較順暢地流出來。所以半元音今日稱為通音。這些音都比較響亮,如果沒有元音緊隨其後,也可以自成一個相當響亮的音節。
第三類是 30 至 33 的噝音和氣音字母。噝音字母開始發音時,舌頭靠近上腭,造成窄縫,氣流通過時發出噝噝的摩擦聲。阻礙氣流的位置不同,發出的噝音也不一樣。氣音是氣流通過聲門時所發出的摩擦聲。噝音和氣音都是摩擦音。
梵語音節口訣與婆羅米字母表的關係
上文說過,婆羅門為了確保梵語唸得正確,相信會有需要創造一些作教學用的口訣。沒有人知道口訣是怎樣,亦不知道這些口訣的真正唸法。但從表 1 和表 2 可以想像,婆羅門會以一定的次序來唸誦音節。相信很多種唸法都跟 /a/、/ā/、/i/… /ka/、 /kha/、/ga/…這種次序類似,都合乎語音分析的學理。表 1 和表 2 中的字母排列次序,應該跟婆羅門的實際唸法有一定的關係。
現在印度小孩學習字母時,都要背誦音節表,一般的唸法是:/ka/、/kā/、/ki/… /kha/、/khā/、/khi/… /ga/、/gā/、/gi/…。音節排列的次序基本上跟表 2 一樣,先唸第一個字母的基本音節 /ka/,再唸其他同聲母的音節 /k_/,接着唸第二個字母的基本音節 /kha/ 與其他同聲母音節,餘此類推,一直唸到最後的 /ha/ 與其他同聲母音節。這種背誦音節的方法由來已久,相信是源自婆羅門二、三千年前唸誦音節的方法。
婆羅門在公元前六世紀或甚至更早,可能已經接觸到阿拉米文。當他們懂得阿拉米字母的原理後,相信會嘗試盡可能套用阿拉米字母來寫梵語。可是,阿拉米語屬閃語,而梵語則屬印歐語系,是兩種很不同的語言。阿拉米文用一個字母代表幾個音節,例如用〈_k〉代表 /ka/、/ki/、/ku/ 等同聲母而且意義有關連的音節。婆羅門會覺得這種表音方法並不適用於梵語,因為在梵語中,這幾個音節很不同,在詞彙意義上並沒有任何關連。在梵文中,若果只用一個字母代表幾個音節,則即使有了上下文的幫助,也不容易推斷出字母代表哪一個音節。一個字母有太多音節讀音,要想辦法去解決。
解決的辦法,是用阿拉米字母來代表梵語中最基本的 /_a/ 音節,其他同聲母的音節則用變體字母來代表。例如:〈_k〉這個阿拉米字母,原本代表 /ka/、/ki/、/ku/ 等音節,婆羅門把字母寫成 +,作為一個基本字母,專用來代表 /ka/ 這一個音節。其他的同聲母音節 /k_/,則把 + 的形狀稍作改變來代表,變化形狀時會根據一些既定的原則。梵語中的各個 CV 音節,都是用這種方法寫出來的。下表列出 15 個基本字母以及由基本字母變化出來的字母。最左一列的字母是基本字母,其餘七列的字母都是變體字母。字母按聲母和韻母排列:同聲母則同行,而同韻母則同列。把聲母加韻母,就可以得出每個字母的讀音。
從上面可以看到,變體字母都是在基本字母的周邊掛上附加符號而寫成的。附加的符號,都是由一至三道短橫造成。韻母讀 /_a/ 的字母都是基本字母,字形頗為簡單工整,一般只需一至兩筆便可寫成。從附加符號掛上的方法,可以看到符號所代表的韻母。韻母相同,掛上附加符號的方法就相同。例如:韻母讀 /_ā/ 的變體字母,都是在基本字母上方適當的位置向右加一短橫而造成的。例如基本字母〈ka〉和〈ga〉,按上述方法加短橫,就變成〈kā〉和〈gā〉。新加的短橫如果不夠突顯,就會把短橫移往附近適當的位置。例如若要在基本字母〈dha〉上方向右加短橫,就不得不把短橫移往弧線中段,把字母寫成〈dhā〉,整個字形才變得清晰易辨。掛上附加符號的方法,並非一成不變。按正常做法加短橫若不夠清楚,可以用圓點使其突顯,例如〈jā〉,亦可把短橫斜置,例如〈khū〉 和〈ñū〉。
梵語的輔音有三十多個,比阿拉米語的二十幾個還要多。阿拉米字母只有二十二個,所以婆羅米文創造字母時,除了參考阿拉米文的二十二個字母外,還需要另創一些新的字母。梵語有光是元音的音節(可稱為 V 音節),阿拉米語則沒有。阿拉米文並沒有光表示元音的字母,婆羅米文所以有需要創造這種字母。表 1 列出了婆羅米文的元音音節字母,上文已經介紹過,不贅。
婆羅米字母的形狀
婆羅米文的基本字母,相信很多都是參考了阿拉米字母而創造出來的。阿拉米字母最終都可以追溯到一些義符來,字母的形狀雖然不再象形,但仍然隱約受到原來字形的影響,不能做到很工整對稱。婆羅門從一開始接觸阿拉米字母,就把它們當作純音符看待,由於沒有受到義符形狀的限制,所以能夠較自由地創造字母的形體。光從外形來看,婆羅米文的基本字母,顯得比阿拉米字母對稱。字母的形狀簡單,大都是一筆起、兩筆止,雖然有幾個字母 (字母 21, 22, 33) 形狀接近,但大體來說,尚算形體各異,易於分辨。
從基本字母衍生出來的變體字母,雖然數以百計,但都是用同一個原理產生出來的,所以明白了這個原理之後,就可以觸類旁通地懂得很多梵語音節的寫法,令到學習婆羅米字母變得較為容易。但廣東諺語有云:針無兩頭利。婆羅米文的變體字母,形體的變化始終有所限制。不同的韻母,聽起來應該不容易混淆,若容易混淆,口語自然會一早調整。可是,用字母把梵語的韻母寫出來時,則要靠周邊的細小附加符號來區別。因此,即使有了附加符號,字母的形狀始終脫離不開基本字母的形狀,閱讀時仍要較用心地分辨開來。
婆羅米文是從閃語字母文字發展出來的,聲母相同而韻母不同的音節,基本上用同一個字母來表示。韻母的變化,可以從附加符號看出來。這種表示音節的方法,用來書寫閃語亦有可取之處。而事實上婆羅米文曾經反過來影響閃語民族,屬閃語字母文字的阿姆哈拉文 (即非洲的埃塞俄比亞文) 便是在婆羅米文的基礎上發展出來的。在阿姆哈拉文中,同聲母的音節符號,基本形狀相同,韻母的變化,則由附加符號顯示。在阿姆哈拉語中,詞根一般用三個聲母來表示,而詞在語法上的變化,則靠韻母來表示。阿姆哈拉語用婆羅米文的方法寫出來,既能頗清楚地表示詞根,又能表示詞在語法上的變化。
3 婆羅米文與阿卡德文、腓尼基文和希臘文的比較
婆羅米文與阿卡德文的比較
婆羅米文是音節文字,而阿卡德文則基本上是音節文字。阿卡德文並沒有進一步分析音節的結構,而婆羅米文則在基本符號上附加符號來顯示韻母,即西方學者所稱的元音部分。阿卡德文的音節符號來自同音的義符,符號的形狀是由義符所指物決定。聲母相同而韻母不同的音節符號,其外形可以很不同。婆羅米文衍生自全是音符的阿拉米文,聲母相同而韻母不同的音節,雖然會用幾個不同的符號來顯示,但這些符號都是由同一個基本符號變化出來的,外形會較為接近 (例子見表 3)。
婆羅米文與腓尼基文的比較
腓尼基文同樣是音節文字,字母代表 cα,所以 /ka/、/ki/、/ku/ 這三個音節,會只用〈_k〉這一個符號來表示。婆羅米文則需要用上三個符號來表示,符號見表 3。
婆羅米文與希臘文的比較
希臘文和婆羅米文都是受到閃語字母文字的影響而產生。一個閃語字母,可以看成是一個經濟不過的音節字母,代表幾個同聲母的音節。希臘文和婆羅米文都有需要把這種經濟的字母分化成幾種寫法,使到一種寫法只代表一個音節。希臘文和婆羅米文所用的方法很不同:希臘文用讀音之母,婆羅米文則用附加符號。
希臘文把讀音之母加在腓尼基音節字母之後,用兩個字母表示一個音節,無意中把該音節分柝成輔音和元音兩部分,腓尼基音節字母蛻變成輔音字母,而讀音之母則蛻變成元音字母。字母按音節中的音段先後次序排列。婆羅米文用阿拉米字母代表最基本的 /_a/ 音節,其他同聲母但不同韻母的音節則用變體字母來代表。變體字母由基本字母和附加符號兩部分合成,而這兩部分並沒有先後次序之分。有些學者把基本字母看作是輔音字母,而把附加符號看作是元音字母。這種看法帶有音段文字的色彩,婆羅門相信不會這樣看婆羅米文的基本字母和附加符號。從印度小孩背誦音節表中的音節次序來看,婆羅門應該知道一個音節是由聲母和韻母組成,聲母相同但韻母不同的音節,開始發音的位置和方法都相同,但音節響亮部分的聲音則不同。不同的基本字母發音時,開始發音的位置和方法都不同,但韻母都是讀 /_a/ 音。附加符號不同,韻母就不一樣。婆羅門相信不會用輔音和元音的排列次序來看婆羅米字母。閃語字母很倚靠上下文來定出字母的音節讀音,古希臘文和婆羅米文則不用,因為字母本身已經能夠清楚顯示其讀音。
希臘文是音段文字,而婆羅米文則是音節文字。婆羅米字母能夠清楚顯示音節中的聲母和韻母,但阿卡德文的音節符號則不能夠。婆羅米文可以看作是表音較為細緻的音節文字。
希臘語和梵語俱屬印歐語系,兩種語言同出一源,其性質有很多相似的地方。用閃語字母去寫這兩種性質相近的印歐語,為甚麼會發展出希臘文和婆羅米文這兩種性質很不同的文字呢?
古希臘人採用了腓尼基人書寫希臘語的方法,覺得這方法基本上是可行的,就順着這種方法自然發展,不經意地創造了一種嶄新的音段文字,影響後世深遠。婆羅門很早已經有了分析梵語的精密語音知識,當他們有機會接觸阿拉米文時,會很容易明白阿拉米字母的性質。他們只不過把一個阿拉米字母稍作變化,分別寫成幾個外形相近的婆羅米字母,就能夠做到一個字母只表示一個音節,因而無須採用讀音之母這種較為轉折的注音方法。所以用閃語字母去寫希臘語和梵語,就產生了兩種性質截然不同的文字來。
4 婆羅門口語分析的傳統
古代印度與希臘的語法學
婆羅門早在梵語未有文字之前,已經有精密分析梵語的傳統。這種做法前無古人,後無來者,在人類歷史上絶無僅有。婆羅門正正因為不受到文字的影響,沒有先入為主的觀念,所以能夠專注於梵語本身,直接分析其核心結構。
婆羅門有背誦經文和頌歌的傳統。這些經文和頌歌大都源遠流長,用古代梵語唱誦,師徒世代口耳相傳。婆羅門感覺到古代梵語跟口常的口語有所不同,為了確保正統的古代梵語不受時間變遷的影響,把古代梵語進行精密分析,並把這些知識世代相傳。到了公元前四世紀(中國戰國時期),印度古代的語法學,由波你尼集大成,寫成《波你尼經》,書中收集了歷代口耳相傳的梵語分析知識。有西方語言學者稱波你尼為歷來最偉大的語法學家。
古代希臘語法學家分析希臘語時,已經有了希臘文,所以描述希臘語時,不自覺地受到文字的影響。他們描述口語時,用上了原本用來描述文字的單位,例如句子 (sentence)、 詞/字 (word) 和字母 (letter)。西方語言學者繼承希臘語法學的傳統,在描述口語時,仍然或多或少受到這些用語的影響。
sentence 的意思
sentence 一般是指完整的句子,但完整的句子多見於書面語,卻少見於口常所用的口語。用句子描述口語,並不一定合適。婆羅門分析梵語時,並沒有句子的觀念。
word 的意思
在語言學中,word 是一個很有爭議性的用語。word 究竟是一個口語單位,還是一個書面語單位,語言學者對這個問題爭論不休。口語先於文字,先從口語分析入手,會較容易理順這個問題。
口語通常是一連串的說話,在未有文字之前,無須把一連串的說話像文字般柝分成一個一個獨立的單位。說話的一部分,可以籠統地稱為片言隻語,不需要有甚麼特別的稱謂。
今日的語言學者分析口語時,會把說話切分成一個一個有意義的單位。最精細的分析會切分出一個最小的有意義單位,即是《口語》一文所介紹的語素。語素再細分,就變成沒有意義的單位,所以語素的界限是比較容易定出來的。說話不光是發聲,而是說出有意義的東西,所以,把一句話看作是由一個或多個語素組成,也是很合理的。
在一句説話中,語素和語素之間的關係,緊密程度並不一樣。緊密連繫的兩個或多個語素,可以看作是詞。與其他語素沒有連繫的單一個語素,也可以獨自成詞。這裏所謂的緊密與疏離,是相對的說法,並沒有絶對的標準,按這個標準定出的詞,很難有一個嚴謹的定義。例如英語 /ɔ:lrait/ 這句話,由兩個語素組成,究竟是一個詞還是兩個詞,則見仁見智,沒有絶對的標準。
在語言學上,語素和詞是口語的基本單位。對一般中國人來說,語素是一個很陌生的稱謂,在日常生活中很少會用上。詞作為一個口語單位,大概是譯自西方語言學者所稱的 word,在今天日常生活中用得較為普遍。但詞用來指口語單位,似乎是近代的事,傳統的用法則泛指言辭或專指詩詞。漢語若用拼音字母寫出來,普遍認為需要分詞連寫,但怎樣才算是一個詞,則言人人殊。詞的定義,困擾了中國語言學界幾十年。由此可見,詞的觀念不容易弄清楚。
很多西方語言學者,以為 word 是指口語中的詞。詞有音有義,由一個或多個語素組成。先有詞,我們才能用詞來說話。後來有了文字,就把口語中一連串的詞寫出來,再用空間分隔開,而分隔出來的詞就叫做 word。這種看法並不完全正確。
英語中的 word,原先應該是指說話,後來指英文中一個一個字。英美人士會用字母把說話寫出來。寫出來的字要分隔開,變成長短不一、方便閱讀的字。例如《希臘字母是怎樣產生的—一個千古之謎》中英譯句一:WHOEVERNOWOFALLDANCERSDANCESMOSTNIMBLYSHALLGETTHISVASEASHISPRIZE,是很長的一串字,很難閱讀,需要分隔成:WHOEVER NOW OF ALL DANCERS DANCES MOST NIMBLY SHALL GET THIS VASE AS HIS PRIZE.。這些分隔開的閱讀單位,亦成了一個一個、有長有短的書寫單位,即是英文書本中的一個一個字。這種切分字的方法,並不適用於所有文字。例如閃語字母文字,因為其文字的性質不同,所以其切分字的方法也不同。以著名的腓尼基石棺文為例,如果翻譯成英語,會按英語文字切分字的方法,寫成以下 21 個字:
THIS SARCOPHAGUS WAS MADE BY ITTOBAL, SON OF AHIRAM, KING OF GOBEL, FOR AHIRAM HIS FATHER, AS HIS ABODE IN ETERNITY.
可是,按石棺文切分字的方法,句子會寫成以下 8 個字:
THISSARCOPHAGUS | WASMADEBYITTOBAL | SONOFAHIRAM | KINGOFGOBEL | FORAHIRAM | HISFATHER | ASHISABODE | INETERNITY
石棺文切分字的方法,跟英語文字很不同,因為腓尼基字母是音節文字,字短則有太多同音字,字要有一定的長度,才能減輕同音字的問題。一個腓尼基字,往往要用幾個英文字譯出來。由此可見,字怎樣切分,會因文字而有分別。
英語文字的書寫單位是新事物,本身亦需要有稱謂來描述,英國人稱之為 word。word 原先泛指所說的話,英國人覺得書本中的一個一個字,既然是把說話寫出來,所以又用 word 來稱呼這些字,word 的含義於是擴闊了,同時有說話和文字的意思。後來 word 主要用來指文字,成為英文字的稱謂。其實,是先有了英文字,然後發覺這些字要有一個叫法,以便溝通,於是借用了原本指說話的 word 來叫這些字。
在人類還未有口語之前, 所有事物都沒有任何稱謂。有了口語之後,人類就對所認識到的各種事物賦予稱謂,以便日常溝通。文字是有了口語很久之後才產生的新事物,同樣需要有稱謂才方便。英國人有了 word 這個指英文字的稱謂,用來描述自己的語言或文字就很方便。
人類在未有文字之前,一般不需要刻意分析口語。後來有了文字,字符與口語單位掛勾。在原創的古老文字中,一個字符代表一個有意義的口語單位,這是很自然的事。這個口語單位可以小如一個語素,大至一個詞組。一個字符已是一個有意義的書寫單位,所以字符與字符之間,不需要有空間分隔開。人類後來發展出音節文字和音段文字,一個字符代表一個音節或一個音段,變成一個音符。音符本身沒有意義,一般要與其他音符組合,才能成為有意義的書面語單位。閱讀的目的是要明白文字的意思,所以首先要認出這些有意義的書寫單位。這些書寫單位要分隔成適當的大小,才容易辨認,以提高閱讀的效率。英國人稱這些分隔開來的單位為 word。word 可以只代表一個語素,也可以代表幾個有密切關係的語素。無論是代表一個或多個語素,都可說是代表一個詞。
英文分隔 word 的標準,可能首先是按說話的語感,把字母分成一組組,然後看看其閱讀效果。所謂語感,並無嚴格的準則,只要不違背說話的習慣,都可以接受。分成一組組後的字母組合,是否需要調整,相信主要視乎閱讀的效果而定。字母的組合經過長時期的反覆試驗,就會漸漸取得共識,達至約定俗成的 word。
word 這個因閱讀需要而產生的書寫單位,中文一般稱為字,有時候反過來用來指詞這個口語的單位。word 有時指字,有時指詞。這種做法,在日常生活中並不會引起甚麼問題,但在語言分析上卻要把書寫出來的字和口説出來的詞分清楚。很多西方語言學者以為 word 是未有文字之前就早已存在的口語單位,文字只不過是把 word 這個口語單位寫出來。這種看法是本未倒置、倒果為因,因為口語單位的 word 其實是根據切分後的文字而得來的。
word 引致概念混淆的原因,可以從下表看出來:
表4 英語 word 引致概念混淆的原因
組成英語口語的語詞,原本沒有分隔開來
↓
用拉丁字母寫成的英文,起初亦沒有分隔開來
↓
英文有需要用空間把字母分成一組組,以便閱讀
↓
經反覆試驗後,定出長短最適合閱讀的單位
↓
這些最適合閱讀的單位,亦同時成為書寫單位
↓
這些書寫單位稱為 word
↓
原本沒有分隔開來的英語語詞,按書寫單位 word 的大小來切分
↓
按書寫單位切分後的口語單位,亦叫做 word
↓
word 既指字 (orthographic word)、又指詞 (phonological word)
↓
原本是由字定詞,學者一般卻認為字來自詞
上文所述的英語 /ɔlrait/ 這句話,英國人寫成 all right,美國人則寫成 alright。英國人和美國人講 /ɔlrait/ 這句話,讀音基本上是一樣的,但英國人寫成兩個 word,而美國人則寫成一個 word。英國人和美國人都覺得自己的寫法是正確的,都符合閱讀的需要。由此可見,word 歸根究底是一個人為的、約定俗成的單位。
如果按西方學者的說法,word 是口語的詞,那麼,英國人可能會覺得 /ɔlrait/ 中的兩個語素,關係雖然緊密,但可以分開寫,所以當 /ɔlrait/ 是兩個詞,而美國人則可能覺得 /ɔlrait/ 中的兩個語素的關係很緊密,所以當 /ɔlrait/ 是一個詞。語素之間的緊密程度,沒有絶對的標準,不存在誰對誰錯的問題。
又例如英語 /inəzmΛtʃəz/ 這句片語,有四個語素,寫成 inasmuch as,前面三個語素組成一個 word,最後一個語素則自成一個 word。這句片語的寫法,固然有習慣的因素,但方便閱讀也是一個重要的考慮。inasmuch as 寫成 *inasmuchas,閱讀效果可能稍遜,寫成 *in as much as,閱讀效果似乎不差,但這並不是規範的寫法。英語 /inəzmΛtʃəz/ 這句片語,在口語中無須切分,但寫成文字時,則要約定成俗地定出其寫法。由此可見,word 是英語書面語的一個單位,word 的切分可能有不只一種方法,當有不同的意見時,亦要作出取捨,所以 word 的產生,有人為界定的因素。
字之所以用空間分隔開,主要是方便閱讀。在英文中,一個字代表一個詞。但在其他文字中,例如閃語字母文字和梵文,一個字可以代表一組詞。在這些文字中,一個字母代表一個音節,跟英文一樣要用空間把字母分成一組一組,每組字母構成一個字,但這個字往往代表一組詞。用這種方法切分出來的字,長短適中,同音字較少,字義較明確,是最適合閱讀的文字單位。由此可見,字怎樣切分,音段文字和音節文字的做法並不相同。字很難有一個放之四海而皆準的定義。
假如有語言學者要向一個毫無文字觀念的土著解釋甚麼是詞,相信會有很大的困難。他可能會說,一句說話可以看作是由一個或多個詞組成,而詞是一個有意義的説話單位,可以有一個或多個有意義的部分。每個詞都可以獨立使用。可是,他很難再進一步向土著清楚解釋怎樣才算是“獨立使用”,因為在沒有文字的社會中,說話不用刻意去切分,人們仍然可以很容易明白說話意思,所以不存在把說話切分成詞的問題,亦因而不存在詞都可以獨立使用的問題。假如要土著把說話切分,他可能會切成一個一個有意義的、可以獨立出來、而又能在其他說話中使用的部分。這些切分出來的部分有大有小,部分越大,可以在其他說話中使用的機會越小。如果要土著把每一個部分再細分,他最終可能會切成一個一個最小的有意義部分,即語言學者所謂的語素。以有意義的說話部分來說,語素最能靈活運用,最容易在其他說話中使用。
說話可以看作是由語素組成,例如《口語》一文所用的普通話例句:wǒxīngqītiānyàoshàngbān,由以下七個語素組成:{我}、{星}、{期}、{天}、{要}、{上}、{班}。在語法分析上,詞比語素高一級,詞是由一個或多個語素組成。相信很多語言學者會認爲這句例句由四個詞組成:{我}、{星期天}、{要}、{上班}。假如有人認為這句由五個詞組成:{我}、{星期天}、{要}、{上}、{班},我們很難說這個分析必然是錯的。把 {上班} 分析成 {上} 和 {班} 亦有一定道理,因為 {上班} 可以跟 {下班}、{輪班}、{當班} 對比,可以見到 {上} 和 {班} 都可以各自成詞、獨立使用。由此可見,說話中的詞怎樣切分,並不容易定奪。其實,詞根本很難達至一個很嚴格的定義。正正是由於這個原因,詞的定義困擾了中國語言學界幾十年。
婆羅門起初分析梵語時,還未有文字,所以不用理會甚麼是詞。婆羅門只需把梵語切分成一個一個有意義的單位,最後得出最小、最基本的單位。這些最小的有意義單位,即今日所稱的語素,婆羅門稱之為“界”和“緣”,西方學者則稱為詞根和詞綴。
letter 的意思
古希臘文的 letter,即是字母,代表一個輔音或元音。字母是寫出來的音符,西方學者以往經常把字母當作是讀音本身,所以有時不知道他們究竟是指字母還是讀音。可是,字母是視覺媒介,而讀音是聽覺媒介,兩者要分得很清楚,觀念上才不容易產生混淆。
古希臘文的字母,原本是代表一個音節,後來蛻變成代表一個音節中的一段,即是音段,字母代表一個輔音或元音。把一個簡單的 CV 音節,切分成輔音和元音兩個音段,對用慣了音段文字的西方學者來說,這可能是很平常的事。他們可能沒有想到,這種把音節切分成音段的能力,並非人類與生俱來,而是拜希臘字母所賜。希臘字母是因種種機緣巧合而產生,得來一點也不容易。音段的觀念,是受到希臘字母的影響而產生的。
在希臘字母產生之前的古文字,只有音節而沒有音段的觀念,所以只用音節的觀念,就已經可以解釋這些古文字怎樣發展和運作。很多西方學者受到自已最熟悉的音段文字影響,往往套用音段觀念來分析這些古文字,所以不太理解它們怎樣運作,因而亦不能圓滿地解釋希臘字母究竟是怎樣產生的。
不少西方學者,把閃語字母和梵文基本字母看成輔音字母,而把讀音之母和梵文的附加符號看作元音字母,用音段觀念來分析音節文字。這種做法並不正確。
婆羅門起初分析梵語音節時,還未有文字,所以不受文字的影響。他們分析音節的目的,是要掌握其正確的讀音。他們按聲母發音部位和發音方法,把音節歸類和排列,再把音節順序唸誦。有了這些音節作參考,就容易把音節正確地唸出來。這樣已經達到分析音節的目的,不需要進一步把音節分析為音段。
5 早期的婆羅米文
現在用實例來解釋婆羅米文怎樣運作。下面一段早期的婆羅米文,是引自公元前三世紀(戰國末期和秦統一六國)古印度阿育王時期的石柱刻文。[1]
譯文:諸神所愛、善待眾生的國王,於皈依佛道廿載時,親臨此地膜拜,因佛祖釋迦牟尼於此誕生。
婆羅米文的原理其實很簡單:一個字母代表一個音節,字母把詞的音節逐一寫出來。字母分成一組一組,用空間分隔開。一組字母造成一個字,往往代表一個詞組。
表 5 中的一段文字,一共有 12 個字,按口語詞序,把詞的音節寫出來。字的長度不一,由一個至九個字母不等。字的長短不一,增加了字形的變化,方便閱讀。一些字的寫法,較為值得注意。
最後一個字只是由一個字母寫成,解作‘因為’,代表一個常用虛詞。這個字不跟其他字連寫,會較容易辨認,因此更容易掌握整句的結構,增加閱讀的效率。
用兩個字母寫成的字共有三個:字 8、9、10。字 8 解作‘於此’,代表一個常用虛詞。字 9 解作‘佛祖’,是與佛教有關的常用字。 字 10 解作‘誕生’,亦頗為常用。理論上,這三個字可以連寫,但這三個是常用字,分寫可以增加字的獨特性,亦可以減少字數。
字 1 和 2 分別用六個和五個字母寫成,理論上可以切分成多個較短的字。但是,這兩個字俱代表一組規範的常用讚美詞,因多見而容易辨認,所以這些詞連寫在一起也很合理。
字 4 的寫法則較難理解。這個字按常理應該細分成〈廿〉、〈年〉、〈皈依佛道〉三個字。頭兩個是常用字,分寫有其好處,但這裏把三個字連寫在一起。字 4 應該較難辨認,可能要把字母讀出來才明白字的意思。
字 11 是佛祖釋迦牟尼的名字,第二個字母是連體字母,把一個較為複雜的音節kya寫出來,字母由〈ka〉和〈ya〉上下叠寫而成。這種寫法表示這是一個字母,代表一個音節,跟其他字母看齊。
5 婆羅米文的影響
婆羅米文影響了印度境内和境外很多種文字。在印度本土,婆羅米文衍生出約 40 種印度文字,往東北影響了西藏文、蒙古文和滿文,往東南亞則影響了泰文、緬甸文、老撾文、柬埔寨文、爪哇文等。遠至非洲的埃塞俄比亞文,亦可能是受其影響而產生的。中國的文字包括西藏文、蒙古文和滿文,人民幣上亦印有這三種能夠表示聲母和韻母的音節文字。這三種文字把藏語、蒙古語和滿語中的語詞,逐個音節寫出來。
[1] Richard G. Salomon, ‘Brahmi and Kharoshthi’ in Peter T. Daniels and William Bright (eds), The World’s Writing Systems (New York: Oxford University Press, 1996), p.381.
Views: 1553