中華佛學學報第19期 (p73-105): (民國95年),臺北:中華佛學研究所,http://www.chibs.edu.tw
Chung-Hwa Buddhist Journal, No. 19, (2006)
Taipei: The Chung-Hwa Institute of Buddhist Studies
ISSN: 1017-7132

資訊時代的阿含研究

──以《阿含辭典》數位化研究為例


杜正民
中華佛學研究所佛學資訊學程
周邦信
中華佛學研究所佛學資訊學程
釋法源
中華佛學研究所佛學資訊學程




p. 73

提要

本文擬從楊郁文老師(以下簡稱楊老師)的阿含研究過程與電腦工具的應用,及其研究方法與資訊的性質,討論資訊時代的佛學研究方法,並以《阿含辭典》數位化研究為實例,提出實務說明。

因此,於第一段先界說資訊定義,及資訊與佛學或阿含研究的關係,進而探討楊老師阿含研究方法與資訊性質的共通點。並以其與謝清俊教授(以下簡稱謝教授)的阿含與資訊對談為例,進一步說明資訊與阿含研究。

謝教授於2004年10月30日於中華佛學研究所佛學資訊學程所舉辦的一場「所知之相──談對資訊的理解與詮釋」演講中,對佛學資訊有許多特殊的見解。該場演講引發楊老師對謝教授資訊解說的興趣,因而有2005年1月9日楊老師與謝教授於中研院的對談,此次的對談使資訊與佛學得以有機會深入法義的探討,並激盪出繽紛的火花。

楊老師的研究與教學重在實踐,其「起而行」、「付諸實踐」、「應用於生活上」的務實性格,恰與本所培訓具數位化能力的佛學人才,參與各項佛教數位文獻的作業、建構佛教數位典藏的實踐課程性質相同。因此,本文於進入實務演示之前,擬先就佛學資訊的實踐性做一簡介。

最後,以《阿含辭典》數位化研究為例展示說明,此為學程師生以楊老師《阿含辭典》的小部份資料做測試,並將工作流程作記錄與解說。於結語則檢討與展望佛學資訊的未來開展。

關鍵詞:1.阿含研究 2.阿含辭典 3.佛學資訊 4.資訊定義 5.數位化作業



p. 74

【目次】

一、資訊時代的阿含研究

 (一)資訊時代與資訊定義

 (二)資訊定義與佛學研究

 (三)資訊與阿含研究:阿含與資訊的對談

二、楊老師的阿含研究方法與資訊特質

 (一)楊老師的阿含研究過程、教學及出版

 (二)楊老師的阿含研究與電腦工具的運用

 (三)楊老師的佛學研究與資訊性質之共通

三、阿含資料與數位化作業的可能

 (一)《阿含要略》略符說明

 (二)《阿含辭典》編輯體例

 (三)實踐:佛學資訊學程與數位實作

四、實務說明:以《阿含辭典》數位化研究為例

 (一)辭典編輯格式確認

 (二)執行數位檔案轉換

 (三)辭典呈現程式設計

五、檢討與建議

 (一)辭典數化的優點

 (二)未來發展與精進

 (三)結語



p. 75

一、資訊時代的阿含研究

(一)資訊時代與資訊定義

電腦與網際網路的發明,改變了人們溝通和資料處理的方式,電子或數位媒體的記錄、整理、搜取、呈現、傳播等,改變了現代的知識取得與學習方式,這個時代,被稱為「資訊時代」。

由於現今所面臨的是前所未有的資訊時代,因此對於「資訊」的定義百花齊放,各自解說。誠如謝教授所言:「歷來各領域對資訊一詞所下的定義極多,據圖書館界的蒐集已超過四百種。這些定義多屬於某一領域中針對特定問題所立的界說……在已有的資訊定義中,比較可用的界說是把資訊視為知識的同義辭。這個定義是研究資訊經濟(information economy)者所常用的,從Fritz Machlup, Daniel Bell, Uri Porat到最近的學者都這麼用。資訊經濟……將資訊視為知識是允當的。可是對文學、藝術而言,則此界說又顯得偏頗而不夠周延。因此我們需要一個比『知識』還廣的界說。」

就此需求,他進一步的定義與詮釋,「資訊」就是「所知表現在媒介上的形式」。換言之,所知是資訊的內容,資訊是所知的形式。資訊並不完全等於所知,它是所知在媒介上的投影,它承載著所知,它是我們可由感官察覺的。在應用時,我們用的是資訊的內容,即所知,而不是其形式。[1]由上述資料,吾人暸解,資訊就是人們將其所知,表現在一特定的媒介上的形式,進而藉此形式表現所知的內容。簡言之,資訊就是所知的形式。

說明「資訊」的定義後,下文擬進一步探討其與佛學研究的關係。

(二)資訊定義與佛學研究

佛教是源遠流長的宗教,其相關的資料與知識浩瀚如海,可說是人類精神文明及智慧的寶藏。若能運用資訊的理論與方法,將資料文獻數位化保存及有效地管理,將可改進佛學的教學、研究、推廣等各個層面,可知現今的佛學研究與資訊是有其一定的關係。因此,謝教授進而就所知、媒介、資訊,就佛教的名相解釋資訊的定義。他用佛家的「能、所」來說明這個問題:人有「致知」的能力,佛家稱人為「能知」,把所有人能知道的事物稱為「所知」。



p. 76

「所知」是指受、想、行、識的結果,所有的「識」總合稱為「所知」。所知是無形、無相的,要憑藉物質形式表達出來,才能供人察覺;有了察覺的功能後,才能溝通、保存和作種種的利用。……資訊的定義是很不易琢磨的;……然而,為避免認知和討論上產生意見分歧,必須要有一個統一的定義。因此,他把資訊界定為:「所知表現在媒介上的形式」。[2]簡言之,他認為以佛教名相而言,「所知」就是所有的「識」的合稱。而「資訊」就是受、想、行、識的結果──「所知」,將無形的所知表現在有形的媒介上,由此或可暸解資訊與佛學研究的關係。

(三)資訊與阿含研究:阿含與資訊的對談

2004年10月30日中華佛學研究所佛學資訊學程舉辦一場專題演講,謝教授於「所知之相──談對資訊的理解與詮釋」中,對佛學資訊有許多特殊的見解。[3]該場演講引發楊老師對謝教授資訊解說的興趣,因而有2005年1月9日楊老師與謝教授於中研院的對談,此次的對談使資訊與佛學得以有機會深入法義的探討,並激盪出繽紛的火花。

當天,就謝教授的「所知之相」,楊老師先釐清為:所謂「所知之相」就是信息理解或所理解的所了知的訊息,這個意象就是吾人所知之相。之後,他進一步詮釋「所知之相」或也可解釋為「使知之相」──也就是作者擬讓讀者暸解的部份。

會中,楊老師先就佛音論師《清淨道論》以五蘊的想蘊、識蘊解說知識論、認知論。其次,他提出佛教的不共之處──「般若慧」,以進一步說明其三者的異同,並分別以saṁ-√jñā「共知」、vi-√jñā「分別而知」、pra-√jñā「慧的知」(「了脫生死的知」)來解說。也就是,他強調「般若慧」與「分別識」是不一樣的,但是卻也不能離開「想」跟「識」。於討論「般若慧」與「分別識」的異同之後,他提出「……這就是所知之相沒有錯,但是「使知之相」

p. 77

對老師、傳播者、傳道者是最重要的,因為不只是所知而已。使知,是先使自己知道,使自己開悟,然後把知道的內容,再以善巧的方式開示出去,而這個過程更麻煩。使知的目的是要使聽、看的人變成如已所知。」[4]於此,他強調「所知」與「使知」是有所不同,然如何「使知」就須有善巧的方法。

明瞭雙方對資訊與阿含研究的定義後,下文擬先回顧楊老師阿含學道的研究過程與電腦工具的應用經驗,並擬從其研究方法與資訊性質尋找共通處,以探討楊老師的阿含研究方法與資訊的關係。進而瞭解阿含資料數位化作業的可能性。

二、楊老師的阿含研究方法與資訊特質

(一)楊老師的阿含研究過程、教學及出版

為方便下文相關事件的探討,故先將楊老師的學思、教學研究與出版發行時程簡列於下,以利探討其電腦工具運用經驗與資訊性質的追蹤。

1.緣起

回憶民國五十八年間,小學同窗薛松茂先生送我浙江省嘉屬七縣旅臺同鄉等印送 導師〈學佛三要〉薄薄一小冊;研讀後,確立學佛成佛為人生終極目標。[5]

2.皈依印老

於民國五十九年,和雙親及妻子,在導師允許、證明下,一同歸依三寶,成為正式的佛弟子;翌日,於嘉義天龍寺求授菩薩戒,成為正信的學佛行者。[6]



p. 78

3.依印老著作研讀

由導師所著法寶《印度之佛教》、《妙雲集》中篇及下篇、《原始佛教聖典之集成》等啟示,「佛法」的根本在《四阿含》及《五尼柯耶》;用心詳讀早期聖典,並介紹親友認識佛法。逐漸為緣所牽引,走上《阿含》研究之途;在這段過程中,隨時留意《阿含》學佛心要。[7]

4.研讀原典

啟迪研讀北傳四部《阿含》、南傳日譯五部《尼柯耶》。[8]

5.學習巴利語

為如實瞭解早期「佛法」,發覺直接研究第一手資料──巴利語經文──既必要又為充分之條件。由 慈惠法師協助,購得 水野先生之《巴利語佛教讀本》、《巴利語辭典》、《巴利語文法》三書。

從達和法師處請得巴利語四部《尼柯耶》;熱心求法之情意推動下,刻苦自修巴利語。[9]

6.授課

同修之間法談,時常以早期佛法傳布,乃至訛傳「專研阿含」,從此身陷教職;甚至,盛情難卻下,接受 中華佛研所專職。[10]

於民國七十二年九月起,應中華學術學院佛學研究所聘為兼任研究員,為研究生講授阿含。……民國七十九年四月起,接受了中華佛學研究所的禮聘,而為專任研究員。[11]



p. 79

亦即於1981年,楊老師四十五歲,開講「阿含經之研究」。並於1983年四十七歲,受聘於中華佛研所開授「阿含經之研究」。

7.撰寫出版

楊郁文老師繼續此研究方向。於民國七O年,將他多年的學習心得,並且運用歐美、日本的研究成果,融合成自己適用的風格,開始講授「阿含」。至今十餘年間,除了年年改編講義之外,尚有多篇論文發表於《中華佛學學報》等。此外,也協助《佛光大藏經》「阿含藏」(七二年出版)之編輯及撰寫四部《阿含經》的「題解」,日本的水野弘元先生(巴利語佛教研究當今最高權威)撰文對該「題解」稱讚,並且肯定其自成一家的研究風格,……。[12]

8.編輯《阿含辭典》

現代人應用漢譯《四部阿含》學習佛法,以筆者親身的體驗,遭遇到多重的困境;尋找種種佛學辭典、中文辭典等工具書,往往無法解決疑惑。許多問題是在對讀研究《四部阿含》與《五尼柯耶(pañca nikāyā)》的「相當經」時,得到解答;累積了許多處理過的資料,或許學術界及佛教界都可以用得到。不揣冒昧,向中華佛學研究所提出編輯《阿含辭典》工作計劃書,經審查通過,准予作為研究題目。[13]

楊老師在中華佛學研究所九十一年度專任研究人員論文發表會作第三次報告;並將「阿含辭典編輯體例說明」一文加以潤飾,發表於學報,該文即成為本測試的導因,及重要的參考文獻。

附表:楊老師於中華佛學研究所授課之前的個人重要紀事表[14]



p. 80

西元 年歲 楊老師進入佛研所授課之前的個人重要紀事
1937 1 出生於雲林縣斗南鎮
1967 31 閱讀《金剛經注解》,開始接觸佛法
1968 32 透過臺灣印經流通處購書,廣泛閱讀佛書
1969 33 閱讀《學佛三要》,確定自己正信三寶
1970 34 由印順導師授戒
1971 35 閱讀《大正藏》
1972 36 閱讀《印度之佛教》
1973 37 閱讀《妙雲集》
1974 38 開始在斗南居士園為居士們講授學佛心得
1976 40 開始在妙雲蘭若、嘉義大專院校講授《雜阿含經》
1977 41 遷居至臺北
1978 42 閱讀日譯《南傳大藏經》
1980 44 開始在北部能仁學會、佛光山女子佛學院等地講授《雜阿含經》
1981 45 在靈山佛學研究所講授「阿含經之研究」;審訂《佛光阿含藏》,雜阿含等四部提供題解
1982 46 開始自修巴利語
1983 47 受聘於中華學術院中華佛學研究所(迄今)

(二)楊老師的阿含研究與電腦工具的運用

從上述楊老師阿含研究、教學時程與重要記事簡表,可大略知道其教學、研究、寫作的時程。從上表亦可瞭解,楊老師是1980年在能仁學會、佛光山女子佛學院等地講授《雜阿含經》,1981年在靈山佛學研究所講授「阿含經之研究」;編寫、審訂《佛光阿含藏》。這段時間也剛好是臺灣早期電腦業,剛由電動玩具業轉入與蘋果電腦相容的Apple II時期。吾人也瞭解學者的研究、寫作往往與其運用的工具有關。譬如,楊老師的教學與教材的編寫,除了早期部分資料是用手寫以外,後來皆以文書處理機或電腦做為其應用的工具。

或也可說,臺灣電腦的發展歷史,大致上也是楊老師的電腦工具運用的各個不同階段:[15]



p. 81

1.文書處理機與漢通電腦

1980年美國蘋果公司於美國上市並造成轟動。同一時期,於1980至1989年間,臺灣神通電腦公司也推出第一套中文終端機,名為漢通,並發明中文簡捷輸入法,取得專利。[16]楊老師也同步由文書處理機,改為漢通電腦的使用,並運用其輸入法做研究與講義,這些講義可說是目前所用阿含資料的雛型。

2. DOS作業系統/ PE2文書處理

在軟體方面,從1980年代初,臺灣已有早期的中文文書處理軟體PE2上市,並發展了全套的「細明體」漢字字型。

同一時期,臺灣發展出架構於DOS作業系統下的「倚天中文系統」,但這個系統卻不是獨立的系統,必須在英文DOS之下運作。而早在1980年左右,臺灣的各電腦廠商即各自制定了中文的電腦字集與內碼,至1984年Big-5內碼的制定(包括13,051個傳統正體漢字及408個符號),並於1990年左右被Microsoft視窗中文版(Windows 3.1)所採用,而首先有了世界最早普及的中文內碼。[17]

這段時間,楊老師也開始使用16位元電腦,運用PE2 & PE2 Pro.等軟體,並以倚天詞庫檔建構相關詞庫資料,處理阿含文獻資料。

3. Windows作業系統/ Micrsoft office

之後,因為有32位元Windows作業系統,所以在處理中英梵巴的轉寫字就較方便,楊老師即利用造字檔建構符號、標點及特殊字,而這些功能超越原先16位元PE2(ASCII, PE2 Pro.)的方式良多,所以很多寫作上的需求都較容易達成,呈現與閱讀也較方便。同時,在32位元Windows下可以用「倚天詞庫檔」,同時也可輸入需要的「標點符號」以及做「輸入定位」等等功能。而之後又有Foreign 1, Foreign 2的梵巴的轉寫字型,讓輸入的文章較為方便,且能正確顯示原文。這段時間用電腦做出的資料,可說是楊老師阿含相關出版品的定型基礎。



p. 82

4.網路資源與CBETA電子佛典

進而,為能達到存取合理化,楊老師開始利用Windows的「檔案總管」(Window Commander/ Window Explorer)的功能以及龍捲風InfoReach的檢索等,並使用特殊符號及連結等功能。近年來,更善用網路資源,及運用CBETA電子佛典的經文資料整理《阿含辭典》。

(三)楊老師的佛學研究與資訊性質之共通

至於楊老師的佛學研究與方法,如前所述有其獨特之處,而這些特色恰與資訊的性質有共通處。[18]多位學者亦有同感,故試從下列引文資料的描述中,尋找楊老師的資訊性質。

首先應暸解,資訊時代數位文獻的一大特性就是可做「文本相互參照」,譬如運用超文件(Hypertext),將相關之文獻資料加以連結,以使相關文本之間互相參考。同時,採用TEIText Encoding Initiative)國際文獻標準的XML標記,除了在數位典藏與保存上,具有較佳的一致性之外;還可以與其他的漢語文獻作資料交換。甚至,可與其他的佛典語言系統(如巴利文、梵文、藏文等)作資訊交換。而數位文獻用XML標記,將方便標記後的資料,因應使用者的需求,撰寫程式提供各種功能設計,舉凡查詢、比較、統計、列印、傳送等,讓使用者在閱讀、使用及研究工作更加得心應手。進而,在網路普及的資訊時代,數位資料上網,將使檔案傳輸及資源分享無遠弗屆,甚至可提供網路化的教學,在佛法的推廣上帶來了前所未有的普及可能。

繼而,從楊老師的著作及介紹中尋找其特性。他於《阿含要略》自序就很清楚提到該書的特性:「本講義對種種佛法之關鍵語,依阿含法、義作『重點的』敘述;每章節之間,有『連線的』看法;許多 表解 幫助『全面的』觀察;至於『整體的』體會佛法,惟有歷經 聞、思、修、證,解、行雙運,正確地 應用佛法於日常生活、宗教生活當中。『目錄』及『索引』提供『研究佛學』、『學佛修行』之資訊檢索。」[19]誠如他於自序所言,整本書的結構就是由點、線、面建立起整體的架構,就如資訊時代運用超連結(Hyper Text)的特性建立文件的知識結構般,他先建立佛學名相的知識點,再以點與點互相連結串出知識線,進而建構起阿含學的知識面、阿含道行解相應的整體架構,

p. 83

並將知識整體運用於日常生活的「研究佛學」、「學佛修行」中。而且,於《阿含要略》的「目錄」與「索引」已提供有如現今的網路檢索功能。可知,這些構想與功能與資訊性質吻合。

釋惠敏教授於《阿含要略》出版感言中,更清楚地引出楊老師的資訊思考特性:「國際上尚無如《阿含要略》之編著方針的書籍。我個人使用的角度是:(1)狹義上,作為研讀浩瀚如海『阿含藏』的指南。因為這是編者近二十年之研究與實踐心得(見其書如見其人),後人可『按圖索驥』直探精華,無有『歧路亡羊』之慮。此外,因為隨處付有引文,無查尋『阿含藏』之勞,但仍須養成勤查原文的習慣,以免有『斷章取義』之失。(2)廣義上,當成一部有系統、有次第、可以從頭讀到尾的『重要佛學名相辭典』。因為它有使用方便的號碼目錄、索引與表解,並且各條目間有點、線、面、體的互相關連性,無有『支離破碎』之弊。」[20]可知,該書的編輯方式,幾乎是掌握資訊的性質,以超連結的方式隨處將阿含藏經文,就如在網頁點選一樣的簡易方便。並以點、線、面、體的互相關連性建立起系統與次第,這就如知識樹(Knowledge tree)的建構,並可由名相連結到藏經內文,也可建立良好的科判架構(Outline)。

同時,作者在《阿含要略》一書的自序中說明此書是:「以『教』、『理』法義為『緯』,『行』、『果』次第為『經』,探討『原始佛教』之佛法。」作者認為,阿含即是一完整的學佛修道、乃至成佛的道次第,包括增上善學、增上信學、增上戒學、增上心學、增上慧學、正解脫學、實證解脫等七個次第,本要略,便是依照這樣的次第匯集編著而成的。[21]

楊老師以佛法法義為「緯」,修行次第為「經」,探討佛法的思路,並依《阿含經》建構出詳明的學佛修道的次第,誠如聖嚴法師所讚嘆:「他對阿含經所下的對讀、分類、組織,條分縷析,細入牛毛,明察秋毫。」[22]上述介紹資料在在都顯示出楊老師的對讀、分類、組織,條分縷析之特質。

三、阿含資料與數位化作業的可能

有關上述楊老師的思維表達的資訊特質,可於其兩份體例說明,清楚看出:



p. 84

(一)《阿含要略》略符說明

在《阿含要略》的略符中,楊老師提出許多特殊符號與用法,如:以符號指出引用之經文/論文出處,或指出參考之經文/論文出處。或文字之前或後省略,有如網頁的超連結運用超文件(Hypertext)功能,達成「文本相互參照」的資訊特質。

同時,也以各項符號表示邏輯思考模式,如:以符號表明作用/因果,或前後兩句(段)意義有關聯,或前後兩句(段)意義相反等描述。或A包含、包括、含有BBA之內,A includes B)、B屬於AB is a member of A / B is belonged to A)、A派生BA developed to B, A becomes B)、AB派生(A developed from, A from B),以及等於、相等,不等於、不相等,或甲,或乙,或甲及乙 等符號表示文本的資訊關係。[23]有關略符圖示詳如下表[24]。(參下頁)

(二)《阿含辭典》編輯體例

楊老師正編輯中的《阿含辭典》,其於2003年發表的編輯體例說明中,[25]他以辭條分類做說明,共分為:[經典]、[術語]、[音譯,咒語]、[多義/岐義]、[詞性]、[特殊術語]、[法數]、[修行]、[中古漢語]、[句讀]、[《高麗藏》本錯字]、[有待商榷的譯語]、[大正本漏字、錯字]、[中文大辭典所缺]等十四種分別說明。同時,作者於編輯緣起提到編輯此辭典的主要目標為:

1.協助讀者普遍乃至深入瞭解漢譯《四部阿含經》針對
a. 以漢文瞭解佛法的華人及華裔,
b. 受漢文化薰陶的東亞各國人士,
c. 研究東亞文化的歐美人士。
2.輔助瞭解南傳《五尼柯耶》。
3.兼顧學術的瞭解與宗教的實踐。
4.導引讀者隨順佛教,依法奉行,成就完人。
5.方便使用辭典。

p. 85

6.可當《四部阿含》及《五尼柯耶》的索引使用。
7.提供資料給相關辭典使用。

此編輯體例說明,再次顯示楊老師的資訊特質,亦是本測試的主要參考資料,故詳細內容當於下文繼續分析。[26]於此要強調的是,從上述工作目標可以清楚瞭解作者不但是由資訊定義的「所知」進入「使知」,並親自起而行付諸實踐,具將之應用在生活上的務實性格。



p. 86

就如楊老師的研究與教學重在實踐,其「起而行」、「付諸實踐」、「應用於生活上」務實的實踐性格。恰與本所培訓具數位化能力的佛學人才,參與各項佛教數位文獻的作業、及建構佛教數位典藏的實踐課程性質相同。因此,本文於進入實務演示之前,擬先就佛學資訊的實踐性方面做一簡介。

(三)實踐:佛學資訊學程與數位實作

佛法的實踐方法,根據楊郁文居士編著《阿含要略》,佛法目的在於實踐,佛法基礎即在要求實踐增上善學、增上信學、增上戒學、增上意(定)學、增上慧學。由此五個大項目而衍出三藏教典。[27]

楊老師於前述的對談中提到「不只是使知,還要起而行,影響到他們知道之外,也要付諸實踐,實踐在生活上。」也說「佛法談的是人或者有情,不能離開人跟人的生活來說明一切,離開人生說明的話是沒有用的廢話。」[28]

同時,謝教授於2002年在中華佛學研究所的演講中也提到:「資訊科技帶來的影響也是雙軌的,一是它承載的內容,一是它的形式帶來的。從文字變成多媒體,從紙面變成電腦,不只是我們把電子藏經做好,把《大藏經》傳播出去以後,期望對大家的思想有改變、有影響就了事。承載電子藏經的數位媒介本身對生活上、事業上的影響,可能比藏經內容所帶來的影響更大;這是非常重要的事──我們不能掉以輕心。」[29]

佛學資訊學程,正是這樣的一個起而行的實踐課程,中華佛研所也瞭解到「承載電子藏經的數位媒介本身對生活上、事業上的影響,可能比藏經內容所帶來的影響更大」。是以,本所面對這一挑戰,開始起而行的實踐──開設佛學資訊學程。

配合時代的發展,以佛學資訊作為研修方法已成為重要的課題,而佛學資訊的研修課題包含了語言、

p. 87

文化、史地等,這些良好的傳統,發展至今卻已受到嚴重的威脅與斷層,值此數位時代或是一大轉機,可將此良好的文化傳承,經由佛學資訊的再造與保存及研究,而有不同的發揮,這樣的演化由歷代知識載體的改變,可見知其發展及影響。

因此,為迎接資訊時代的來臨,具備資訊素養與資訊能力的研究者已成為重要的學術研究基礎。本所精心規劃,如何培訓具數位化能力,參與各項佛教數位文獻的作業,以及建構佛教數位典藏的佛學資訊人才。有關課程的設計,是以學生能完成宗教數位文獻(Digitize a manuscript)、佛教文物典藏(Cultural archive)、數位版本(Digital edition)等資訊素養的養成為主。進而,以宗教與教育(Religion and Education),人文素養(Theoretical aspects of humanities capacity),宗教藝術(Religious art)等元素,與宗教研修教育的搭配作為主要規劃原則。

撰寫此文的目的之一,也是期能對讀者有所啟發,期能吸引更多兼具佛學及資訊知能的人才、具佛法數位學習及知識管理之應用及研發能力的人士共同參與此行列,以進行佛教資訊之相關研究及教育工作,並發展佛學數位學習、建立資訊時代之佛教學習環境,促進佛教教學研究之創新與變革等規劃為目標。

固然國際間已有相當數量的巴利文獻數位資源,依蔡奇林的著作與演講資料整理,[30]可大略瞭解到目前巴利相關數位資源,雖於原典、文獻及語言工具等方面已達相當數量,[31]但是大部分未能以符合國際標準之XML / TEI標記方式作業。

p. 88

對於數位文獻的運用,或不能達到資訊發展的需求,因此試做本測試並報告於下。

四、實務說明:以《阿含辭典》數位化研究為例──阿含辭典製作工作流程

(一)辭典編輯格式確認

為使阿含電子辭典能符合作者的彙編原意,經訪問《阿含辭典》原作者──楊郁文老師,作辭典的編輯格式確認。共完成四類彙編方式確認,包括:辭條分類、四角號碼、梵巴對照、特殊標號等,茲再分別加以說明。

1.辭條分類

辭條以【】實心括號表示,辭條分類用半形[ ]中括號表示,共分為:[經典]、[術語]、[音譯,咒語]、[多義,岐義]、[詞性]、[特殊用語]、[法數]、[修行]、[中古漢語]、[句讀]、[高麗藏本錯字]、[有待商榷的譯語]、[大正本漏字]、[中文大辭典所缺]等十餘種。以下列出各辭條分類之說明或範例:

(1)[經典]

《四部阿含》中,《長阿含經》及《中阿含經》皆有經名,而經文頗長,內容豊富;在各別經名條目下,提供經義主旨給初學者參考;附參照、參考經典給研究者應用。

(2)[術語]

指佛法/佛教特殊用語、特殊說法,不共外道異學者。



p. 89

(3)[音譯,咒語]

人名、天名、地名、物名等專有名詞往往以譯經時代,當地漢語類似字音譯出;有時難解字句亦採用音譯。傳統上,譯經者譯音不譯義者,有「五種不翻」。

(4)[多義,岐義]

漢文乃至印歐語系的巴利語及梵語,有很多溝通符號同一字、同一詞而可以有「多義」:許多類似的意義,如本義以外衍生的意義,與別字/詞通用的意義;甚至有跟本不同的意義,這些字/詞的符號有「歧義(ambiguity)」。有多義或歧義的字/詞,在文章中、在會話時,給予閱聽者無謂的困擾。在漢譯的經典中(包含《四部阿含》)存在著許多歧義及多義名相、法句,給予學界研究者、教界的信徒,有時在理解佛學、修習佛道上無所適從。歧義的分析,除了由漢文上下文、語言脈絡可瞭解,之外,許多特殊的意義是在對讀南、北傳佛經「相當經」或「相當句」時,分析出來的;許多常見詞彙具有龐雜的歧義以後尚可作分類歸納簡化。

(5)[詞性]

漢譯經文,適應印歐語系的名詞及代名詞的曲用(declension)或者動詞的活用(conjugation)變化;翻譯時已經盡量在設法使漢語系的讀者認識並應用於思考脈絡中。

(6)[特殊用語]

望文而生義,據名以為必定有實,此乃人情之常;然,有特殊名相,以字面通常的用語解釋,誤解往往由此產生。

(7)[法數]

方便綜合佛法,易於記憶、傳誦、流通佛陀的教授、教誡。

(8)[修行]

佛教、佛法,不但給人聞、思而產生信心、瞭解而安心而已,更要求如理作意、依法實踐,到達自己解脫惑、業、苦,並充實教化導引他人同樣完成人人自己作證究竟涅槃。



p. 90

(9)[中古漢語]

魏晉南北朝,譯經用佛化漢語。

(10)[句讀]

中國古籍(包括漢譯三藏)出版,往往不加句讀,同一章節的文字,由於句讀的不同,其意義可能改變,甚至呈現相反的意思。

(11)[高麗藏本錯字]

高度要求精確校刊的《大正藏》仍然保留少數的高麗藏本錯字。

(12)[有待商榷的譯語]

雖然求那跋陀羅(Guṇabhadra)法師手執梵本已遺失,尚且很可能不是巴利語本,但是學界共認,《雜阿含經》與《相應部經典》出自同原,所謂《相應阿含(Saṁyuttāgama)》,因此有些經中記載可以互相參考,並且可以認定所說方式一樣或者類同,或者可以推論某些譯文、譯語,有待商榷。

(13)[大正本漏字]

重新排板的《大正新修大藏經》,有錯植字及欠漏字。

(14)[中文大辭典所缺]

《中文大辭典》1973第一次修訂版,包含補遺,共收集單字49905字,辭彙371231條,都八千萬言;為古今歷代中文辭書之集大成;然在《四部阿含》裡有些詞彙不見於《中文大辭典》,今收入《阿含辭典》中。

2.四角號碼

每個辭條均賦予一組「王雲五四角號碼」,依號碼大小排列(最多六碼),以漢文方塊字,每角取一數目,每字四位數標出,每字只採用前二碼。如:鹽7810,喻6802,經2190。所以《鹽喻經》的字碼為786821。

3.梵巴對照

辭典中若有漢文與巴利文及梵文的對照,會依字母順序排列。其中(SK)表梵語字,(P)表巴利語字,(PK)表古代梵語方言。



p. 91

4.特殊標號

辭典內的各項標示或標號,其體例說明整理如下表:

標  示 說  明
786821 阿拉伯數字標示詞條──「王雲五四角號碼」。
【 】 實心括號,夾住本詞條。
〖 〗 空心括號,夾住參考的詞條。
﹝ ﹞ [經典][術語]……[雜語]等等,為詞條分類,幫助讀者認識其類,方便瞭解、修行用;有許多情況是很難以區別它們。大正藏《大藏經索引》有五十主要分類項目,某一分類下,再細分多至八目;難免煩瑣之嫌。
[ ] 方括弧內的文字,為譯經者(或者傳誦者)所省略,今為方便讀者瞭解而補充。以下同例。
( ) 圓括弧內的文字,為筆者夾註,幫助瞭解經義。
「 」
『 』 引號
(( )) 夾注號。
難解詞彙的說明;無確實根據的筆者臆度內容。
提示符號。
指出參考之經文/論文出處。
按:  
ref.reference(參考/參照)的縮寫符號。
etc. et cetera(等等/及其他等等)的略字。
cp.compare(比較/對照)的縮寫符號。
指宋、元、明三版本大藏經。
①②…… 同一字詞出現新義的順序的排列,是以閱藏時所遇到的先後順序,亦即按《大正藏》編排的順序,由第1冊到第2冊,由《長阿含》→《中阿含》→《雜阿含》→《增一阿含》。一般字典、辭典,解釋的順序是「本義」→「引申義」→「假借義」安排,或以現代人使用頻率高低為先後出現。今《阿含辭典》是以協助有心人閱藏的方便或研究用,作上述的安排;有機會另外整理,提供給初學用、或宗教徒信、解、行、證用者,可依一般辭典編輯方式,簡單化進行之。
P 指巴利語


p. 92

SK 指梵語
S. 22, 81 Parileyya 指相應部第22相應第81 Parileyya經;S. 為《相應部》的略字,D. 指《長部》,M.《中部》,A.《增支部》。
(大)1,433a11~434a10 指出處在《大正藏》第1冊433頁上欄第11行至434頁上欄第10行為止;(大)為《大正藏》略符。

(二)執行數位檔案轉換

1.將特殊符號轉換為標記

(1)上標數字取代為 <sup>

阿含辭典中的特殊字型格式,例如每個辭條前均有四角號碼,後面二個數字為A1字型上標數字,如77²¹覺 。必須做轉換處理,才能正常呈現於純文字檔。所以需先將四角號碼上標取代為標記<sup>,轉換成為77<sup>21</sup> 覺 。同樣的,辭典內其他的特殊字型格式,也必須加上標記做轉換。例如,[正字]常為遠 →[正字] <u></u>為遠」,即將底線字格式取代為標記<u>

因為原始檔案為Word檔,故採用Macrosoft Word提供的取代功能來做轉換,並將其步驟錄製為巨集,以方便批次處理。

接著需再按『格式』按鈕,選取字型為「A1」,效果為「上標」,再按『全部取代』按鈕即可完成轉換。以下摘錄轉換前後的辭條對照:



p. 93

原文
77²¹  覺
  ①1,19a⁻¹², 19b;2,71a¹³; 344a⁻¹³; 371a¹⁷ [雜語] (生理) 指沒入眠的覺醒者。『覺』1,19a⁻¹²相當於“jāgara (覺醒者/清醒的人)”〈D〉ⅱ. 130⁻⁸的意譯。☞〖覺悟①〗〖開覺④〗〖覺寤〗;cp.〖覺
  『雷動天地,覺而不聞』1,19a⁻⁸f. 雷霆響動天地,修定而保持覺醒狀態者不聞雷聲。
轉換後
77<sup>2</sup><sup>1</sup> 覺
  ①1,19a<sup>-</sup><sup>1</sup><sup>2</sup>,19b<sup>4</sup>;2,71a<sup>1</sup><sup>3</sup>;344a<sup>-</sup><sup>1</sup><sup>3</sup>; 371a<sup>1</sup><sup>7</sup> [雜語] (生理) 指沒入眠的覺醒者。『覺』1,19a<sup>-</sup><sup>1</sup><sup>2</sup> 相當於“jāgara(覺醒者/清醒的人)”〈D〉ⅱ. 130⁻⁸ 的意譯。☞〖覺悟①〗〖開覺④〗〖覺寤〗;cp.〖覺
  『雷動天地,覺而不聞』1,19a<sup>-</sup><sup>8</sup>f. 雷霆響動天地,修定而保持覺醒狀態者不聞雷聲。
(2)轉寫字 取代為entity

辭典中的巴利文及梵文係採羅馬轉寫的A1字型,也必須先做轉換處理,才能正常呈現於純文字檔。例如vedanā(感受),長音『ā』必須先取代為entity,即『&#x0101』,轉換前後的對照,詳如下表:

原文
1,599b⁻¹³[慧學]對『覺/受(/感受)』的種種如實知。『覺』1,599b⁻¹³相當於“vedan(感受)”〈Aiii. 410¹¹的意譯。☞〖覺③〗
『(1)云何知覺?謂 有三覺──樂覺、苦覺、不苦不樂覺。(2)云何知覺所因生?謂 更樂(♣觸)也;因更樂則便有覺。(3)云何知覺有報?謂 愛也;愛為覺報。(4)云何知覺勝如?謂 覺樂覺時(感覺樂受時),便知覺樂覺;覺苦覺時(感覺苦受時),便知覺苦覺;覺不苦不樂覺時(感覺不苦不樂受時),便知覺不苦不樂覺。樂身、苦身、不苦不樂身,樂心、苦心、不苦不樂心,樂食、苦食、不苦不樂食,樂無食、苦無食、不苦不樂無食,樂欲、苦欲、不苦不樂欲,樂無欲覺、苦無欲覺、不苦不樂無欲覺時,便知覺不苦不樂無欲覺。(5)云何知覺滅盡?謂 更樂滅,覺便滅(盡)。(6)云何知覺滅道?謂八支聖道──正見⋯⋯乃至正定為八。


p. 94

轉換後
  ⑫ 1,599b<sup>-</sup><sup>1</sup><sup>3</sup> [慧學]對『覺/受(/感受)』的種種如實知。『覺』 1,599b<sup>-</sup><sup>1</sup><sup>3</sup> 相當於“vedanā(感受)”〈Aiii. 410<sup>1</sup><sup>1</sup> 的意譯。☞〖覺③〗 『(1)云何知覺?謂 有三覺──樂覺、苦覺、不苦不樂覺。(2)云何知覺所因生?謂 更樂(♣觸)也;因更樂則便有覺。(3)云何知覺有報?謂 愛也;愛為覺報。(4)云何覺勝如?謂 覺樂覺時(感覺樂受時),便知覺樂覺;覺苦覺時(感覺苦受時),便知覺苦覺;覺不苦不樂覺時(感覺不苦不樂受時),便知覺不苦不樂覺。樂身、苦身、不苦不樂身,樂心、苦心、不苦不樂心,樂食、苦食、不苦不樂食,樂無食、苦無食、不苦不樂無食,樂欲、苦欲、不苦不樂欲,樂無欲覺、苦無欲覺、不苦不樂無欲覺時,便知覺不苦不樂無欲覺。(5)云何覺滅盡?謂 更樂滅,覺便滅(盡)。(6)云何知覺滅道?謂八支聖道──正見⋯⋯乃至正定為八。

2.將word文件轉為純文字檔

完成標記轉換的word doc檔案,再以另存新檔的方式,轉換為純文字txt檔案。再以python程式去除重覆標記,例如四角號碼77<sup>2</sup><sup>1</sup>變成77<sup>21</sup>;並將造字字型轉為標記或Unicode,例如『』轉成『<circle n="大"/>』等。如下:

77<sup>21</sup>【覺】
  <circle n="1"/><circle n="大"/>1,19a<sup>-12</sup>,19b<sup>4</sup>;<circle n="大"/>2,71a<sup>13</sup>;344a<sup>-13</sup>;371a<sup>17</sup> [雜語](生理) 指 沒入眠的覺醒者。『覺』<circle n="大"/>1,19a<sup>-12</sup> 相當於“jāgara (覺醒者/清醒的人) ”〈Dii.130’2 的意譯。☞〖覺悟<circle n="1"/>〗〖開覺<circle n="4"/>〗〖覺寤〗;<cp/>〖覺<circle n="30"/>
   『雷動天地,覺而不聞』<circle n="大"/>1,19a<sup>-8</sup>f. 雷霆響動天地,修定而保持覺醒狀態者不聞雷聲。


p. 95

3.將造字轉換為Unicode或標記

辭典檔案中的造字文字,需轉換為Unicode;若Unicode無適當對應者,採用標記方式表示,例如『』的造字編碼為『fddc』轉成『<circle n="大"/>』等。轉換對照(造字字碼,A1字型,Unicode或標記)詳如下表:


fa40, ,【
fa41, ,】
fa48,
fa4b, ,<circle n="1"/>
fa4c, ,<circle n="2"/>
fa4d, ,<circle n="3"/>
fa4e, ,<circle n="4"/>
fa55, ,<circle n="5"/>
fa56, ,<circle n="6"/>
fa5b, ,<circle n="7"/>
fa5c, ,<circle n="8"/>
fa5d, ,<circle n="9"/>
fa63, ,<circle n="10"/>
fa64, ,<circle n="11"/>
fa65, ,<circle n="12"/>
fa66, ,(11)
fa71, ,(12)
fa73, ,(1)
fa77, ,(2)
fa7b, ,(3)
fa7c, ,》:
fa7e, ,〉:
faad, ,恠
faae, ,<circle n="13"/>
faaf, ,眾
fab2, ,(4)
fab5, ,(5)
fac1, ,强
fac2, ,<circle n="14"/>
fac3, ,<circle n="15"/>
fac4, ,<circle n="16"/>
fac5, ,<circle n="17"/>
fac6, ,<circle n="18"/>
facd, ,<circle n="19"/>
 ,〈V

fad2,,(6)
fad5,,(7)
fadb,,<circle n="20"/>
fae3,,(8)
fae4,,(9)
fae9,,(10)
fafb,,(13)
fafe,,<circle n="21"/>
fb40,,<circle n="22"/>
fb41,,<circle n="23"/>
fb42,,<circle n="24"/>
fb43,,<circle n="25"/>
fb44,,<circle n="26"/>
fb45,,<circle n="27"/>
fb46,,<circle n="28"/>
fb47,,<circle n="29"/>
fb48,,<circle n="30"/>
fb49,,<circle n="31"/>
fb4c,,<cicle n="同"/>
fb6d,,叚
fb7e,,鉢
fba4,,<cicle n="反"/>
fbca,,․
fbd6,,…
fbd7,,ⅰ.
fbd8,,ⅱ.
fbd9,,ⅲ.
fbda,,ⅳ.
fbdb,,ⅴ.
fbfd,,<ref/>
fc45,,『
fc46,,』
fc49,,﹝
fc4a,,﹞
 

fc4e,,⇨
fc5d,,☞
fc78,,呪
fc7b,,<cp/>
fcd0,,〖
fcd1,,〗
fcdd,,�
fce5,,etc.
fcf6,,无
fd53,,〈A
fd54,,〈D
fd55,,〈M
fd56,,〈S
fd57,,〈
fd58,,〉
fd59,,《
fd5a,,》
fd5d,,ʻ
fd5e,,ʼ
fd66,,<circle n="Sk"/>
fd6c,,♣
fd72,,却
fd73,,慙
fdba,,!
fdbc,,「
fdbd,,」
fddb,,<circle n="宋"/>
fddc,,<circle n="大"/>
fde3,,<circle n="麗"/>
fde4,,<circle n="二"/>
fde5,,<circle n="三"/>
fef6, ,。
fef7,,、
fef8, ,,
 


p. 96

4.純文字檔轉為xml檔案

使用python程式將純文字檔加上TEI的標記,轉換為xml文件。辭條標記為<form>,如<form></form>;四角號碼標記為<fc>,如<fc>77<sup>21</sup> </fc>;說明標記為<sense n="1">,其中n表示辭條編號,加上標記之xml文件,樣式範例摘錄如下:


<TEI>
<entry>
  <form></form>
  <fc>77<sup>21</sup></fc>
    <sense n="1">
    <circle n="大"/>1,19a<sup>-12</sup>,19b<sup>4</sup>;<circle n="大/>2,71a<sup>13 </sup>; 344a<sup>-13</sup>;371a<sup>17</sup>[雜語](生理)指沒入眠的覺醒者。『覺』<circle n="大"/>1,19a<sup>-12</sup> 相當於“jāgara (覺醒者/清醒的人)”〈D〉ⅱ.130’2的意譯。□☞<ref target="覺悟#1"/><ref target="開覺#4"/><ref target="覺寤"/><cp/><ref target="覺#30"/>
       『雷動天地,覺而不聞』<circle n="大"/>1,19a<sup>-8</sup>f. 雷霆響動天地,修定而保持覺醒狀態者不聞雷聲。
 </sense>
 
  <sense n="2">
  <circle n="大"/>1,23c<sup>19</sup>,c<sup>20</sup>;50c<sup>19 </sup>;
  75a<sup>-11</sup>;422b<sup>12</sup>,b<sup>15</sup>;789c<sup>12</sup>;
  <circle n="大"/>2,97a<sup>7</sup>,a<sup>9</sup>;302a<sup>18</sup>;569a<sup>-6</sup>,a<sup>-3</sup>;729c<sup>9</sup>[定學]指 初禪的尋思禪支。『覺』<circle n="大"/>1,75a<sup>-11</sup>相當於“vitakka (尋思)”〈D〉ⅲ.131<sup>-9</sup>的意譯。<ref target="有覺"/><circle n="大"/>1,75a<sup>-11</sup>相當於“sa-vitakka (有尋)”〈D〉ⅲ.131<sup>-9</sup> 的意譯。 <cp/><ref target="覺#6"/>
     『聖弟子離欲、離惡不善之法,有覺、有觀,離生喜、樂,得初禪成就遊。』<circle n="大"/>1,422b<sup>11</sup>f.
     『覺、觀已息,內靜一心,無覺、無觀,定生喜、樂,得第二禪成就遊。』
  <circle n="大"/>1,422b<sup>14</sup>f. 第二禪以上,<ref target="覺#2"/><ref target="觀#6"/>已止息。
 </sense>
 
  <sense n="3">
  <circle n="大"/>1,435c<sup>-5</sup>;471c<sup>-9</sup>;524c<sup>15</sup>;584c <sup>-6</sup>;764c<sup>-12</sup>;765c<sup>9</sup> [教說](緣起)指 感受的知覺。『覺』<circle n="大"/>1,435c<sup>-5</sup> 相當於“vedanā (受/感受)”〈A〉ⅰ.176<sup>-6</sup> 的意譯。☞<ref target="覺#12"/><ref target="覺味#2"/>
     『因六處便有更樂,因更樂便有覺。』<circle n="大"/>1,435c<sup>-6</sup>f. 『因更樂便有覺』<circle n="大"/>1,435c<sup>-6</sup>f.相當於“phassa-paccayā vedanā (緣觸有受/由於觸之緣而有感受)”〈A〉ⅰ.176<sup>-6</sup> 的意譯。<ref/>《長阿含1大本經》: 『緣觸有受』<circle n="大"/>1,7b<sup>17</sup>
     『故起苦覺令息滅,未起苦覺令不起故。』<circle n="大"/>2,73b<sup>7</sup>f. 『故起苦覺』<circle n="大"/>2,73b<sup>7</sup>f. 相當於“purāa vedana (在前的((苦))受)”〈A〉ⅳ.167<sup>-7</sup>f. 的意譯。
 </sense>
 
  <sense n="4">
    <circle n="大"/>1,422b<sup>-12</sup>;<circle n="大"/>2,62c<sup>-7</sup>; 269a<sup>18</sup>;281a<sup>-4</sup>;819b<sup>-10</sup>[雜語]指 感覺到/經驗到。『覺』<circle n="大"/>1,422b<sup>-12</sup>相當於“patisa vedeti (感受/體驗[caus.])”〈S〉ⅳ.264<sup>-9</sup> 的意譯。
     『離於喜欲,捨無求遊,正念正智而身覺樂,謂聖所說:聖所捨、念、樂住空,得第三禪成就遊。』<circle n="大"/>1,422b<sup>17</sup>f.☞<ref target="身覺樂"/><ref target="空#4"/>
     『智慧多聞者, 非不覺諸受, 若於苦樂受, 分別諦明了。』<circle n="大"/>2,269a<sup>18</sup>f.
     『時,央瞿利摩羅得阿羅漢,覺解脫喜樂。』<circle n="大"/>2,281a<sup>-4</sup>f. 『覺解脫喜樂』指 感受到解脫的喜受樂受。
 </sense>
 
  <sense n="5">
  <circle n="大"/>1,497c<sup>15</sup>;634c<sup>-7</sup>;<circle n="大"/>2,186c <sup>8</sup> [行位]指 聲聞弟子的覺悟──正見、正覺。
     『世尊為最勝, 世尊不邪思, 瞭解覺諸法, 我受最勝法。』
<circle n="大"/>1,497c<sup>14</sup>f.
     『度漏斷邪疑, 禮佛勝伏根, 若彼覺諸法, 二得昇進處。』
  <circle n="大"/>1,634c<sup>-8</sup>f.
 </sense>
 
  <sense n="6">
  <circle n="大"/>2,16b<sup>-5</sup>[邪見]『無』指 斷滅見的無我──邪見。□☞<ref target="言有…"/><cicle n="反"/><ref target="有#7"/> 『言︰「無。」』<circle n="大"/>2,16b<sup>-5</sup>
 </sense>
 
  <sense n="7">
  <circle n="大"/>2,45b<sup>-1</sup>[正字] 『若無五欲娛樂,是則見法涅槃。』<circle n="大"/>2,45b<sup>-1</sup>f.『無』<circle n="大"/>2,45b<sup>1</sup>宜刪,作︰「若五欲樂,是則見法涅槃。」按:此乃邪見。□<ref target="見法涅槃#2"/>
    <ref/>《長.21 梵動經》: 『諸有沙門、婆羅門作是見、作是論說︰「我於現在五欲自恣,此是我得現在泥洹。」是第一見。』<circle n="大"/>1,93b<sup>-14 </sup> f.
</sense>
</entry>
</TEI>


p. 99

(三)辭典呈現程式設計

為使阿含辭典便於使用者檢索,呈現介面採用C# 程式撰寫,後端則採用MS Access關連式資料庫,資料係由XML文件轉入,全部辭典的呈現程式設計,分為後端資料庫及使用介面兩部份來說明。

1. XML轉入資料庫

使用pythonxml2mdb.py)程式將xml文件(agama.xml)轉為Access關連式資料庫(agama.mdb)格式。主要包含三個欄位:a. 識別碼──紀錄辭條序號。b.『term』──辭條名稱。c.『def』──辭條的詳細說明。agama.mdb之資料表若以Access開啟,就可以清楚的見到如圖1的資料庫的樣式及內容。

圖1 辭典Access資料庫

2.使用者介面設計

使用者介面程式採用C#程式撰寫,提供使用者查詢阿含辭典的相關辭條,後端連接MS Access關連式資料庫(agama.mdb),將查結果送到介面視窗中呈現出來。其使用範例如,簡介說明如下:

例如,想要查詢阿含辭典內,有關「無」的詞條解釋或相關說明。則先啟動agama-dictionary.exe執行檔,

p. 100

就會出現辭典查詢介面,如圖2所示,在左上角的查詢欄中,輸入「無」字,再按 Enter 鍵;若辭典中有此辭條存在,則會出現在左欄中,再於左欄該辭條上以滑鼠點選,查詢結果即出現在右欄中。

圖2 辭典介面程式查詢功能



右欄的查詢結果,若數量超過欄寬,則用右側的scroll bar往下捲,可以看到所有的辭條說明。有些說明含有其它的相關詞,如圖3的第(6)項說明文字中內含相關說明【有(7)】,下方的底線表示存有超連結(HyperLink),可以滑鼠點選連結看到相關說明。

圖3 辭典介面程式連結功能



p. 101

點選連結後,右欄會出現新的說明資料,即辭條「有」字的第(7)條說明,如圖4。使用者同樣可用右側的scroll bar往下捲,也能看到其它的說明,方便使用者進一步的交互查詢。

圖4 辭典介面程式查連結顯示

五、檢討與建議

(一)辭典數化的優點

本文在阿含數位辭典的實作上,所採用的工作方式,與傳統的數位化編輯方法有很多不同,其優點之處,茲以典藏的一致性、功能的擴充性、流通的普及性、資訊的交換性等四個面向加以討論。

1.典藏的一致性

雖然《阿含辭典》已經使用MS WORD文書處理軟體作編輯;然而,WORD係屬微軟公司特定商業程式,並非開放軟體,無法跨平台使用;若加上標記後以XML文件型式儲存,則可於任何電腦作業系統上使用。另外,本文數位辭典實作的XML標記係採用TEIText Encoding Initiative)國際文獻標準,所完成的數位辭典在典藏與保存上,具有較佳的一致性。

2.功能的擴充性

由於數位辭典採用XML的標記,可以方便將標記後的資料,因應使用者的需求,撰寫程式提供各種功能設計,舉凡查詢、比較、統計、列印、傳送等。

p. 102

數位辭典標記化後,使得附加功能更具擴充,讓使用者在閱讀、使用及研究工作更加得心應手。

3.推廣的流通性

數位辭典除了以檔案或光碟方式,跨不同平台使用外,未來也可以採用網際網路HTML文件方式呈現,在推廣與傳播上均有更好的流通性。特別是在網路普及的現代,數位辭典資料的上網,使得檔案傳輸及資源分享無遠弗屆,甚至可提供網路化的教學,在佛法的推廣上帶來了前所未有的普及可能。

4.資訊的交換性

數位辭典的實作,係採用TEIText Encoding Initiative)國際文獻標準的XML標記,除了在數位典藏與保存上,具有較佳的一致性之外;還可以與其他的漢語文獻作資料交換。未來,甚至可與其他的佛典語言系統(如巴利文、梵文、藏文等)作資訊交換。

(二)未來發展與精進

有關數位辭典的的進一步的發展與精進,可以隨著資訊技術的發展趨勢及使用者的需求,將XML標記後的辭典資料,撰寫程式提供進階與擴充的功能設計:

1.線上佛學辭典

XML辭典文獻,轉換為HTML文件呈現,以網頁方式製作線上佛學辭典資料庫,在網際網路上,可提供使用者作及時查詢(online search)及網路線上教學(e-learning)的功能。

2.文本相互參照

運用超文件(Hypertext)的型式,將相關之文獻資料(如阿含要略、阿含經文、當代阿含論文文獻、巴利文原典等)加以連結,以使相關文本之間互相參考。

3.跨語詞彙檢索

將各種特殊佛教詞彙與專有名詞解釋,建立多語言的字彙集(LEXICON),如英語、日語、韓語、泰語等,提供東亞及歐美各國佛學研究及文化研究的人士參考使用。

p. 103

(三)結語

由上述測試與介紹可知,將《阿含辭典》數位化的過程,需先將Word doc檔轉位純文字txt格式,再將純文字檔加上TEI的標記,之後再轉換為XML文件,這一部分的工作流程,於整體的數位作業上,有其佛學研究上的需求,但國際佛學的數位資源能以此方式作業的並不多。本測試雖先以阿含作測試,希望未來能拓展至所有的佛教文獻。因此於作法上,著重於以適用於人文科學的標記語言的實作,如文獻編碼(text encoding),SGMLStandard Generalized Markup Language,標準通用標記語言),HTMLHyperText Markup Language,超文件標記語言),XML/CSSeXtensible Markup Language,可擴展性標記語言),及Xpath, XSLT, XSL-FOXQREY等標記相關方法,進行文獻分析(text-analysis)等方式於佛學研究相關的語言學、文獻學上。

總之,期盼未來不但能進行完整的《阿含辭典》的數位化作業,繼而完成《阿含要略》及阿含相關研究資料的數位化。並以此經驗為基礎,進而數位化各項佛學研究文獻資料,期能有利於浩瀚佛典文獻於研究、寫作、教學、推廣與應用上。

(謹此感謝楊郁文老師,除提供資料作測試,並不厭其煩地親自解說與指導。)



p. 104

Āgama Research in the Information Age: The Digitization of the Āgama Dictionary


Aming Tu
Buddhist Informatics Program, Chung-Hwa Institute of Buddhist Studies
Ray Chou
Buddhist Informatics Program, Chung-Hwa Institute of Buddhist Studies
Shi Fa-Yuan
Buddhist Informatics Program, Chung-Hwa Institute of Buddhist Studies

Abstract

This article discusses Professor Yang Yuwens use of electronic tools in his research on the Āgamas, as well as the nature of information technology with respect to research methodology in Buddhist Studies. Additionally, it explains the procedures used in digitizing Professor Yangs Āgama Dictionary.

In the first section, this article defines the term information and discusses the relationship between information technology and research in Buddhist Studies, including Āgama research. Then it continues by exploring the commonalities between Professor Yangs research methods and the nature of information. Then it further explains the relationship between information technology and Āgama research in light of Professor Yangs dialogue on Āgamas and information with Professor Xie Qingjun.

This dialogue was sparked by a lecture given to the Buddhist Informatics program at the Chung-Hwa Institute of Buddhist Studies on October 30, 2004 by Professor Xie, entitledThe Known: Understanding and Interpreting Information.” On January 9, 2005 at Academia Sinica, Professors Yang and Xie engaged in a deep and stimulating dialogue on the relationship between information technology and Buddhist Studies.

Professor Yangs style of research and teaching emphasizes practice. His ideals ofstart practicing,” “put it into practice,” andapply it to your lifecoincidentally correspond with the Institutes own ideals embodied in training Buddhist scholars to be competent in information technology and in the policy that students participate in all stages of text digitization. Therefore, beforediscussing practical usage, this article first briefly introduces the practical nature of Buddhist informatics.

Finally, this article presents a sample, with explanation, of the procedure entailed in the digitization of Professor Yangs Āgama Dictionary. It concludes with an evaluation of this project and a discussion of the future prospects for Buddhist Informatics.

關鍵詞: 1.Āgama research  2.Āgama Dictionary  3.Buddhist Informatics  4.Definition of information  5.Procedures of textual digitization

(English abstract translated by Eric Goodell)

[1] 摘錄自謝清俊,〈談資訊的定義與性質〉,「資訊科技與社會轉型學術研討會」,1996.12.20(http://www.sinica.edu.tw/~cdp/paper/1996/19961220_1.htm)。

[2] 相關資料請參考謝清俊,〈網路資源對佛教之衝擊與影響〉,《佛教圖書館館訊》第15期,1998.09。或參照謝清俊,〈數位典藏的人文關懷與社會意義〉,《中華佛學研究所圖書資訊館遷館周年暨圖館週紀念特刊》,2002.12.04(刊於《人生月刊》第238期,或中華佛研所圖資館網頁

http://www.chibs.edu.tw/lib/sissue/html/p25_38.htm)。

[3] 謝清俊,〈知之相──談對資訊的理解與詮釋〉,「中華佛學研究所佛學資訊學程專題演講」。臺北:中華佛學研究所,2004.11.30。

[4] 改寫自〈楊郁文老師與謝清俊教授阿含與資訊的對談〉稿。臺北:中研院,2005.01.09。

[5] 楊郁文,〈《學佛三要》的啟示〉。收錄於釋恆清編,《佛教思想的傳承與發展──印順導師九秩華誕祝壽文集》(臺北:東大圖書公司,1995),頁15-30。

[6] 同前註。其他資料,亦可參照楊郁文,〈《阿含要略》自序〉,《阿含要略》(臺北:東初出版社,1993)。或《人生雜誌》第120期,所述:「十分慶幸宿世善根滋長,而立歲後 尚得淺植佛法大地;適逢 印順法師宴處嘉義妙雲蘭若,法雨潤澤雲、嘉、南,深受感化,請求證明,允許歸依三寶,進授賢聖戒,成為優婆塞。」頁38-39(1993.08.15)。

[7] 同前註。或參照釋聖嚴,〈序楊郁文居士《阿含要略》〉,《阿含要略》,或《法鼓全集第3輯第5冊:書序》(臺北:法鼓文化,1999-2000):「楊公在三十歲之後,由民間流傳的善書之中,接觸《金剛經》,啟發其正信,親近印順長老,執卷請益,解惑求證,並允為之說法皈依,成為三寶弟子。自此即根據印順長老的著述,啟迪研讀北傳漢譯四種《阿含》,以及南傳日譯五部《尼柯耶》,因此使他繼續探究,主攻阿含藏,自修巴利文。」

[8] 同前註。或釋聖嚴,〈序楊郁文居士《阿含要略》〉。

[9] 楊郁文,〈《阿含要略》自序〉。

[10] 同前註。

[11] 釋聖嚴,〈序楊郁文居士《阿含要略》〉。

[12] 釋惠敏,〈《阿含要略》出版感言〉,《阿含要略》(臺北:東初出版社,1993年)。或參照《阿含要略》自序:「為方便教學,十年前*於淨行法師靈山佛研所「阿含經研究」科目講課時,編著〈阿含經講義〉為底本,年年改編,於去年充實引用經文,編成〈阿含要略〉,應學生及同修之要求,今修訂後,聖嚴法師慨允由東初出版社出版發行。(民國八十二年 正月初七 楊郁文 序於 阿含學園)」。*序文中的「十年前」,由作序時間可推知大約為1993年左右。

[13] 楊郁文,〈《阿含辭典》編輯體例說明〉,《中華佛學學報》第16期,頁67-104。2003.07。

[14] 感謝黃侃如提供依訪談楊老師的文稿及上課資料所整理的「重要記事」。

[15] 下述資料乃根據黃侃如訪問楊老師的自述,經筆者簡略整理,特此致謝。

[16] 有關蘋果電腦相關資訊請參http://zh.wikipedia.org/wiki/蘋果電腦。漢通電腦資料請參考 http://www.mitac.com.tw/Chinese/history.htm相關歷史資料。

[17] 相關資料請參考 http://140.122.111.65/computing/c.teaching3.htm

[18] 有關資訊性質的界說,請參閱謝清俊,〈資訊的性質〉,《國家數位典藏通訊》,2005.09.01 http://www2.ndap.org.tw/newsletter/news/read_news.php?nid=1195。

[19] 引自《阿含要略》自序。

[20] 引自《阿含要略》出版感言。

[21] 摘錄自《阿含要略》自序,及該書推薦序。

[22] 序楊郁文居士《阿含要略》。

[23] 楊郁文,〈略符〉,《阿含要略》(臺北:東初出版社,1993),頁vi

[24] 同前註,參照〈略符〉,但因許多符號無法於電腦顯示出,所以以圖檔顯示,圖檔引自:http://jcedu.bonze.cn/jcedu/ahan/1/0005.htm

[25] 同註13,〈《阿含辭典》編輯體例說明〉。

[26] 相關資料,詳下述第四段的實務說明。

[27] 釋聖嚴,〈中國佛教以《法華經》為基礎的修行方法〉,《中華佛學學報》第7期,頁2-14。1994.07。

[28] 〈楊郁文老師與謝清俊教授阿含與資訊的對談〉初稿。

[29] 謝清俊,〈數位典藏的人文關懷與社會意義〉,《中華佛學研究所圖書資訊館遷館周年暨圖館週紀念特刊》,2002.12.04(刊於《人生月刊》第238期,或中華佛研所圖資館網頁http://www.chibs.edu.tw/lib/sissue/html/p25_38.htm)。或參考謝清俊,〈所知之相──談對資訊的理解與詮釋〉,《中華佛學研究所佛學資訊學程演講》,2004.11.30。

[30] 蔡奇林,〈網海一滴:網路上的巴利教學與研究資源舉隅〉,《佛教圖書館館訊》第40期,2004.12。蔡奇林,〈巴利文獻數位資源的現況與未來〉,「佛學數位資源之應用與趨勢研討會」(臺北:臺大圖書館,2005.09.16)。蔡奇林,〈巴利電子佛典介紹〉,「認識e世代藏經佛學營」(臺北:中華佛學研究所,2005.07.08)。

[31] 依其分類,大致上巴利文獻已有下列數位資源:
一、巴利光碟
1. PTS版巴利光碟(PALI TEXT Version 1.0)
2.泰國版巴利光碟(BUDSIR IV
3.緬甸版巴利光碟(CSCD 3)
二、網路巴利佛典
1.錫蘭版(BJT版)
2.緬甸版(VRI版)
3.泰國版(BUDSIR
三、輔助資源
1.巴利原典英譯
2.巴英辭典
3.巴利文法
4.巴利讀本
5.巴利有聲資源等