四大佛教數典專案 成果報你知
【本刊訊】「二○二一法鼓數典專案」春季成果發表會,四月二十九日下午舉行線上發表。以「連結與探索」為主題,法鼓文理學院圖書資訊館館長洪振洲、佛學資訊組助理教授王昱鈞等,從佛典資料庫建立與公開共享、運用人工智慧來辨別佛典文字、《法鼓全集》網站改版、法的療癒主題式資料庫,以及中古佛教寫本資料庫編碼,發表專案最新進展。
洪振洲館長期許各專案以「連結與探索」開展佛學數位資源新方向,目前數典小組的各佛學專題資料庫仍是各自獨立作業,少了跨專案甚至跨組織的連結。未來,資料庫的連結是首要處理的目標,以建構佛學知識系統。
「漢籍佛典進階文字處理」由王昱鈞示範漢籍佛典文字的分詞。透過AI工具,採用BIES的標籤,標注每一個的詞性,目前人工標記語料超過四百六十萬字。未來希望發展佛教專有名詞的辨識,達到漢文佛典以機器學習(CRF)的語言模型方案,利用深入學習所使用的循環神經網路(RNN),有效以新語言表達漢文佛典內容。
開發中的「《法鼓全集》二○二○紀念版網站」新版操作介面可使用全螢幕閱讀,數典小組謝承恩表示,顯示時以一篇完整的文章為單位,且容許含標點符號字串的搜尋。網站更整合《聖嚴法師年譜》及著作清單,將師父的全集與年譜完整連結。
專案助理呂玟儀發表「法的療癒主題式資料庫——以禁咒治療為例」,目前資料庫共收錄一百二十四筆資料,分成說咒者、聽咒者等類別,以及用到的物品與手印等。例如乞雨咒、除十惡神咒等的持咒、治療方式與效用等相關文獻,為佛醫研究者提供更好的工具。
最後一場由林靜慧介紹「中古佛教寫本資料編碼」專案,主要依據國際敦煌項目(IDP)提供畫質較好的圖片進行編碼,並使用國際通用TEI的標記,將敦煌寫卷變成數位版本,目前完成四十種寫卷,收錄佛經外,還有變文、瑞相記、寫真贊、偈頌等。
洪振洲也鼓勵使用者廣發提問,在不斷發現、解決問題中,使佛典數位化知識網早日成形。

▲法鼓數典小組以「探索與連結」為題,發表佛學專題資料庫產出成果。(李佳純 攝)