我國少數(shù)民族歷史悠久,許多少數(shù)民族在歷史上創(chuàng)制了古民族文字,并以民族文字形成了極其豐富的反映各民族社會歷史發(fā)展情況的文字歷史檔案。研究少數(shù)民族文字歷史檔案數(shù)字化建設(shè)的現(xiàn)狀與對策問題,可更好地發(fā)掘、傳播與利用這一優(yōu)秀的民族歷史文化遺產(chǎn)。
一、少數(shù)民族文字歷史檔案數(shù)字化建設(shè)的現(xiàn)狀
少數(shù)民族文字歷史檔案是指建國前少數(shù)民族地方政權(quán)、土官、個人在其社會歷史發(fā)展過程中以本民族文字直接形成的反映少數(shù)民族政治、歷史、經(jīng)濟(jì)、軍事、天文、歷法、醫(yī)藥、教育、文藝、哲學(xué)、倫理、宗教和民俗等方面情況,具有保存價值的各種不同形式的歷史記錄。少數(shù)民族文字歷史檔案數(shù)量豐富、種類繁多,其中較為典型的是滿文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書等檔案材料,按其現(xiàn)存方式可劃分為古籍、文書、石刻(又包括碑刻、摩崖、石經(jīng)墻、石經(jīng)片和石經(jīng)墩等類型)、金文、印章、竹簡、木刻、貝葉、骨文、皮書、布書、瓦書和陶文等?,F(xiàn)今,少數(shù)民族文字歷史檔案的數(shù)字化建設(shè)處于起步階段,現(xiàn)狀如下:
1 .少數(shù)民族文字?jǐn)?shù)字化技術(shù)多為高校、民族研究所、計算機(jī)中心等機(jī)構(gòu)進(jìn)行開發(fā)。以藏文數(shù)字化技術(shù)的研究為例。1986年由青海師范大學(xué)研究開發(fā)的TCDOS2.0版藏文系統(tǒng)通過了鑒定,這是第一個收入使用的藏文系統(tǒng);中國藏學(xué)研究中心和航天部701所于1988年8月推出了藏文文字處理及激光編輯排版印刷系統(tǒng),后與濰坊華光合作開發(fā)出了華光書林藏文排版和激光照排系統(tǒng);中國計算機(jī)軟件與技術(shù)服務(wù)總公司、民族印刷廠、北京大學(xué)計算機(jī)研究所、中國民族語文翻譯中心聯(lián)合研制并推出了北大方正藏文書版系統(tǒng),北大方正1997年推出了基于WIN31的藏文維思彩色印刷系統(tǒng);西南民院計算機(jī)研究室開發(fā)了基于DOS平臺的SPDOS漢藏文版操作系統(tǒng)和藏文文字平臺。
2 .北方地區(qū)少數(shù)民族文字?jǐn)?shù)字化技術(shù)的研究領(lǐng)先于南方地區(qū)。除藏文外,其他少數(shù)民族文字?jǐn)?shù)字化技術(shù)開發(fā)情況如下:
?。?)蒙古文。內(nèi)蒙古計算中心開發(fā)出蒙文、漢文、英文操作系統(tǒng),與山東濰坊合作研發(fā)出華光V型蒙文書刊、圖表、報紙激光照版系統(tǒng);內(nèi)蒙古大學(xué)研制出MPS蒙漢混合字處理系統(tǒng);內(nèi)蒙古大學(xué)與北大合作開發(fā)出《北大方正電子出版系統(tǒng)》蒙文版。內(nèi)蒙古社會科學(xué)院蒙文研究所的蘇·蘇雅拉圖研制出基于Windows95的蒙古文處理系統(tǒng)(便攜式計算機(jī))。
?。?)維、哈、柯文。主要有1989年新疆民語委主持開發(fā)的博格達(dá)維、哈、柯、漢、英、俄多文種排版系統(tǒng);北大方正及濰坊華光已都研制有維、哈、柯文的排版系統(tǒng);1997年6月新疆開發(fā)的《未來多文種系統(tǒng)VTDOS6.1》。
?。?)朝鮮文。如方正朝鮮文書版系統(tǒng)和思維系統(tǒng);華光推出的書林朝鮮文系統(tǒng)。
?。?)錫伯文、滿文。有新疆民語委主持開發(fā)的計算機(jī)錫伯文、滿文文字處理和輕印刷系統(tǒng);內(nèi)蒙古大學(xué)等研制的滿文系統(tǒng);遼寧省檔案館和東北大學(xué)計算機(jī)語言工程研究室共同開發(fā)的滿文操作系統(tǒng)。
?。?)彝文。有北大方正和西南民院合作開發(fā)的彝文系統(tǒng)書版軟件;西南民院自行開發(fā)的VCDOS漢彝文雙語平臺和SPDOS漢彝文版漢字操作系統(tǒng),后又推出了Win95彝文文字平臺;由云南省民語委和云大計算中心合作開發(fā)的云南規(guī)范彝文排版系統(tǒng)。
?。?)傣文。北大方正開發(fā)的傣文電子出版系統(tǒng);濰坊華光開發(fā)的傣文電子排版系統(tǒng)。
?。?)壯文。由北大方正研制的在英文基礎(chǔ)上稍加改造后實現(xiàn)的壯文書版系統(tǒng)。
?。?)苗文。云南省楚雄州光亞電子研究所研制的苗文排版系統(tǒng)。
3 .檔案系統(tǒng)少數(shù)民族文字歷史檔案的數(shù)字化管理工作尚未全面開展?,F(xiàn)今少數(shù)民族地區(qū)許多檔案館(室)都收集珍藏有滿文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書等少數(shù)民族文字歷史檔案,這些檔案大多處于手工管理階段,只有少數(shù)檔案部門開展了少數(shù)民族文字歷史檔案信息的數(shù)字化工作,檔案系統(tǒng)尚未開發(fā)出單一或多民族的數(shù)字化管理系統(tǒng)軟件;在現(xiàn)有檔案管理軟件中,也沒能開發(fā)出少數(shù)民族文字歷史檔案的管理功能,這就極大地限制了少數(shù)民族文字歷史檔案的利用效率與范圍。
二、少數(shù)民族文字歷史檔案數(shù)字化建設(shè)的方法
?。ㄒ唬┮M(jìn)與采用少數(shù)民族文字?jǐn)?shù)字化的技術(shù)與科研成果
如許多高校、民族研究所、計算機(jī)中心等機(jī)構(gòu)在少數(shù)民族文字處理技術(shù)方面開發(fā)出了藏文、蒙文、維文、朝鮮文、錫伯文、滿文、彝文、傣文、壯文、苗文等。在數(shù)據(jù)庫建立方面,蒙古文和藏文取得了顯著的成績。1987年完成中世紀(jì)蒙古語文數(shù)據(jù)庫;1993年在完成100萬詞綴(現(xiàn)代蒙古語文數(shù)據(jù)庫)的基礎(chǔ)上,又完成了《500萬詞級現(xiàn)代蒙古語文數(shù)據(jù)庫》;完成了《元朝秘史》拉丁標(biāo)注、漢文標(biāo)注和漢文旁注本的檢索統(tǒng)計系統(tǒng),在《現(xiàn)代蒙古語詞頻統(tǒng)計》的基礎(chǔ)上又整理出《現(xiàn)代蒙古語頻率詞典》;研制了MHJ—1型蒙古語言分析軟件包;1990年推出蒙古文拉丁化輸入方法,開發(fā)了從新蒙古文到老蒙古文的轉(zhuǎn)寫軟件,完成了蒙古文詞根、詞干和附加成分的自動切分與復(fù)合詞的自動識別系統(tǒng);蒙文字幕機(jī)系統(tǒng),蒙漢混排圖章計算機(jī)輔助設(shè)計系統(tǒng),篆文刻繪系統(tǒng),蒙語文節(jié)目微機(jī)管理系統(tǒng),微機(jī)蒙文圖書目錄管理系統(tǒng),蒙醫(yī)癲癇病專家系統(tǒng)等。
此外,廣西壯族自治區(qū)語委主持開發(fā)了壯語詞庫;西南民族學(xué)院開發(fā)出彝文(四川涼山規(guī)范彝文)字幕機(jī)系統(tǒng);中國社會科學(xué)院民族研究所完成了1994年基金項目——中國少數(shù)民族語言文字多媒體數(shù)據(jù)庫。這些少數(shù)民族文字?jǐn)?shù)據(jù)庫的建立,為少數(shù)民族文字歷史檔案的數(shù)字化提供便利條件。
?。ǘ┓e極開展少數(shù)民族文字歷史檔案的數(shù)字化工作
1 .鍵盤輸入。鍵盤輸入是少數(shù)民族文字歷史檔案數(shù)字化的一種基本形式,目前已經(jīng)開發(fā)出許多少數(shù)民族文字輸入法,各民族地區(qū)的檔案館(室)工作人員可根據(jù)所管理少數(shù)民族文字歷史檔案的情況選擇具體的少數(shù)民族文字輸入法,以作為少數(shù)民族文字歷史檔案數(shù)字化的基本工具。
2 .掃描儀。掃描儀的工作原理是把紙上的圖形、圖像或文字信息變成像素點陣,再用二進(jìn)制數(shù)表示這些點陣,從而將圖形、文字變成數(shù)字,輸入計算機(jī)。由于掃描儀可以將整頁的少數(shù)民族文字、圖形或圖像直接輸入計算機(jī),因而在少數(shù)民族文字歷史檔案信息的輸入方面具有廣闊的應(yīng)用前景。
3 .?dāng)?shù)碼相機(jī)及攝像頭。數(shù)碼相機(jī)攝制的圖像可以通過標(biāo)準(zhǔn)串/并行口輸入到計算機(jī),內(nèi)部的PC卡可以直接插入計算機(jī)使用,拍攝到的圖像可以用計算機(jī)進(jìn)行處理,保持圖像的原樣而不失真,圖像質(zhì)量很高。數(shù)碼相機(jī)及攝像頭可用于少數(shù)民族文字歷史檔案的拍攝、復(fù)制、存儲和傳輸利用。
通過以上各種現(xiàn)代化技術(shù),即可將各種類型、各種形式、各種載體的少數(shù)民族文字歷史檔案信息輸入計算機(jī),建立完善的數(shù)字化少數(shù)民族文字歷史檔案信息系統(tǒng)。
?。ㄈ╅_發(fā)少數(shù)民族歷史檔案數(shù)字化管理系統(tǒng)
少數(shù)民族歷史檔案數(shù)字化管理系統(tǒng)是一類可擴(kuò)展的知識網(wǎng)絡(luò)系統(tǒng),可采集、加工、處理、存儲、組織、發(fā)布和利用少數(shù)民族文字歷史檔案信息資源,管理軟件的開發(fā)應(yīng)遵循以下原則:
1 .標(biāo)準(zhǔn)化建設(shè)
?。?)編碼字符集標(biāo)準(zhǔn)、鍵盤標(biāo)準(zhǔn)、字模標(biāo)準(zhǔn)。如內(nèi)蒙古自治區(qū)計算中心完成蒙文字符集、鍵盤、字模國家標(biāo)準(zhǔn);新疆語委主持完成維、哈、柯文的字符集、鍵盤、字模國家標(biāo)準(zhǔn);在國家語委和國家技術(shù)監(jiān)督局及電子部的直接指導(dǎo)下,西藏自治區(qū)藏語文指導(dǎo)委員會辦公室主持,西藏大學(xué)、西北民族學(xué)院、青海師范大學(xué)共同完成了藏文編碼字符集、鍵盤、字模的國家標(biāo)準(zhǔn),這一標(biāo)準(zhǔn)正式由國際10646(即ISO\10646)大字符集討論通過,成為我國第一個進(jìn)入10646國際字符集標(biāo)準(zhǔn)基本平面的少數(shù)民族文字字符集;四川省民族委辦公室主持完成了彝文字符集、鍵盤、字模的國家標(biāo)準(zhǔn);錫伯文信息處理信息交換用七位和八位編碼圖形字符集國家標(biāo)準(zhǔn)正在編制中。此外,國際標(biāo)準(zhǔn)1%文字符集的蒙文字符集、彝文字符集、維、哈、柯文字符集的補(bǔ)充集和錫伯文字符集正在制定中。
?。?)術(shù)語標(biāo)準(zhǔn)化。正在制定的國家標(biāo)準(zhǔn)有蒙古語術(shù)語標(biāo)準(zhǔn)化的一般原則與方法,藏語術(shù)語標(biāo)準(zhǔn)化的一般原則與方法,維吾爾語術(shù)語標(biāo)準(zhǔn)化的一般原則與方法,朝鮮語術(shù)語標(biāo)準(zhǔn)化的一般原則與方法等,均為北方少數(shù)民族的術(shù)語標(biāo)準(zhǔn)化原則與方法。此外,還有蒙、藏、維、哈、柯、朝等語種的辭書編纂一般原則與方法國家標(biāo)準(zhǔn)正在計劃制定和修訂中。
?。?)檔案標(biāo)準(zhǔn)化。在軟件的設(shè)計與選用上,首先要看是否是在檔案管理標(biāo)準(zhǔn)指導(dǎo)下開發(fā)出的軟件。開發(fā)少數(shù)民族歷史檔案管理軟件可參照采用的檔案標(biāo)準(zhǔn)有《檔案著錄規(guī)則》、《文獻(xiàn)保密等級代碼》、《國家機(jī)關(guān)公文格式》、《檔案分類標(biāo)引規(guī)則》、《計算機(jī)軟件開發(fā)規(guī)范》等。
2 .動態(tài)性原則
?。?)采用新型數(shù)據(jù)庫管理系統(tǒng)。由于Windows系統(tǒng)的廣泛流行,F(xiàn)oxpro關(guān)系型數(shù)據(jù)庫正逐漸取代老的數(shù)據(jù)系統(tǒng),它可以高度兼容Dbase和Foxbase,具有操作更簡捷,調(diào)整修改方便,界面美觀等特點而成為軟件開發(fā)者的強(qiáng)有力的工具之一。
(2)注意留有二次開發(fā)接口。在檔案管理自動化方面有一些項目有待完善與改進(jìn),如文獻(xiàn)主題詞的標(biāo)引,不同文體之間的相互轉(zhuǎn)換,文獻(xiàn)全文關(guān)鍵詞檢索,以及自動組卷排列等。因此,少數(shù)民族歷史檔案管理軟件設(shè)計要先構(gòu)建總體結(jié)構(gòu),留有補(bǔ)充功能接口,在不斷升級的過程中完善和增加各種功能。
3 . 注重系統(tǒng)的擴(kuò)展性
在設(shè)計和選購軟件時,要考慮有相應(yīng)功能的驅(qū)動軟件,如多媒體操作系統(tǒng),多媒體窗口系統(tǒng)和多媒體數(shù)據(jù)庫管理系統(tǒng),可增加掃描儀、光盤驅(qū)動器、可擦寫光盤機(jī)以及聲卡、視卡等硬件,并可組成一臺完整的多媒體少數(shù)民族歷史檔案管理系統(tǒng)。
?。ㄋ模┳龊脭?shù)字化少數(shù)民族文字歷史檔案的利用工作
1 .少數(shù)民族文字歷史檔案信息的檢索。目前,許多計算機(jī)信息管理軟件都有制作多種檔案檢索工具和多數(shù)據(jù)庫文獻(xiàn)查詢檢索的功能。各個檔案機(jī)構(gòu)在開發(fā)少數(shù)民族歷史檔案管理系統(tǒng)時,應(yīng)能夠進(jìn)行多數(shù)據(jù)庫多線索的少數(shù)民族文字歷史檔案模糊查詢,可以按照文字類別、文獻(xiàn)標(biāo)題、文獻(xiàn)主題詞、文獻(xiàn)載體材料、文獻(xiàn)所屬類別、民族類別、形成時間等項目進(jìn)行多途徑檢索,并且可以將檢索出的結(jié)果由用戶自己設(shè)計打印出來。
2 .少數(shù)民族文字歷史檔案信息的輸出利用。在少數(shù)民族文字歷史檔案信息的輸出利用方面,計算機(jī)網(wǎng)絡(luò)具有強(qiáng)大的傳輸功能。在計算機(jī)網(wǎng)絡(luò)建設(shè)方面,根據(jù)國內(nèi)外經(jīng)驗,考慮到我國通信技術(shù)和通信線路設(shè)備的現(xiàn)狀,利用微型機(jī)靈活性強(qiáng)、價格較低、建網(wǎng)快、易于普及等條件,首先在各主要民族地區(qū)建立微機(jī)局域網(wǎng)絡(luò)系統(tǒng),實現(xiàn)一定范圍內(nèi)的少數(shù)民族文字歷史檔案信息資源共享。待條件成熟時,再在局域網(wǎng)絡(luò)的基礎(chǔ)上建成全國性的大型網(wǎng)絡(luò),便于社會各界對少數(shù)民族文字歷史文獻(xiàn)的查詢、研究和利用。