今日要聞!數(shù)字化助古籍走出“深閨高閣”

                • 人民網(wǎng)-人民日報海外版
                • 2023-01-30 12:38:53

                安徽博物院文物科技保護中心紙質(zhì)文物修復(fù)室的工作人員對古籍文物進行修復(fù)。


                (資料圖)

                新華社記者 周 牧攝

                為查閱古籍文獻,要出差到各地,探訪各家圖書館——這是許多古籍研究者的共同記憶。在數(shù)字時代,這種情況正發(fā)生改變。國家圖書館(國家古籍保護中心)等6家單位近日在線新增發(fā)布古籍數(shù)字資源6786部(件)。至此,全國已累計在線發(fā)布古籍數(shù)字資源13萬部(件)。依托數(shù)字化手段,卷帙浩繁的古籍走出“深閨高閣”,讓文明觸手可及。

                兼顧“藏”與“用”

                古籍,作為文物必須保護,作為文獻必須為讀者所用。兼顧“藏”與“用”,一直是古籍保護工作的重點,而數(shù)字化是最好的方法。中國古籍數(shù)字化起步于20世紀90年代。隨著數(shù)字技術(shù)不斷成熟,科技賦能古籍工作取得可喜進展。

                “2016年國家圖書館搭建起‘中華古籍資源庫’平臺,發(fā)布了普通古籍、甲骨、敦煌文獻等數(shù)字資源,并全部實現(xiàn)免登錄在線閱覽。”國家圖書館副研究員南江濤介紹,國家圖書館還聯(lián)合海內(nèi)外收藏機構(gòu)發(fā)布“法藏敦煌遺書”“天津圖書館古籍”“云南省圖書館古籍”等,基本搭建“國家古籍數(shù)字平臺”架構(gòu)。

                隨著“中華古籍保護計劃”深入開展,各地圖書館陸續(xù)投入人力物力,大力推進古籍數(shù)字化。國家圖書館先后聯(lián)合39家單位發(fā)布數(shù)字古籍,1月4日是第7次聯(lián)合發(fā)布,其中不僅包含明清版刻,還有碑帖拓本等特色資源。相關(guān)數(shù)據(jù)顯示,在現(xiàn)有的13萬部(件)數(shù)字古籍中,超過10.2萬部(件)歸屬于“中華古籍資源庫”。

                “這13萬部(件)古籍數(shù)字資源,對于我們研究者來說格外珍貴。”北京大學(xué)中文系教授楊海崢感嘆,在線查閱免去了往返奔波圖書館的時間,平衡了古籍的文物性與文獻性。

                AI助力古籍整理

                把紙質(zhì)古籍轉(zhuǎn)化成數(shù)字文本,只是古籍保護的第一步。“現(xiàn)有的數(shù)字古籍大多由縮微膠片轉(zhuǎn)換而成,分辨率低,使用也不方便。”楊海崢舉例解釋,這類古籍通常不具備檢索功能,想查閱某個內(nèi)容,需逐篇逐頁閱讀原文,很難快速找到想要的知識。

                人工智能的快速發(fā)展,為數(shù)字古籍的整理分類帶來革命性變化。2022年10月,由字節(jié)跳動與北京大學(xué)數(shù)字人文研究中心合作研發(fā)的數(shù)字古籍平臺“識典古籍”便是一個生動案例。

                進入“識典古籍”的網(wǎng)站,記者看到《周易》《左傳》《禮記》等陳列于首頁上。隨機點開一本,左側(cè)為章節(jié)目錄,右側(cè)為正文,排版形式既順應(yīng)現(xiàn)代人的閱讀習(xí)慣,又還原了古籍紙張的閱讀美感。

                “與一些數(shù)字化平臺不同,‘識典古籍’是完全免費的,而且增加了簡繁體轉(zhuǎn)換、底本影像對照、全文檢索等一系列便捷功能。”抖音集團企業(yè)社會責任部產(chǎn)品總經(jīng)理唐塏鑫介紹,該平臺主要應(yīng)用了文字識別、自動標點和命名實體識別這3種技術(shù),不僅能將影印本上的文字提取整理,還能通過序列標注識別文本中的人名、地名等信息,準確率達到96%至97%。

                “平臺已整理上線了685部經(jīng)典古籍,共計7900多萬字,主要來自《四部叢刊》。”唐塏鑫說,“識典古籍”已上線手機移動版,未來平臺中的書目將持續(xù)更新。

                業(yè)內(nèi)人士預(yù)測,隨著AI技術(shù)的運用,古籍文獻中所蘊藏的古代歷史文化知識將不斷被抽取,構(gòu)造成各種各樣的知識庫,并將以知識圖譜的形式支持互聯(lián)網(wǎng)前端應(yīng)用。

                跨界合作成趨勢

                事實上,在“識典古籍”上線之前,文保機構(gòu)、科研院校與互聯(lián)網(wǎng)公司的跨界合作已越來越普遍。比如,騰訊聯(lián)合敦煌研究院開發(fā)了AI病害識別技術(shù),幫助“問診”敦煌千年壁畫。

                由于在產(chǎn)品研發(fā)、設(shè)計方面存在優(yōu)勢,互聯(lián)網(wǎng)公司等社會力量的加入會進一步保障古籍數(shù)字化平臺的服務(wù)質(zhì)量。“我們有優(yōu)秀的產(chǎn)品經(jīng)理、設(shè)計師、軟件工程師,能夠不斷優(yōu)化數(shù)字古籍平臺的產(chǎn)品功能。”唐塏鑫說。

                “識典古籍”的誕生離不開專家學(xué)者支持。北京大學(xué)數(shù)字人文研究中心主任王軍表示,北大在這次合作中負責人工審核與校對,彌補人工智能有識別錯誤率的短板,并利用自有學(xué)術(shù)平臺,連接更多專業(yè)研究者和學(xué)生群體。

                專家認為,在古籍整理中,人文社科學(xué)者要積極介入,并加強與技術(shù)人員的合作,那樣才能更好地利用機器而不是被機器牽著鼻子走,從而保證結(jié)果的準確性。

                “高校古典文獻學(xué)等相關(guān)專業(yè)如何培養(yǎng)兼具技術(shù)與學(xué)術(shù)能力的復(fù)合型人才、如何形成多學(xué)科交叉的課程體系等,都是需要綜合考慮的問題。”王軍說。

                關(guān)鍵詞: 國家圖書館 古籍數(shù)字化

                分享到:
                ?
                • 至少輸入5個字符
                • 表情

                熱門資訊

                亚洲av无码精品网站| 亚洲AV日韩AV天堂久久| 亚洲美免无码中文字幕在线| 国产亚洲精品一品区99热| 国产精品亚洲综合一区| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 亚洲免费在线视频观看| 亚洲永久中文字幕在线| 久久久久亚洲AV无码观看| 久久久久亚洲AV无码专区体验| 亚洲视频在线观看免费| 久久久久亚洲AV成人片| 亚洲精品网站在线观看你懂的| 久久精品国产精品亚洲毛片| 亚洲日本一区二区三区| 亚洲精品成人久久| 亚洲av无码专区在线| 亚洲日日做天天做日日谢| 亚洲综合国产成人丁香五月激情| 亚洲日韩国产欧美一区二区三区| 亚洲欧美国产日韩av野草社区| 亚洲av无码成人精品区一本二本| 国产成人久久精品亚洲小说| 久久久久亚洲国产AV麻豆| 国产成人综合亚洲绿色| 亚洲麻豆精品国偷自产在线91| 成人伊人亚洲人综合网站222| 极品色天使在线婷婷天堂亚洲 | 亚洲人成综合网站7777香蕉| 精品亚洲成A人无码成A在线观看| 亚洲精品天堂在线观看| 亚洲国产精品免费观看| 亚洲AV日韩AV一区二区三曲 | 亚洲天堂一区二区| 亚洲无砖砖区免费| 中日韩亚洲人成无码网站| 亚洲av色香蕉一区二区三区| 亚洲人妻av伦理| 亚洲国产精品成人精品无码区 | 夜色阁亚洲一区二区三区| 亚洲熟妇无码另类久久久|