讓古籍在智能時代煥發新生
來源:中央紀委國家監委網站作者:李 斌 2025-05-14 11:18
近日,教育部、國家語委、中央網信辦發布了《關于加強數字中文建設 推進語言文字信息化發展的意見》。數字中文建設是貫徹落實黨中央、國務院關于數字中國和教育強國總體部署的重要舉措。語言文字是人類信息交流、思想表達、文明互鑒的基礎工具,也是國家重要的資源。加強數字中文建設,能夠為數字中國建設提供雄厚的語言資源基礎和強大的文化傳播力量。
黨的十八大以來,我國在古籍數字化保護與數字文化方面頒布和實施了一系列重要政策,取得了豐碩成果。2017年《關于實施中華優秀傳統文化傳承發展工程的意見》明確提出要持續推進古籍數字化進程,確立了古籍數字化在新時代古籍工作中的重要地位。《關于推動數字文化產業創新發展的指導意見》提出建設數字文化產業創新生態體系。隨著人工智能產業的迅猛發展,2022年國家發布了《關于推進新時代古籍工作的意見》《2021—2035年國家古籍工作規劃》《關于推進實施國家文化數字化戰略的意見》等文件,進一步完善了古籍保護的頂層設計,明確以數字化和智能化加速推動古籍整理利用轉型升級,使古籍傳承從“紙質工程”逐步邁向“數字基建”和“數字化產業”的新階段。
古籍數字化基礎設施建設初具規模。我國已經建成了古籍影像庫、全文庫和知識庫3個層面的諸多數據庫,形成了產學研的良好生態。國內諸多館藏機構對珍本、善本古籍展開了大規模圖像采集工作,形成了包含數萬種古籍的影像庫。高校與企業合作,建設了多種高質量圖文對照的全文庫與數字化檢索平臺,大大方便了大眾閱讀古籍。通過古籍書目庫,我們將歷史上各種歷法統一為現代歷法的時間本體庫、歷代地理實體庫以及古代數十萬重要歷史人物的人物庫,從而基本完成了書目、時間、地點、人物四大基本要素的系統整理,成為古籍數字化寶貴的基礎數據。
AI等先進技術驅動的“數字古文”技術大放異彩。我國在古籍的數字化、智能化方面的技術開發與應用也蓬勃展開。面向影像庫建設的圖像掃描與修復技術,面向全文庫建設的文字識別技術、人機交互校勘技術、繁簡轉換、古籍自動斷句與標點技術,面向知識庫建設的古籍分詞、命名實體識別、實體鏈接、機器翻譯等技術都有眾多代表性成果。我國還有許多古籍尚未經整理和出版,目前智能輔助校勘技術取得突破,通過這些技術手段將大量的古籍文獻以眾包的方式讓專家與古籍愛好者在線校勘,一年時間就可以完成數億字古籍的圖文校對工作,大大提高了古籍整理的效率。同時,智能校勘使得古籍整理從“學術生產”轉變為“文化體驗”,培育出新一代“數字時代的修書人”。
AI改變著古籍出版與使用形態,讓古籍以新的形態走近年輕人,走出國門。傳統的古籍出版主要采取影印本、標點本的形式,四大名著、唐詩、宋詞等文學經典始終暢銷,而《十三經》《二十四史》等大部頭文獻受眾相對較小,《四庫全書》等大型類書則以館藏為主。而數字化檢索平臺的出現不僅可以解決紙質圖書出版周期長、出版費用與定價高的難題,還可以通過全文檢索和統計,讓用戶快速地獲取需要的條目,讓類書成為新技術條件下的“百科全書”。
大語言模型的蓬勃發展,也給古籍活化利用帶來了諸多新機遇。基于古籍的大模型開發,可以讓古籍文獻的內容不再生澀難讀,逐字句地解讀古籍,調取古代各種語言文化知識,翻譯為現代漢語、英語,根據讀者需求隨時解答問題,大大降低了閱讀門檻,有利于中小學古文教育與中國文化的對外傳播。同時,集成了中國古代典籍知識文化與智慧的大模型更符合中國人的思維與使用習慣,也是國產大模型實現差異化發展的特色。利用大語言模型生成小說、劇本和廣告,以及文生圖、文生視頻技術,讓古籍融入文學、影視創作與諸多有國風色彩的產品開發中。
在數字中文建設的大潮中,以人工智能賦能古籍,用智能校勘技術加快龐大古籍資料的系統整理,開發高質量古代典籍知識庫,推動大模型與機器翻譯技術應用,必將讓千年文脈在智能時代煥發新生。
(作者系南京師范大學文學院教授)
編輯:張曉芮
文章、圖片版權歸原作者所有,如有侵權請聯系刪除