中國首個古籍大語言模型發佈：智能作詩、精確翻譯、自動標點… | 內地 - 香港中通社

2026年07月21日星期二繁简

首頁 -> 內地

中國首個古籍大語言模型發佈：智能作詩、精確翻譯、自動標點…

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2023-12-13 00:00 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網12月13日電據南京農業大學網站消息，12月2日，該校信息管理科學系王東波教授研究團隊在北京發佈“荀子”古籍大語言模型。“荀子”古籍大語言模型是在國家社科基金重大項目“中國古代典籍跨語言知識庫構建及應用研究”的支持下，聯合中華書局古聯公司推出的專門進行古籍處理與研究的智能工具。該模型包含《四庫全書》在內的絕大多數傳世古籍文獻，擁有超過20億字的大型語料庫。

“荀子”古籍大語言模型以古籍智能化研究為目的，為古籍智能處理而設計，在推動中國古籍研究與保護工作創新發展、提高中華傳統文化傳承的效率與質量、實現大語言模型與古籍處理的深度融合上提供重要支撐。該模型作為開源公益研究成果已在GitHub、ModelScope等網站發佈，用戶可免費下載部署使用。

據介紹，王東波教授研究團隊在南京農業大學高算力基礎設施支持下，持續10年深耕古籍文獻數字化研究，同時依托中華書局提供的應用場景，在古籍開源大語言模型上實現AI人工智能垂直細分領域的全國首創。

該開源模型包括兩個部分：基座模型XunziALLM與對話模型XunziChat。

其模型亮點包括：智能標引，能夠對古籍中的內容進行高質量主題標引，幫助研究人員快速了解文章主題；

信息抽取，能夠自動從古籍中抽取關鍵信息，如人物、事件、地點等，大大節省了信息整理時間；

詩歌生成，能夠根據給定的主題或關鍵詞，自動生成符合語法規則和韻律要求的古詩，為詩詞愛好者提供創作靈感；

高質量翻譯，對於難以理解的古籍文獻，能夠進行精準的現代文翻譯，幫助研究人員更好地理解原文含義；

閱讀理解，能夠對給出的古文文本進行分析解釋，實現對古籍文本的自動閱讀；

詞法分析，可以完成古籍文本的自動分詞和詞性標註，有效提升研究效率；

自動標點，可以快速完成古籍文本的斷句和標點，提升使用者對古籍文本的閱讀體驗。

此外，同時發佈的基座模型，用戶也可以根據自己的需求，使用本地的訓練語料微調“荀子”基座模型，使其在古籍下遊處理任務上取得更優越的處理性能。（完）

【編輯：丘志彬】

相關新聞

港嶺大研究：AI翻譯仍難取代專業人類傳譯

“詩詞傳意與辨音辨聽”講座在香港舉行推廣中華詩詞

中國智達藏語大模型面世

詩路漫漫探索求真：當代詩人齊聚一堂，共探創作新境

冷門絕學研究新進展！中國社科院發佈14項重大成果

中大中文系“經典的詮釋與傳播國際學術研討會”圓滿舉行

港大深圳醫院部署AI大模型助力醫療智能化發展

外媒解讀王毅引文談中美關係

葉嘉瑩逝世巴金誕辰紀念華人憶文學巨匠

科大訊飛港澳業務再佈局 SaaS產品宣佈港澳地區上線

漢語盤點2023”發佈中國年度十大流行語、十大網絡用語、十大新詞語

中國發布十大新詞語“村超”等入選

城市大學舉辦書藝同行展呈現圖書館裡的中韓人文交流史

台“自研”AI抄襲大陸成果？台“中研院”院長辯稱“研究員求快心切”

台“自研”AI語言模型答問顯示“台灣屬於中國”

視頻

更多

大型雜技劇《唐古百戲》登香港　舞台重現大唐風采觀眾大讚：滿滿視覺享受！

組團參加少年太空人體驗營　香港中學生：最期待去酒泉衛星發射中心

36屆香港書展正式開幕　黃雨下觀眾依舊大排長龍

【通說環球】海上張網“抓”箭！中國火箭回收“不走尋常路”

“南海仲裁案裁決”被炒作　吳士存：不讓裁決書壽終正寢，南海就永無寧日

“環顧四周，很多國家都不安全，反而香港在各方面都比較安全”

【你不知道的香港】輪椅也能上天星小輪？殘障人士：香港無障礙設施不輸任何地方

來論

更多

論壇

更多

圖集

更多

香港大型智能單車活動　目標環繞地球30圈

香港書展最後一天　書商減價促銷延續熱潮

台灣舞台劇《幾米男孩的100次勇敢》巡演再啟

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453