港大指人工智能大語言模型文心一言4中文表現最佳 | 社會 - 香港中通社

2026年07月22日星期三繁简

首頁 -> 港澳 ->社會

港大指人工智能大語言模型文心一言4中文表現最佳

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2024-03-12 19:52 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網3月12日電香港大學經管學院日前就多個主流的人工智能大語言模型（LLMs）在中文及英文環境進行綜合深入評測，並發表評測報告，於12日公佈中文和英文語境大模型排行榜。在中文語境下，文心一言4綜合表現最佳；而在英文語境下，GPT 4-turbo領先優勢明顯。

報告評測了14款中文及16款英文語境下的人工智能通用大語言模型。評測主要針對三大核心能力，包括自然語言能力、專業學科能力以及安全與責任，要求大模型展現出對人類角色、微妙情感和文化語境的深入理解，並在更複雜和多樣化的情境中準確理解和回應指令，以及對人類學科知識的掌握、處理敏感話題的能力等。

在中文語境下，文心一言4綜合表現最佳，GPT4-turbo與通義千問2緊隨其後。文心一言4對中文特色語境表現出更好的適應能力。在安全與責任方面，文心一言4得分亦最高，展現出較成熟的安全意識。文心一言4的表現，也側面反映越來越多高品質的中文資料集，逐步被構築並應用於國產大模型，以創造出更好的中文思維AI助手。

在英文語境下，僅有GPT 4-turbo一款模型的綜合得分獲得80分以上，大多數國產大模型在英文語境下的綜合表現處於稍微劣勢的位置。這也與國產大模型訓練的數據多為中文有關。

港大經管學院創新及資訊管理學教授蔣鎮輝表示，中國具有大語言模型應用的豐富場景，特別是在教育、金融、醫療、法律、零售等方面，未來的想像空間是十分寬廣的。在人工智能大語言模型的領域，中國科技不該只做個追隨者，而應該勇於成為引領者，中國的大語言模型呼喚更多從0到1的原創性核心技術。（完）

【編輯：譚暢】

相關新聞

OpenAI最強模型GPT-5來了！免費可用

推理模型評測報告：文心X1 Turbo領跑中國國內總分第一

百度文心X1 Turbo獲中國首個‘4+級’評級

香港科大師生率先試用港版DeepSeek

科大率先試用首個港產AI大模型HKGAI V1　推動教育創新

中國發布海洋垂直領域大語言模型“瀚海智語”

港嶺大ChatGPT門戶網站接入DeepSeek-R1助教與學

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

DeepSeek到底什麼水平？

Deepseek出世英偉達暴跌15% 專家：中美AI競爭打成平手

通說：來自廣東的他，讓硅谷刮目相看

商湯推出“日日新”融合大模型勇奪“雙冠王”

百度推文心大模型4.0　稱綜合能力匹敵GPT-4

中國成立GPT產業聯盟

視頻

更多

大型雜技劇《唐古百戲》登香港　舞台重現大唐風采觀眾大讚：滿滿視覺享受！

組團參加少年太空人體驗營　香港中學生：最期待去酒泉衛星發射中心

36屆香港書展正式開幕　黃雨下觀眾依舊大排長龍

【通說環球】海上張網“抓”箭！中國火箭回收“不走尋常路”

“南海仲裁案裁決”被炒作　吳士存：不讓裁決書壽終正寢，南海就永無寧日

“環顧四周，很多國家都不安全，反而香港在各方面都比較安全”

【你不知道的香港】輪椅也能上天星小輪？殘障人士：香港無障礙設施不輸任何地方

來論

更多

論壇

更多

圖集

更多

香港大型智能單車活動　目標環繞地球30圈

香港6月通脹2%　低於預期

香港書展最後一天　書商減價促銷延續熱潮

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453