首頁 -> 社團

港大指人工智能大語言模型文心一言4中文表現最佳

分享到:
2024-03-13 09:00 | 稿件來源:香港新聞網

【字號:

香港新聞網3月12日電  香港大學經管學院日前就多個主流的人工智能大語言模型(LLMs)在中文及英文環境進行綜合深入評測,並發表評測報告,於12日公佈中文和英文語境大模型排行榜。在中文語境下,文心一言4綜合表現最佳;而在英文語境下,GPT 4-turbo領先優勢明顯。

報告評測了14款中文及16款英文語境下的人工智能通用大語言模型。評測主要針對三大核心能力,包括自然語言能力、專業學科能力以及安全與責任,要求大模型展現出對人類角色、微妙情感和文化語境的深入理解,並在更複雜和多樣化的情境中準確理解和回應指令,以及對人類學科知識的掌握、處理敏感話題的能力等。

在中文語境下,文心一言4綜合表現最佳,GPT4-turbo與通義千問2緊隨其後。文心一言4對中文特色語境表現出更好的適應能力。在安全與責任方面,文心一言4得分亦最高,展現出較成熟的安全意識。文心一言4的表現,也側面反映越來越多高品質的中文資料集,逐步被構築並應用於國產大模型,以創造出更好的中文思維AI助手。

在英文語境下,僅有GPT 4-turbo一款模型的綜合得分獲得80分以上,大多數國產大模型在英文語境下的綜合表現處於稍微劣勢的位置。這也與國產大模型訓練的數據多為中文有關。

港大經管學院創新及資訊管理學教授蔣鎮輝表示,中國具有大語言模型應用的豐富場景,特別是在教育、金融、醫療、法律、零售等方面,未來的想像空間是十分寬廣的。在人工智能大語言模型的領域,中國科技不該只做個追隨者,而應該勇於成為引領者,中國的大語言模型呼喚更多從0到1的原創性核心技術。(完)


【編輯:譚暢】

視頻

更 多
落馬洲河套區再添“新成員” 粵港澳大灣區國際臨床試驗所開幕
專訪香港廉政專員胡英明:打擊貪污對於國家安全非常重要
讓沙特企業來港上市 只需做一件事!港交所前行政總裁李小加提出建議
美國要搞“中國特色的美國資本主義”?李小加:大浪來時美國這艘船會先顛覆
50年廉署咖啡的新內涵 香港廉政專員親身上陣煮咖啡
國際問題專家:特朗普上台後對華制裁恐持續 但中美關係的未來不完全由美國決定
葉劉淑儀:外界要求“釋放黎智英”是對香港司法制度的粗暴干預