中國阿里巴巴推全模态AI模型　可處理音頻視頻及手機上用 | 內地 - 香港中通社

2026年07月21日星期二繁简

首頁 -> 內地

中國阿里巴巴推全模态AI模型　可處理音頻視頻及手機上用

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-27 10:57 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月27日電 27日凌晨，中國互聯網企業阿里巴巴發布並開源首個端到端全模態大模型通義千問Qwen2.5-Omni-7B，可同時處理文本、圖像、音頻和視頻等多種輸入，並實時生成文本與自然語音合成輸出。

資料圖為北京市朝陽區望京地區的阿里巴巴集團北京總部標識。香港中通社圖片

據介紹，Qwen2.5-Omni以接近人類的多感官方式“立體”認知世界並與之實時交互，還能通過音視頻識別情緒，在複雜任務中進行更智能、更自然的反饋與決策。現在，開發者和企業可免費下載商用Qwen2.5-Omni，手機等終端智能硬件也可輕鬆部署運行。

Qwen2.5-Omni在一系列同等規模的單模態模型權威基准測試中，展現出了全球最強的全模態優異性能，其在語音理解、圖片理解、視頻理解、語音生成等領域的測評分數，均領先於專門的Audio或VL模型，且語音生成測評分數（4.51）達到了與人類持平的能力。

此外，Qwen2.5-Omni以7B的小尺寸讓全模態大模型在產業上的廣泛應用成為可能。即便在手機上，也能輕鬆部署和應用該模型。

阿里巴巴2023年9月起向公眾開放通義大模型。截至目前，海內外AI開源社區中阿里通義千問的衍生模型數量突破10萬，超越美國Llama系列模型，是公認的全球第一開源模型。

目前世界範圍內，OpenAI和谷歌都提供了生成式AI模型，可處理包括文本和音頻在內的不同類型輸入。（完）

【編輯：彭玉婷】

相關新聞

中國科企小米推出三款自研大模型

中國AI平台“千問”開源創紀錄：下載破10億次

杭州雲棲大會閉幕阿里發布全球首款原生端到端全模態大模型

表現強勁！阿里、快手等再掀中國AI重估熱潮

阿里巴巴升級開源視頻生成模型強化AI競爭力

阿里開源Qwen3全系列助推蘋果智能中國落地

阿里通義千問發布最新推理模型股價大漲

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

中國首個千億級多模態行業大模型投入應用

中國科創大舉押注AI領域進“戰國時代”

阿里雲音視頻AI助手“通義聽悟”能力升級

阿里巴巴向公眾開放AI大模型“通義千問”

視頻

更多

大型雜技劇《唐古百戲》登香港　舞台重現大唐風采觀眾大讚：滿滿視覺享受！

組團參加少年太空人體驗營　香港中學生：最期待去酒泉衛星發射中心

36屆香港書展正式開幕　黃雨下觀眾依舊大排長龍

【通說環球】海上張網“抓”箭！中國火箭回收“不走尋常路”

“南海仲裁案裁決”被炒作　吳士存：不讓裁決書壽終正寢，南海就永無寧日

“環顧四周，很多國家都不安全，反而香港在各方面都比較安全”

【你不知道的香港】輪椅也能上天星小輪？殘障人士：香港無障礙設施不輸任何地方

來論

更多

論壇

更多

圖集

更多

香港大型智能單車活動　目標環繞地球30圈

香港書展最後一天　書商減價促銷延續熱潮

台灣舞台劇《幾米男孩的100次勇敢》巡演再啟

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453