首頁 -> 港澳 ->社會

商湯大模型體系“日日新6.5”全新升級 性價比提升3倍以上

分享到:
2025-07-30 11:18 | 稿件來源:香港新聞網

【字號:

香港新聞網7月30日電 在商湯科技承辦的大愛無疆·模塑未來WAIC 2025大模型論壇上,商湯科技發布全新“日日新SenseNova V6.5”(簡稱“日日新V6.5”)大模型體系,多模態基座大模型迎來突破性升級,實現由“生產力工具”進化為“生產力”。而商湯旗下核心產品 ─ 商湯小浣熊,亦完成了智能體升級。

全國工商聯人工智能委員會主席團首任輪值主席、商湯科技董事長兼首席執行官徐立表示:“商湯科技始終探尋人工智能本質,以技術創新激發最大智能,推動AI完成從‘工具’到‘人’的躍遷,成為真正的生產力。”

商湯“日日新V6.5”多模態基座大模型帶來三大突破性升級:强推理:圖文交錯多模態思維鏈,推理性能與Gemini 2.5 Pro、Claude 4-Sonnet看齊;高效率:優化多模態架構,性價比提升3倍以上;智能體:數據分析大幅領先,支持端到端的場景落地,實現價值閉環。

hk_c_image.png

在人類的思考中,形象思維和邏輯思維同等重要,兩者有機結合才能形成全面的思維能力。當前,主流的多模態模型雖然已經實現了在輸入端融合多種模態,但思考推理過程依然主要依賴語言推理,圖形和空間推理仍存在不足之處。多模態思維鏈構造的關鍵,在於信息的圖形化表達,相比純文本思維鏈更具挑戰,不僅要呈現文字思考過程,還需生成作為思考節點的圖像,難以通過純人工方式大規模實現。商湯研發團隊先基於對思維過程的理解構造種子數據,經監督微調(SFT)訓練,讓模型初步具備圖文交錯思考能力,再通過多輪强化學習,顯著提升多模態推理能力。

同時,商湯還改進了多模態模型的融合架構,促進跨模態早期融合。新的架構採用了顯著變輕的視覺編碼器,以及深而窄的主幹模型,使得視覺表徵在前饋計算早期就與語言進行對齊和交融,從而感知更高效,模態融合更深。

受惠於模型架構的改進,商湯“日日新V6.5”在實現成本優化的同時,預訓練吞吐量提升了20%以上,强化學習效率提升了40%,推理吞吐量提升了35%以上,取得性能和成本的完美平衡。相較“日日新V6.0”,“日日新V6.5”將性價比提升了3倍。(完)

【編輯:徐嘉儀】

視頻

更 多
終可“回家”!香港宏福苑居民分批上樓執拾 有人拿回畫作
50分26秒,超越人類紀錄!第二屆人形機器人半馬的冠軍秘訣是什麼?
2026香港金像獎:梁家輝五封影帝 廖子妤首奪影后
南非隊首奪香港國際七人欖球賽2026冠軍 港隊成功衛冕銀劍賽
【通說環球】機器人跑馬拉松,到底拼的是什麼?
洪金寶梁家輝舒淇章子怡盛裝亮相 第44屆香港電影金像獎紅毯時刻
搶佔風口 盛事不斷 香港展現AI雄心