商湯大模型體系“日日新6.5”全新升級性價比提升3倍以上

首頁 -> 港澳 ->社會

商湯大模型體系“日日新6.5”全新升級性價比提升3倍以上

分享到：

2025-07-30 11:18 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網7月30日電　在商湯科技承辦的大愛無疆·模塑未來WAIC 2025大模型論壇上，商湯科技發布全新“日日新SenseNova V6.5”（簡稱“日日新V6.5”）大模型體系，多模態基座大模型迎來突破性升級，實現由“生產力工具”進化為“生產力”。而商湯旗下核心產品 ─ 商湯小浣熊，亦完成了智能體升級。

全國工商聯人工智能委員會主席團首任輪值主席、商湯科技董事長兼首席執行官徐立表示：“商湯科技始終探尋人工智能本質，以技術創新激發最大智能，推動AI完成從‘工具’到‘人’的躍遷，成為真正的生產力。”

商湯“日日新V6.5”多模態基座大模型帶來三大突破性升級：强推理：圖文交錯多模態思維鏈，推理性能與Gemini 2.5 Pro、Claude 4-Sonnet看齊；高效率：優化多模態架構，性價比提升3倍以上；智能體：數據分析大幅領先，支持端到端的場景落地，實現價值閉環。

在人類的思考中，形象思維和邏輯思維同等重要，兩者有機結合才能形成全面的思維能力。當前，主流的多模態模型雖然已經實現了在輸入端融合多種模態，但思考推理過程依然主要依賴語言推理，圖形和空間推理仍存在不足之處。多模態思維鏈構造的關鍵，在於信息的圖形化表達，相比純文本思維鏈更具挑戰，不僅要呈現文字思考過程，還需生成作為思考節點的圖像，難以通過純人工方式大規模實現。商湯研發團隊先基於對思維過程的理解構造種子數據，經監督微調（SFT）訓練，讓模型初步具備圖文交錯思考能力，再通過多輪强化學習，顯著提升多模態推理能力。

同時，商湯還改進了多模態模型的融合架構，促進跨模態早期融合。新的架構採用了顯著變輕的視覺編碼器，以及深而窄的主幹模型，使得視覺表徵在前饋計算早期就與語言進行對齊和交融，從而感知更高效，模態融合更深。

受惠於模型架構的改進，商湯“日日新V6.5”在實現成本優化的同時，預訓練吞吐量提升了20%以上，强化學習效率提升了40%，推理吞吐量提升了35%以上，取得性能和成本的完美平衡。相較“日日新V6.0”，“日日新V6.5”將性價比提升了3倍。（完）

【編輯：徐嘉儀】

相關新聞