DeepSeek發布V3模型　編程能力大幅提升 | 內地 - 香港中通社

2026年07月21日星期二繁简

首頁 -> 內地

DeepSeek發布V3模型　編程能力大幅提升

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-25 17:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月25日電中國初創公司深度求索（DeepSeek）發布了V3模型更新，加強了模型的編程能力，顯示這家公司希望在人工智能（AI）激烈競爭中保持領先優勢。

DeepSeek 香港中通社資料圖

綜合媒體25日報道，AI開源模型DeepSeek-V3的版本更新V3-0324於北京時間3月24日深夜在AI開源平台HuggingFace上線。DeepSeek沒有為此次版本更新發布任何公告，延續了該公司的低調風格。

據悉，初代DeepSeek-V3發布於去年12月26日，這款模型自上線後便以高性價比火速“出圈”。根據官方技術披露，DeepSeek-V3模型的總訓練成本為557.6萬美元，而GPT-4o等模型的訓練成本約為1億美元。

更新後的DeepSeek-V3模型大小為641GB，參數量6850億。與V3相同，V3-0324模型採用專家混合（MoE）架構，並開源允許自由商用。

此次DeepSeek發布的V3版本更新，編程能力的優化成了最大亮點。有網民使用V3-0324模型編寫800多行代碼，全程沒有出現任何故障。

有AI研究者在X發布評測指出，V3-0324模型在所有基準測試中都取得巨大進步，可能已超越美國Anthropic的Claude Sonnet 3.5，成為最強大的非推理模型。Sonnet 3.5是當前最受認可的商業AI模型之一。（完）

【編輯：彭玉婷】

相關新聞

DeepSeek發布新模型更接近人類視覺理解

DeepSeek創始人梁文鋒研究論文登《自然》封面

DeepSeek創始人梁文鋒研究論文登《自然》封面

梁文鋒談DeepSeek-V3硬體創新與模型優化

DeepSeek橫空出世改變AI生態系？台專家：這一註解挺有說服力

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

DeepSeek熱度一路“狂飆”：微信等大型科企政企不斷接入

百度智能雲千帆上架DeepSeek模型推限時免費

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

DeepSeek異軍突起　中國AI大爆發

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

中國大模型DeepSeek為何會讓Meta恐慌？

中國人工智能開源模型橫空出世印媒：美國的限制失效了

視頻

更多

大型雜技劇《唐古百戲》登香港　舞台重現大唐風采觀眾大讚：滿滿視覺享受！

組團參加少年太空人體驗營　香港中學生：最期待去酒泉衛星發射中心

36屆香港書展正式開幕　黃雨下觀眾依舊大排長龍

【通說環球】海上張網“抓”箭！中國火箭回收“不走尋常路”

“南海仲裁案裁決”被炒作　吳士存：不讓裁決書壽終正寢，南海就永無寧日

“環顧四周，很多國家都不安全，反而香港在各方面都比較安全”

【你不知道的香港】輪椅也能上天星小輪？殘障人士：香港無障礙設施不輸任何地方

來論

更多

論壇

更多

圖集

更多

香港大型智能單車活動　目標環繞地球30圈

香港書展最後一天　書商減價促銷延續熱潮

台灣舞台劇《幾米男孩的100次勇敢》巡演再啟

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453