DeepSeek發布最新大語言模型　關聯下一代中國芯片 | 電訊 - 香港中通社

2026年06月09日星期二繁简

首頁 -> 電訊

DeepSeek發布最新大語言模型　關聯下一代中國芯片

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-08-21 21:48 |

【字號：大中小】

　　香港中通社8月21日電　中國人工智能（AI）公司深度求索（DeepSeek）21日宣布，其最新大語言模型DeepSeek-V3.1正式發布。

　　據DeepSeek介紹，新升級版本的變化主要體現在三個方面：混合推理架構、更高的思考效率、更強的Agent（智能體）能力。

　　DeepSeek-V3.1實現了一個模型同時支持思考模式與非思考模式。它就像一個擁有兩種工作模式的超級大腦，當面對簡單問題時，能以非思考模式快速給出答案。而在處理複雜問題時，可切換到思考模式，給出更具深度和邏輯的解答。用戶可通過官方App或網頁端的“深度思考”按鈕切換這兩種模式。

　　此外，DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。當天，DeepSeek官方公眾號在其文章置頂留言裡說，UE8M0 FP8是針對即將發布的下一代中國產芯片設計。

　　官方數據顯示，與DeepSeek-R1-0528相比，DeepSeek-V3.1在思考模式下效率大幅提升，能在更短時間內給出答案，且經過思維鏈壓縮訓練，token（大模型文本處理的最小單位）消耗量可減少20%至50%，各項任務的平均表現與R1-0528持平。R1-0528是DeepSeek於今年5月發布的旗艦推理模型DeepSeek R1的升級版本。（完）

相關新聞

2026-04-24DeepSeek新模型發布百萬上下文成標配
2025-08-22DeepSeek發布最新大語言模型關聯下一代中國芯片
2025-08-11DeepSeek問世半年英媒：它改寫了美國AI行業的思維模式
2025-02-25DeepSeek-R1多芯片版本開源
2025-02-21港嶺大ChatGPT門戶網站接入DeepSeek-R1助教與學
2025-02-14DeepSeek大模型接入中國雲平台政務系統等促行業變革
2025-02-12百度智能雲千帆上架DeepSeek模型推限時免費
2025-02-08DeepSeek到底什麼水平？
2025-01-27中國新AI大模型DeepSeek登頂美國區免費APP下載排行榜

視頻

更多

“家鄉市集”最後一天　香港市民湧入維園瘋搶“家鄉味”　

“我感到嫉妒！” 中東小哥深度遊覽大灣區後“破防了”

“阿嬤熱”來襲！這屆香港潮州節星光熠熠現場火爆有攤位半天賣出了百隻鹵鵝

香港特首李家超的哈薩克斯坦之行，取得這些成果

定了！《給阿嬤的情書》6月18日香港上映　市民：會二刷三刷　帶上小朋友去看

【通說環球】“鉛筆芯靠我賣”神曲背後：一座非洲百年礦山的“重生”歷程

來香港家鄉市集　買“給阿嬤的情書”同款橄欖菜！

來論

更多

論壇

更多

圖集

更多

香港啟德體育園榮獲國際殊榮　膺"年度最佳場地"

香港今明兩日天氣持續不穩　

慶回歸29週年市民免費乘搭叮叮車

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453