首頁 -> 內地
DeepSeek發布兩款新模型分享到:
香港中通社12月1日電 12月1日,中國科企深度求索(DeepSeek)發布兩款新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。官方網頁端、App和API(應用程序編程接口)均已更新為正式版V3.2;Speciale版本目前僅以臨時API服務形式開放,以供社區評測與研究。
DeepSeek 香港中通社資料圖 深度求索介紹,V3.2的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent(智能體)任務場景。在公開的推理類 Benchmark 測試中,V3.2達到了美國科企OpenAI旗下ChatGPT-5的水平。 Speciale是V3.2的長思考增強版,同時結合了DeepSeek-Math-V2 的定理證明能力。該模型具備出色的指令跟隨、嚴謹的數學證明與邏輯驗證能力。更令人矚目的是,Speciale模型成功斬獲IMO 2025(國際數學奧林匹克)、CMO 2025(中國數學奧林匹克)、ICPC World Finals 2025(國際大學生程序設計競賽全球總決賽)及IOI 2025(國際信息學奧林匹克)金牌。其中,ICPC與IOI成績分別達到了人類選手第二名與第十名的水平。 深度求索還表示,在高度複雜任務上,Speciale模型大幅優於標準版本,但消耗的Tokens(token是大模型文本處理的最小單位)也顯著更多,成本更高。目前,該模型僅供研究使用,不支持工具調用,暫未針對日常對話與寫作任務進行專項優化。 深度求索對這兩款新模型進行了開源。(完) 【編輯:彭玉婷】
相關新聞 |
視頻更 多
28支龍獅隊齊集錦田爭奪“獅王”殊榮 龍獅隊員:十年後再來表演舞獅爭霸!
周潤發率“百歲”港星團跑馬拉松:重在完成,重在和觀眾打個招呼
樓市寒冬已過?現在是買樓好時機嗎?聽聽地產專家怎麼說
誰能成為下一個Labubu? 潮玩商家們為何集體聚焦盲盒發展?
香港立法會舉行首次會議 通過大埔火災後支援及重建工作議案
【你不知道的香港】高樓林立的香港正悄然進行一項“移山計劃”......
【通說環球】科幻照進現實?解碼中國“南天門計劃”
來論更 多評論更 多論壇更 多閱讀排行
|




