首頁 -> 內地

DeepSeek模型升級 複雜推理創意寫作能力提升

分享到:
2025-05-30 11:20 | 稿件來源:香港中通社

【字號:

香港中通社5月30日電  中國科企深度求索29日晚公布,其名下DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。據介紹,相較於舊版R1,新版模型在複雜推理任務中的表現有了顯著提升。

DeepSeek  香港中通社圖片

DeepSeek-R1-0528仍然使用2024年12月所發布的DeepSeek V3 Base模型作為基座,但在後訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新後的R1模型在數學、編程與通用邏輯等多個基準測評中取得了當前中國所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如美國公司OpenAI的o3與穀歌Gemini-2.5-Pro。

另外,與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45至50%左右,能够有效地提供更為準確、可靠的結果。在舊版基礎上,更新後的R1模型針對議論文、小說、散文等文體進行了進一步優化,能够輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。新模型在前端代碼生成、角色扮演等領域的能力也均有更新和提升。

DeepSeek-R1-0528為開源模型。

中國民營科創公司深度求索於2023年7月在杭州成立。今年1月15日,其名下大數據模型DeepSeek正式發布;2月1日,DeepSeek日活躍用戶數已突破3000萬。(完)

【編輯:彭玉婷】

視頻

更 多
28支龍獅隊齊集錦田爭奪“獅王”殊榮 龍獅隊員:十年後再來表演舞獅爭霸!
周潤發率“百歲”港星團跑馬拉松:重在完成,重在和觀眾打個招呼
樓市寒冬已過?現在是買樓好時機嗎?聽聽地產專家怎麼說
誰能成為下一個Labubu? 潮玩商家們為何集體聚焦盲盒發展?
香港立法會舉行首次會議 通過大埔火災後支援及重建工作議案
【你不知道的香港】高樓林立的香港正悄然進行一項“移山計劃”......
【通說環球】科幻照進現實?解碼中國“南天門計劃”