首頁 -> 藝苑
DeepSeek創始人梁文鋒研究論文登《自然》封面分享到:
香港中通社9月18日電 由DeepSeek團隊研發、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,近日榮登國際權威期刊《自然(Nature)》封面。這是全球首個經過同行評審的主流大語言模型,填補了業內空白。
《自然(Nature)》雜誌9月刊封面。 綜合媒體18日消息,《自然》評價指:“目前幾乎所有主流大模型尚未經過獨立同行評審,這一空白終於被DeepSeek打破。”相較今年1月發布的初版論文,新論文披露了更多模型訓練細節,並正面回應了模型發布初期的質疑。 據報,DeepSeek-R1採用創新的大規模推理模型訓練方法,包含人類監督下的深入訓練階段,以優化推理過程。梁文鋒團隊介紹,該模型通過強化學習而非依賴人類示例來開發推理步驟,顯著降低了訓練成本和複雜性。模型在接觸優質問題解決案例後,會生成推理模板,通過解決問題獲得獎勵,從而提升學習效果。 分析指,DeepSeek-R1的突破源於其獨特訓練方法。研究顯示,該模型在推理任務中表現出色,尤其在複雜問題解決方面展現了高效性和準確性。這不僅推動了AI技術發展,也為開源AI社區提供了寶貴參考。論文的發表標志著DeepSeek在全球AI領域的領先地位。 DeepSeek由梁文鋒於2023年在中國杭州創立,團隊成員來自頂尖高校及國際機構。梁文鋒,1985年出生於廣東湛江,是幻方量化及DeepSeek創始人。去年12月,其團隊發布大模型“DeepSeek-V3”,展現了持續創新能力。今年4月,梁文鋒入選美國《時代》周刊“2025年全球最具影響力100人”榜單。(完) 【編輯:黃璇】
相關新聞 |
視頻更 多
以“獅子山”畫作鼓勵災民 林天行個展“夜·香港”開幕
【通講壇】涉台最新表態 高市早苗這次說得比較清楚?
若AI和無人機參與救援,能在香港的火災中發揮什麼功能?
宏福苑大火遇難者人數增至159名 家屬“頭七”哀傷路祭
香港五級大火致156人死亡 政府善後工作進展如何?
法國總統馬克龍“單飛”訪華 會聊些什麼?
七處安全網標本未達標 廉署揭涉案人士購買時魚目混珠
來論更 多評論更 多
論壇更 多閱讀排行
|










