首頁 -> 內地
DeepSeek發布V3模型 編程能力大幅提升分享到:
香港中通社3月25日電 中國初創公司深度求索(DeepSeek)發布了V3模型更新,加強了模型的編程能力,顯示這家公司希望在人工智能(AI)激烈競爭中保持領先優勢。
DeepSeek 香港中通社資料圖 綜合媒體25日報道,AI開源模型DeepSeek-V3的版本更新V3-0324於北京時間3月24日深夜在AI開源平台HuggingFace上線。DeepSeek沒有為此次版本更新發布任何公告,延續了該公司的低調風格。 據悉,初代DeepSeek-V3發布於去年12月26日,這款模型自上線後便以高性價比火速“出圈”。根據官方技術披露,DeepSeek-V3模型的總訓練成本為557.6萬美元,而GPT-4o等模型的訓練成本約為1億美元。 更新後的DeepSeek-V3模型大小為641GB,參數量6850億。與V3相同,V3-0324模型採用專家混合(MoE)架構,並開源允許自由商用。 此次DeepSeek發布的V3版本更新,編程能力的優化成了最大亮點。有網民使用V3-0324模型編寫800多行代碼,全程沒有出現任何故障。 有AI研究者在X發布評測指出,V3-0324模型在所有基準測試中都取得巨大進步,可能已超越美國Anthropic的Claude Sonnet 3.5,成為最強大的非推理模型。Sonnet 3.5是當前最受認可的商業AI模型之一。(完) 【編輯:彭玉婷】
相關新聞 |
視頻更 多
28支龍獅隊齊集錦田爭奪“獅王”殊榮 龍獅隊員:十年後再來表演舞獅爭霸!
周潤發率“百歲”港星團跑馬拉松:重在完成,重在和觀眾打個招呼
樓市寒冬已過?現在是買樓好時機嗎?聽聽地產專家怎麼說
誰能成為下一個Labubu? 潮玩商家們為何集體聚焦盲盒發展?
香港立法會舉行首次會議 通過大埔火災後支援及重建工作議案
【你不知道的香港】高樓林立的香港正悄然進行一項“移山計劃”......
【通說環球】科幻照進現實?解碼中國“南天門計劃”
來論更 多評論更 多
論壇更 多閱讀排行
|










