首頁 -> 頭條

中國人工智能開源模型橫空出世 印媒:美國的限制失效了

分享到:
2025-01-03 18:32 | 稿件來源:香港新聞網

【字號:

香港新聞網1月3日電  2024年末,刷屏的中國技術成果不僅僅是“六代機”,還有人工智能(AI)模型DeepSeek-V3。這款語言模型不僅在性能上媲美西方頂級閉源模型,其低成本高效能的特點更是引發海內外AI業界的高度關注。有美國媒體表示,OpenAI、谷歌等行業巨頭的主導地位將面臨挑戰。

DeepSeek官方網站截圖

總部位於杭州的DeepSeek日前發佈了全新系列模型DeepSeek-V3首個版本,并同步開源。據了解,DeepSeek-V3在多項基準測試中超越了Meta開發的Llama-3.1,并在性能上與OpenAI開發的閉源模型GPT-4o不分伯仲。

值得注意的是,在較高性價比的訓練架構下,DeepSeek-V3的訓練成本僅為560萬美元,訓練時長只有兩個月,遠低於OpenAI模型GPT-4o愈1億美元的成本及三個月的訓練時長。

技術突破、性能優越、低成本……被冠以“AI界高效低價典範”的DeepSeek-V3迅速爆火,AI賽道上崛起的這股中國創新勢力在海內外掀起了廣泛熱議。

美國CNBC報道指,DeepSeek-V3的重要性體現在,谷歌、OpenAI等AI巨頭迄今為止耗費了數十億美元和大量時間來建立新的語言模型,但中國的DeepSeek帶來了另一個可能性——低成本高效能。

CNBC稱,DeepSeek這種具有競爭力的AI企業的出現,將使AI開發的進入壁壘降低,OpenAI、谷歌、Meta等在行業中的主導地位將面臨挑戰。

美國科技媒體Tom’s Hardware報道指,DeepSeek-V3的出現表明,儘管美國的制裁導致中國獲取硬件受限,但聰明的中國科技從業者正努力從有限的硬件裡提取最大性能。DeepSeek的成就表明,使用相對有限的資源訓練高級混合專家(MoE)模型的語言模型這一做法具有可行性。

《印度快報》評論道,隨著DeepSeek-V3這一技術創新成果的出現,美國對華芯片出口限制或許不如預期那般有效。

《分析印度》則指,考慮到DeepSeek-V3的高性能,美國過去幾年對華制裁似乎產生了反效果,獲取硬件的難度增大導致中國高度重視模型架構層面的優化。

該媒體還提到,DeepSeek-V3的出現還在社媒平台上引發了一些猜想,即如果一開始獲取芯片沒有受限,中國AI技術會到達何種程度。(編譯:李雪萍)

【編輯:李雪萍】

視頻

更 多
28支龍獅隊齊集錦田爭奪“獅王”殊榮 龍獅隊員:十年後再來表演舞獅爭霸!
周潤發率“百歲”港星團跑馬拉松:重在完成,重在和觀眾打個招呼
樓市寒冬已過?現在是買樓好時機嗎?聽聽地產專家怎麼說
誰能成為下一個Labubu? 潮玩商家們為何集體聚焦盲盒發展?
香港立法會舉行首次會議 通過大埔火災後支援及重建工作議案
【你不知道的香港】高樓林立的香港正悄然進行一項“移山計劃”......
【通說環球】科幻照進現實?解碼中國“南天門計劃”