首頁 -> 國際

Meta發布兩款最新開源大模型

分享到:
2025-04-07 09:26 | 稿件來源:香港中通社

【字號:

香港中通社4月6日電 4月5日,臉書母公司Meta推出最新兩款大型語言模型Llama 4 Scout和Llama 4 Maverick。Meta稱,它們是公司“迄今最先進的模型”,且是“同類中最佳的多模態模型”。

Meta標識。香港中通社圖片

Meta表示,Llama 4是其首個採用混合專家(MoE)架構的模型系列,這種架構在訓練和回答查詢時計算效率更高。混合專家架構基本上是將數據處理任務分解為子任務,然後將它們委派給更小的、專門的“專家”模型。

例如,Maverick總共有4000億個參數,但在128個“專家”模型中只有170億個活躍參數(參數數量大致與模型的問題解決能力相對應)。Scout有170億個活躍參數、16個“專家”模型以及總計1090億個參數。

在中國大語言模型DeepSeek引領開源浪潮以前,Meta一直是開源模型的行業領先者。Llama系列模型由Meta在2022年推出。Llama是一種多模態人工智能(AI)系統,能够處理和整合多種類型的數據,包括文本、視頻、圖像和音頻,且可以轉換成不同格式。

美國OpenAI的大語言模型ChatGPT橫空出世7個多月後,2023年,Meta就率先宣布開源Llama 2,並且可免費商用。這也成為大模型發展的分水嶺。

本月5日Meta最新發布的是Llama第四代模型的兩個版本,它們也將開源。Meta還稱,另一款模型Llama 4 Behemoth還在“訓練”中,並稱之為“世界上最聰明的大型語言模型之一”。(完)

【編輯:石歡歡】

視頻

更 多
28支龍獅隊齊集錦田爭奪“獅王”殊榮 龍獅隊員:十年後再來表演舞獅爭霸!
周潤發率“百歲”港星團跑馬拉松:重在完成,重在和觀眾打個招呼
樓市寒冬已過?現在是買樓好時機嗎?聽聽地產專家怎麼說
誰能成為下一個Labubu? 潮玩商家們為何集體聚焦盲盒發展?
香港立法會舉行首次會議 通過大埔火災後支援及重建工作議案
【你不知道的香港】高樓林立的香港正悄然進行一項“移山計劃”......
【通說環球】科幻照進現實?解碼中國“南天門計劃”