首頁 -> 內地
全球首個百億級可部署基因組基礎模型誕生分享到:
香港中通社10月23日電 10月23日,中國深圳華大生命科學研究院與杭州之江實驗室聯合發布全球首個百億參數可部署的基因組通用基礎模型Genos。該模型支持多達百萬鹼基對的超長上下文分析,並實現單鹼基分辨率的精準識別。
圖源:“華大集團BGI”微信公眾號截圖 人類基因組由30億對鹼基組成。“人類基因組計劃”破譯了序列,但序列上鹼基的具體功能仍需要精準識別和解析。 現有模型大多基於1至2個參考基因組開展訓練,難以體現人類遺傳資源的多樣性。而Genos整合了人類泛基因組參考聯盟(HPRC)、人類基因組結構變異圖譜計劃(HGSVC)等多個權威公開資源,首次將全球範圍內636個“端粒到端粒”級別的高質量人類基因組作為訓練數據。這些數據覆蓋了全球不同人群,有助更全面理解人類遺傳多樣性。 算法架構方面,Genos通過“混合專家”架構,精準調度強相關“專家”算法協同處理,在匯總百億級龐大參數時成功降低推理成本和資源消耗,讓模型既強大、又好用。 測試結果顯示,Genos在直接面向臨床應用的致病性突變解讀任務中,準確率達92%;結合科學基礎模型後,準確率高達98.3%。多項綜合評測結果也顯示,Genos超越現有最佳水平模型。 華大生命科學研究院相關負責人說,Genos模型已在HuggingFace(抱抱臉)、魔搭等平台全面開源開放,提供12億和100億參數兩個版本,滿足不同需求。(完) 【編輯:彭玉婷】
相關新聞 |
視頻更 多
“家鄉市集”最後一天 香港市民湧入維園瘋搶“家鄉味”
“我感到嫉妒!” 中東小哥深度遊覽大灣區後“破防了”
“阿嬤熱”來襲!這屆香港潮州節星光熠熠 現場火爆 有攤位半天賣出了百隻鹵鵝
香港特首李家超的哈薩克斯坦之行,取得這些成果
定了!《給阿嬤的情書》6月18日香港上映 市民:會二刷三刷 帶上小朋友去看
【通說環球】“鉛筆芯靠我賣”神曲背後:一座非洲百年礦山的“重生”歷程
來香港家鄉市集 買“給阿嬤的情書”同款橄欖菜!
來論更 多評論更 多
論壇更 多閱讀排行
|










