首頁 -> 內地

阿里雲音視頻AI助手“通義聽悟”能力升級

分享到:
2024-03-22 15:15 | 稿件來源:香港新聞網

【字號:

香港新聞網3月22日電 阿里雲工作學習人工智能(AI)助手“通義聽悟”發佈多項新功能,包括上線音視頻問答助手,基於紀錄內容回答用戶查詢,並可一鍵跳轉回顧原文。用戶還可以針對超長網課、會議等音視頻內容提問,利用AI能力總結知識點、將口語化表達潤色成書面表達,並製作可視化腦圖等。

音視頻承載訊息密集,但查找、回顧與提煉信息十分耗時。阿里雲“通義聽悟”產品負責人楊帆表示,作為一款工作學習AI助手,“通義聽悟”希望能夠讓高知識附加值的音視頻被輕鬆閱讀、整理和分享。

hk_c_image.png

“通義聽悟”此次推出的音視頻問答助手“小悟”可以根據紀錄內容,回答用戶提問的相關話題。“小悟”支持單個紀錄,多個紀錄和多種語言自由問答,並提供原文位置,用戶可以一鍵跳轉回顧。用戶還可以請“小悟”整理金句、梳理結論、整理會議紀要。

此外,根據用戶需求,“通義聽悟”還上線了一鍵AI改寫以及生成思維導圖的功能。一鍵AI改寫可以將口語化表達的內容在保持原意的基礎上,快速轉化成更具邏輯性、規範性和可讀性的書面格式,尤其適合整理會議和採訪內容。而腦圖則是通過AI以邏輯的方式可視化內容,還可以導出多種格式,方便保存和分享,還能幫助激發用戶靈感,拓展思維。

今次“通義聽悟”新功能發佈,背後是一系列的技術提升。作為AI音視頻產品,“通義聽悟”通過優化複雜多語言理解和多模態檢索、長篇內容建模理解、個性化指令生成和動態意圖檢索增強,提升了精準內容定位、高效問題引導、訂製化摘要與高質量答案回覆等綜合能力,從而提升用戶體驗。

依託“通義千問”大模型,於去年6月升級的“通義聽悟”專注音視頻實時文本轉寫,並能精準、高效地理解和分析多媒體內容,助力個人與企業提升工作和學習效率。“通義聽悟”音頻語言目前支持識別普通話、粵語、英語和日語,翻譯支持中文、英文和日語,韓語預計於4月初上線。支持轉寫單個文檔時長最高達6小時。

“通義聽悟”目前累積服務用戶數量超過百萬,來自各行各業,包括學生、教師、白領、媒體、金融分析師等。活躍用戶日均轉寫音視頻3次以上,平均每天處理字符數約20億字。企業和開發者可以通過“通義聽悟”API集成其AI能力,應用場景包括企業辦公、在線教育、金融服務和新聞媒體等。

“通義聽悟”融合了10多項AI能力,包括轉寫、翻譯、發言人角色分離、全文摘要、章節速覽、發言總結、PPT提取等,並支持標重點、記筆記,大幅提高從音視頻提取知識的效率。(完)


【編輯:張明臻】

視頻

更 多
專訪香港廉政專員胡英明:打擊貪污對於國家安全非常重要
讓沙特企業來港上市 只需做一件事!港交所前行政總裁李小加提出建議
美國要搞“中國特色的美國資本主義”?李小加:大浪來時美國這艘船會先顛覆
50年廉署咖啡的新內涵 香港廉政專員親身上陣煮咖啡
國際問題專家:特朗普上台後對華制裁恐持續 但中美關係的未來不完全由美國決定
葉劉淑儀:外界要求“釋放黎智英”是對香港司法制度的粗暴干預
中國大門越大越開 推動經濟發展 國際投資者們是否買帳?

論壇

更 多