阿里開源首個全模態大模型Qwen2.5-Omni-7B
阿里巴巴(09988)發布並開源首個端到端全模態大模型通義千問Qwen2.5-Omni-7B,可同時處理文本、圖像、音訊和視頻等多種輸入,並即時生成文本與自然語音合成輸出。
內地傳媒報道,在權威的多模態融合任務OmniBench等測評中,Qwen2.5-Omni刷新業界紀錄,全維度遠超谷歌(Google)的Gemini-1.5-Pro等同類模型。
Qwen2.5-Omni以接近人類的多感官方式「立體」認知世界並與之即時交互,還能通過音視頻識別情緒,在複雜任務中進行更智能、更自然的反饋與決策。開發者和企業可免費下載商用Qwen2.5-Omni,手機等終端智能硬件也可輕鬆部署運行。
