(相關(guān)資料圖)
據(jù)美團(tuán)官微消息,11月3日,美團(tuán)LongCat-Flash系列再升級(jí),正式發(fā)布全新家族成員——LongCat-Flash-Omni。
自9月1日,美團(tuán)正式發(fā)布LongCat-Flash系列模型,現(xiàn)已開源LongCat-Flash-Chat和LongCat-Flash-Thinking兩大版本。
據(jù)介紹,LongCat-Flash-Omni是一款開源全模態(tài)模型,在一體化框架中整合了離線多模態(tài)理解與實(shí)時(shí)音視頻交互能力。LongCat-Flash-Omni以LongCat-Flash系列的高效架構(gòu)設(shè)計(jì)為基礎(chǔ)(Shortcut-Connected MoE,含零計(jì)算專家),同時(shí)創(chuàng)新性集成了高效多模態(tài)感知模塊與語(yǔ)音重建模塊。即便在總參數(shù)5600億(激活參數(shù)270億)的龐大參數(shù)規(guī)模下,仍實(shí)現(xiàn)了低延遲的實(shí)時(shí)音視頻交互能力,為開發(fā)者的多模態(tài)應(yīng)用場(chǎng)景提供了更高效的技術(shù)選擇。
綜合評(píng)估結(jié)果表明,LongCat-Flash-Omni在全模態(tài)基準(zhǔn)測(cè)試中達(dá)到開源最先進(jìn)水平(SOTA),同時(shí)在文本、圖像、視頻理解及語(yǔ)音感知與生成等關(guān)鍵單模態(tài)任務(wù)中,均展現(xiàn)出極強(qiáng)的競(jìng)爭(zhēng)力。LongCat-Flash-Omni是業(yè)界首個(gè)實(shí)現(xiàn) “全模態(tài)覆蓋、端到端架構(gòu)、大參數(shù)量高效推理” 于一體的開源大語(yǔ)言模型,首次在開源范疇內(nèi)實(shí)現(xiàn)了全模態(tài)能力對(duì)閉源模型的對(duì)標(biāo),并憑借創(chuàng)新的架構(gòu)設(shè)計(jì)與工程優(yōu)化,讓大參數(shù)模型在多模態(tài)任務(wù)中也能實(shí)現(xiàn)毫秒級(jí)響應(yīng),解決了行業(yè)內(nèi)推理延遲的痛點(diǎn)。
標(biāo)簽: 美團(tuán) 模態(tài) 大模型 omni 知名企業(yè) flash