(资料图片)
新华财经北京11月3日电(记者丁雅雯)3日,美团自研大模型 LongCat-Flash系列再升级。全新家族成员LongCat-Flash-Omni正式发布并开源,LongCat官方App同步上线公测。目前,新App已支持联网搜索、语音通话等功能,视频通话等功能会稍后上线;Web端则增加图片、文件上传和语音通话等功能。
据介绍,LongCat-Flash-Omni以LongCat-Flash系列的高效架构设计为基础,集成了高效多模态感知模块与语音重建模块,在总参数5600亿的庞大参数规模下,仍实现低延迟的实时音视频交互能力,为开发者的多模态应用场景提供了更高效的技术选择。
美团称,新模型也是业界首个实现“全模态覆盖、端到端架构、大参数量高效推理”于一体的开源大语言模型,首次在开源范畴内实现了对标闭源模型的全模态能力,并凭借创新的架构设计与工程优化,让大参数模型在多模态任务中能实现毫秒级响应,解决行业内推理延迟的痛点。
据介绍,全模态模型训练的核心挑战之一是“不同模态的数据分布存在显著异质性”。LongCat-Flash-Omni采用渐进式早期多模融合训练策略,在平衡数据策略与早期融合训练范式下,逐步融入文本、音频、视频等模态,确保全模态性能强劲且无任何单模态性能退化。综合评估结果表明,LongCat-Flash-Omni在综合性的全模态基准测试(如Omni-Bench, WorldSense)上达到了开源最先进水平(SOTA),并在文本、图像、音频、视频等各项模态的能力位居开源模型前列,实现“全模态不降智”的结果。
9月1日,美团正式对外发布并开源了自研大模型LongCat-Flash-Chat。这是美团首次将大模型作为完整产品开放给行业与开发者。

开拓者官宣:已召回杨翰森
察右后旗:举行2026年度城乡居民医保参保宣传活动
天成控股于11月3日上午起短暂停牌-焦点信息
新消息丨广州农商银行前三季度净利润17.22亿元
新动态:奋进的河北·“十四五”答卷丨大数据里“读”河北(八):交通一体化催生同城新生活
唢呐起!郑州航空港女排主场沸腾了-焦点消息
福莱特玻璃(06865.HK)获摩根大通增持460.1万股 重点聚焦
北汽蓝谷:子公司10月份销量同比增长112.02%
万科A:与深铁集团签署框架协议 约定深铁集团向公司提供不超过220亿元借款额度
热推荐:比亚迪:10月出口新能源汽车合计83904辆
观天下!上汽集团10月销量45.4万辆 连续十个月同比增长
每日短讯:ST逸飞:签订约1.9亿元海外采购订单
机器人在十五运会当上火炬手了!-看点