当前位置:首页 >> 风趣深

蚂蚁集团官宣开源统一多模态大模型Ming

5月27日,蚂蚁模态在蚂蚁工艺日上,集团蚂蚁集团旗下的官宣百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模女秘书房东全集激活参数3B。蚂蚁模态 

蚂蚁集团官宣开源统一多模态大模型Ming-lite-omni

据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练信息。开源

https://huggingface.co/inclusionAI/Ming-Lite-Omni

今年以来,统多百灵大模型已经连续开源了多个模型产物,大模包括2个MoE架构的蚂蚁模态女助理求签算命后被诱导全集大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。

其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。

而本次开源的Ming-lite-omni产物在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。

百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去工艺探索的成果。

百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。

(雷峰网(公众号:雷峰网))

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

蚂蚁集团官宣开源统一多模态大模型Ming-lite-omni

  • 关注微信

猜你喜欢

热门标签

前经纪公司称千百惠葬礼拟于周六举行!5月不慎摔跤伤势严重养成系IP打破次元壁,爱奇艺《微笑一号店》将综艺营销玩出新花样自动驾驶领域,「决策」和「感知」终于握手言和比 Sora DiT 架构早两个月的 U唐嫣罗晋:很相爱,但选择各自精彩大模型中场之争:谁能先让企业把大模型用起来?雷峰网「GAIR 2023 GPT Pioneer 5」揭晓:GPT激流中的5位「领潮儿」个性经济时代,MiniMax 语音大模型如何 To C?内塔尼亚胡要求以军缩短进攻加沙城时间表曝阶跃星辰正在进行估值20亿美元融资;OpenAI放宽股票限制;Suno和Udio遭三大唱片公司起诉丨AI情报局《藏海传》引发观众二次创作的极大热情 “野生编剧”倒逼国产剧精细化创作周志华当选新一任国际人工智能联合会(IJCAI)理事会主席黄杨钿甜复出了,劣迹艺人的标准究竟是什么?漆远获新融资,阿里云参投;芯原创始人直言百模大战就是“群模乱舞”,是在浪费电;英伟达今年在华将交付超100万颗芯片丨AI情报局银幕对话:中外影史的多重奏《F1:狂飙飞车》曝中国独家预告海报 布拉德・皮特携顶级大片燃爆暑期宣布重大收购预案 开普云连续两日“20CM”涨停对话共生矩阵张林:大模型商业化要「两条腿」走路,开源落地优势不大《新说唱2025》举办“摊牌局”发布会 正式拉开“哈圈洗牌”序幕张颜齐疯狂调侃杨迪孔雀国王新造型,《萌探奇遇记》高能爆笑再度出圈!

推荐排行

  • [list:title len=50]
  • [list:title len=50]
  • [list:title len=50]
  • [list:title len=50]
  • [list:title len=50]
  • [list:title len=50]