昆仑万维参与联合发布重磅通用视觉多模态大模型系迈向通用人工智能（AGI）重要一步

证券时(shí)报网讯，日前(qián)，由颜水成教授(shòu)带(dài)队，昆仑万维(wéi)2050全球研究院、新加坡国立大学(xué)、新加坡南洋理(lǐ)工大(dà)学(xué)团队(duì)联合发布并开源了Vitron通用像素级视(shì)觉多模态大语言模型。

据介绍，这是一款重磅的通用视觉(jué)多模(mó)态(tài)大模型，支(zhī)持(chí)从(cóng)视觉理解到视觉生成、从低层(céng)次到高层(céng)次的一系列视觉任务，解决了困扰大语言模型产业已久的图像/视频模型割裂(liè)问题，提(tí)供了一(yī)个全面昆仑万维参与联合发布重磅通用视觉多模态大模型系迈向通用人工智能（AGI）重要一步统(tǒng)一静态图像与动态视频(pín)内容的理解、生成、分割、编辑等任务的像素级通(tōng)用视觉多模态大模型，为下一(yī)代通用视觉大(dà)模型的终极形(xíng)态奠定了基础(chǔ)，也标志着大模型(xíng)迈向(xiàng)通用人工智(zhì)能（AGI）的又一大步。

Vitron作为一昆仑万维参与联合发布重磅通用视觉多模态大模型系迈向通用人工智能（AGI）重要一步(yī)个(gè)统一的像素级视觉多模(mó)态大语言模型，实现了从(cóng)低层次到高层次的(de)视觉任务(wù)的全面支持，能(néng)够处理复杂的视觉任务，并理解和生成图像和(hé)视频内容，提供了强大的视觉理(lǐ)解和任务(wù)执行能力。同时，Vitron支持与用户的连续操(cāo)作，实现了灵活(huó)的人机互动，展示了通向更统一的视觉多模态通(tōng)用(yòng)模型的巨大潜力。

Vitron相关的论文、代码和(hé)Demo已全部公开，其在综合性、技术创新、人机交互和应(yīng)用潜力等方面展现出(chū)的独特优势和潜(qián)力，不仅推(tuī)动了多模态大模型的发展，还(hái)为未来的视觉大模型(xíng)研(yán)究提供了一个新的方向(xiàng)。

公司方面(miàn)表示，一直以来(lái)，昆仑(lún)万维(wéi)2050全(quán)球研究院都致力于打造一家面向未(wèi)来世界的卓(zhuó)越科学研(yán)究(jiū)机构(gòu)，与科学社区共同跨越“奇(qí)点”，探索未知世界，创造美好未来。此前，昆仑万维2050全球研究院已经(jīng)发(fā)布并开源了数字智能体研发工具包昆仑万维参与联合发布重磅通用视觉多模态大模型系迈向通用人工智能（AGI）重要一步AgentStudio，未来，研究院还将不断推动人工智能技术突破，为中国人工智能生(shēng)态建设贡(gòng)献力(lì)量。(燕云)

校对：刘榕枝

未经允许不得转载：橘子百科-橘子都知道昆仑万维参与联合发布重磅通用视觉多模态大模型系迈向通用人工智能（AGI）重要一步