AI视频“卷”成红海,创业公司还有机会吗
来源 :@经济(jì)观察报微博
经济(jì)观察网 记者 任晓宁 9月11日,AI视频创业公司(sī)生数科技创始团队在北京亮相,这是今年(nián)4月份在 中关村论坛一(yī)炮(pào)而红后,生数(shù)科(kē)技团队成员的首次露面。
生数科技的产品名为Vidu,是(shì)国内首个长时长、高一致性、高动态性视(shì)频大模型,当时备受外界关注。不过时至9月,AI视频行业已(yǐ)经有了(le)很(hěn)大变化,Vidu不再(zài)一枝独秀,快(kuài)手、字节跳动、阿里巴巴、智谱(pǔ)AI、MiniMax、商汤等公司都已经推出AI视频产品。据经济观察报不完全(quán)统计(jì),仅在国内(nèi),过去4个月时间便有(yǒu)超过10家公司推出了自研AI视频产品。
东吴证券今(jīn)年8月发布的(de)国(guó)产AI视(shì)频(pín)大模型(xíng)深度报告测算,AI视频的(de)潜在行业空间为3178亿(yì)元(yuán)。东吴证券还(hái)估算,在全AI模式下,电影(yǐng)、长剧、动画片和短剧(jù)的制(zhì)作(zuò)成本(běn),相较传(chuán)统模式将下降超过95%。
AI视频的(de)未来听(tīng)起来很美好,但这个领域,目前并没有出现一个出圈的爆款应用(yòng)。无论是AI视频产品还是(shì)由AI生成的视频作品,都像是(shì)少数影视专业人士的玩具,局限在(zài)小圈子(zi)范围内,始终(zhōng)未能像ChatGPT(美国(guó)头部AI应用)一(yī)样在大众层面获(huò)得认可。
AI视(shì)频赛道能成为大众市场吗?它的商业机会在哪里?大厂入局之后,它的市场竞争愈加激烈,创业公司还有机(jī)会吗?生数科技CEO唐家(jiā)渝接受经济(jì)观察报在内的媒体采访时,回应了上述问题。
关于竞争(zhēng)和融资
经济观察报:Vidu发布4个月以来,国内陆续出现很多AI视(shì)频公司,头(tóu)部大厂也都推出了AI视频产(chǎn)品。作(zuò)为曾经(jīng)的(de)黑马,Vidu现在还有优势吗?
唐家渝:目前在AI视频语(yǔ)义理(lǐ)解方(fāng)面(miàn),我们能(néng)做到业界最好(hǎo)。另外Vidu在视频动(dòng)作幅度较大的情况下,能保持较好的连贯性,用户公认这一点我们做得好。我们最近发布了AI视(shì)频主(zhǔ)体参照(zhào)一致性生成(chéng)能力,这是全 球首发的能力,可以解决AI生成视频的(de)剧情连贯性问题。从这些技术角度,我们是 有优势的。
Vidu在全(quán)球最早提出了Diffu-sion(扩散模(mó)型(xíng))与Transformer(一种基 于(yú)自注意力机制的深(shēn)度学习模型(xíng))融合的底层架构U-ViT,并坚持自主的底层算法研发,没(méi)有采用开源结构,这也是(shì)我们的底气。
经济(jì)观察报:国内AI视频公司已经有10多家,大(dà)家的技术路线和(hé)商业化路径会不会出现同(tóng)质化趋势?
唐家 渝:在技术路(lù)线上,AI视频行业目前处于底(dǐ)层架构收敛的状态,可以理解为同质化,但(dàn)并不(bù)意味着大(dà)家进展都一样。例如现在的大语言模型都会使用 Transformer架构,但OpenAI(美(měi)国头部AI公(gōng)司)是明(míng)显领先的。
在底层架(jià)构统一的基础上,各个公司会有 一(yī)些差异性(xìng)。例(lì)如,如(rú)何有效压缩(suō)视频(pín),如何在保证 质(zhì)量的情况下快速(sù)生成视频,会涉及非常多算法技巧、算法难点,这是导致差异性的主要原因。
目前(qián)各个公司的(de)商业方(fāng)向也是比较类似(shì)的,即便是Sora、Runway等国外AI视频应(yīng)用,也都在积(jī)极地拥抱好莱坞,或者与广告(gào)公司合作,这是AI视频(pín)技术比较好落(luò)地的领域。总体来说,AI视频还(hái)处于行业发展前期(qī),还有很长的路要走。
经(jīng)济(jì)观察报(bào):今年6月,生数科(kē)技公布了数亿元融资,接下来会 有什么样的融资规划(huà)?今年大模型(xíng)公司融资都面临一个困境,很难依靠技术和(hé)团队吸引投资,投资方会要求商(shāng)业化能(néng)力(lì)。你们是否也 面临同样的问题?
唐家渝:我(wǒ)们(men)正在(zài)做(zuò)新(xīn)一轮的融资。融资过程中,技术仍是(shì)很(hěn)关键的东西(xī),目前的AI视(shì)频生成只是初步符合了物理规律(lǜ),还(hái)有很高的技术天花板(bǎn)需要突破,比如更强的模型(xíng)能力以(yǐ)及更多模(mó)态(tài)的协同生成。
我们经(jīng)过一年半的成长,在商业化 方面已经(jīng)阶段性交出了比较好的(de)答卷。其实大家耳熟能详的一些大客户,已经(jīng)接入了Vidu的底层视频(pín)生产能力了(le),只是我(wǒ)们目(mù)前还不能公布。
经济观察报:你们会如何选择(zé)投资者?有什(shén)么考量?
唐家渝:我们会更愿意选择长期陪伴的投资(zī)者,无论是从资(zī)源、战略(lüè)协同上,还是上下游产业上,我觉得都可 以接受,最主(zhǔ)要的还是希望(wàng)大家(jiā)能有长期一起往前走的机会。
关于商业 化
经济观察报(bào):现在Vidu是否已经商业化?有(yǒu)哪些已经落(luò)地的商业场景(jǐng)?
唐家(jiā)渝:商业模式主要有(yǒu)两(liǎng)种。一(yī)种是SaaS(软件即(jí)服务)订阅模(mó)式,用户打开Vidu.studio可以直接体验到产品功能。目前我(wǒ)们每月(yuè)有80个免费积分,如果用户有(yǒu)更多的(de)需求或想使用更(gèng)高级的能力,就需要支付订阅费用。另一种是API(应(yīng)用程序(xù)编程接口)形式,将模(mó)型能AI视频“卷”成红海,创业公司还有机会吗力(lì)输出形(xíng)式提供给(gěi)大家,即MaaS(模型即服务)。现在有很多客户需要具备(bèi)视频生成的能力,作为他们已有工作(zuò)流程的一个环节,所以他们希望(wàng)直接调用(yòng)模型的能力。
我们的客户主(zhǔ)要来自与视频内容相关的领域(yù),比(bǐ)如广告、游戏、短剧和影视等。另(lìng)一部分(fēn)客户是C端(个 人用户端)应用,他们需要AI视频能力支(zhī)撑他们的新(xīn)玩法。
经济观 察报:在C端市场和(hé)B端(企业客户端)行业,哪个领域的AI视频增长(zhǎng)潜力更大?
唐(táng)家渝:B端的需求比(bǐ)较稳(wěn)定、确定,能带来比较直接的收入(rù)。在接(jiē)触B端行业的过程(chéng)中,我们发现,他(tā)们提出的都是实实在在的需求(qiú),并不是还没想(xiǎng)清(qīng)楚就简单试(shì)一下(xià),所以B端是我们长期重点关注的方向。
上线一(yī)个月以来,我们(men)的C端用户增长曲线非常高。所以,我们也在不(bù)断探索C端商业化的(de)过程中。
经济观察报:现在AI视(shì)频主要是艺(yì)术家、影视专业人(rén)员在用,普通人用(yòng)一下就不(bù)用(yòng)了。这(zhè)个工具什么(me)时候能普(pǔ)及到大(dà)众?会不会一直只是小众人群的玩具?
唐家(jiā)渝:AI视频不会一直都是小(xiǎo)众产品。就 像拍照一样,一开始只(zhǐ)是摄(shè)影爱好者或(huò)摄影师群体使(shǐ)用,现在(zài)拍视频(pín)、拍照已经成为每个人的(de)习惯。
现在的AI视频已(yǐ)经发展到了一个节(jié)点,Vidu最新发布的功能(néng)是,只需输入一张图像,就可以保持该主体的一致性,生成各(gè)种场景的视频(pín)。我们正在努力降低视(shì)频创作(zuò)的门槛,让(ràng)Vidu成为一(yī)个大众(zhòng)愿意使用的产品,今年年底应该就能普及到大众。
关于(yú)局限和(hé)突围
经济观察报:很多人觉得用AI生成视频很难,为什么会这样?视(shì)频生成技术还存在怎样的局限性或瓶颈?
唐家渝:目前(qián)的视(shì)频生成模型最大的局(jú)限性在于可控性不(bù)足(zú)。比如生成(chéng)一(yī)段画面,画面 里的人物或(huò)者对象容易崩坏,生成的结果也(yě)有很大的(de)随机性,需要不断地(dì)尝试,这背后的(de)本(běn)质是(shì)目前(qián)视(shì)频生成(chéng)技术的稳定性还不够。
从实际落地的层面上看,上面(miàn)我们(men)提(tí)到的广告、短剧等场景,对画面连(lián)续性、一致性的要(yào)求是(shì)很高的。即便是C端用户单 纯去玩,也会希(xī)望能一次性就生成一个他 们想要的画面,这背后都是围绕可控性的需求(qiú)。
经济观察报:这种不可控的瓶颈能否实现突破?如果(guǒ)技术(shù)继续进步,会在哪些方面有所提(tí)高?
唐(táng)家(jiā)渝:我们刚刚发布的主体(tǐ)参照功能,已经在一致性生(shēng)成方面带来(lái)了很大提升。
当然,技术还有更进一步提升的空间(jiān)。比(bǐ)如一(yī)个精雕细琢的柜子,上面有(yǒu)繁(fán)复花纹(wén)和镂空(kōng)部分(fēn),对于这(zhè)样复杂(zá)的结构,目前AI视频生成成功的概率依旧不高。场景生成包含很(hěn)多(duō)组成因素,例如AI视 频生成的一款(kuǎn)运动鞋,我希望(wàng)它能在更复杂、更动态化的场景中有更好(hǎo)的表现。这些都(dōu)需要不(bù)断提升模型能力。
AI视频“卷”成红海,创业公司还有机会吗未经允许不得转载:橘子百科-橘子都知道 AI视频“卷”成红海,创业公司还有机会吗
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了