橘子百科-橘子都知道橘子百科-橘子都知道

硅基智能创始 人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

硅基智能创始 人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

“大家好,我是刘强东,今天是不是看起来有些不同?很久没直播,还有些许紧张……话不多说,老刘的数字直播带货现在开始。”4月16日,京东创始人刘强东在京东平台(tái)开启数字人直播。

“东哥”数字人直播,迅(xùn)速引(yǐn)起广泛关注,数字人替代真人直播的时代来临了吗?

4月18日,数字(zì)人头部厂商硅(guī)基智(zhì)能创始人司马华鹏接受了《每日(rì)经济新闻》记(jì)者的专访。司马华鹏表(biǎo)示(shì):“刘强东这次数字人直播,对我们行业是非常大的品牌宣传。他使用(数字人(rén)直播),说明这个行业得到了一次非常重要的(de)认可。”

对(duì)于AI的使用,司马华(huá)鹏(péng)建议:“未来所有使用(yòng)AI的(de)人,应该专注到人类特有的东 西,比如创(chuàng)意(yì),比如有温度的(de)东(dōng)西(xī)。”

拆解数(shù)字人技术

“数字人刘强东”是否有硅基(jī)智(zhì)能技术的支持?司马华鹏表示:“我(wǒ)们不太方便对外公开,但这些技术最早的开创者肯定是我们。我们在整个(数字人)直播上大概有(yǒu)40多项发明专利,在(zài)申请的(de)也有几十项。现(xiàn)在行业(yè)内有很多在使用我们 的技术授权,也有很多在使用硅基智能(néng)的API(应用程序编程接口)。”

“东哥”数字人究竟是如何打造 出(chū)来的?司马华鹏介绍:“它(数字(zì)人)这些内容是用AI渲染出来的。如果现在想做东哥(gē)同款,你需要提供(gōng)几(jǐ)分钟的视频。然后我们会将其(qí)训练成一个数字人模型。这个数字人模型(xíng)背(bèi)后,将由(yóu)大模型驱动它(tā)。定时去上一些产品、定时回复一些(xiē)客户需求、定时作一些记录,这些(xiē)都是事先做好的剧本,这(zhè)些剧本(běn)实质由大模(mó)型(xíng)驱动,比较(ji硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西t: 24px;'>硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西ào)接(jiē)近于人 类的行为和反(fǎn)馈。”

那么,除了上述AI渲染技术外,数字人直播还(hái)需要哪些技术支持?司马华鹏 称(chēng):“我们 的大模型是多(duō)模态的,是文本(běn)生成、声(shēng)音生成和数字人生成(chéng)的结合。其实很多人在(zài)反馈,他(刘强东)声(shēng)音和节奏感(gǎn)与他(tā)原来讲(jiǎng)话不太(tài)一样。这很可(kě)能克隆的是平时的语速,但是直播(过程中),一个用户停留时长是比较短的,你必须在很短时间内把大量的信息披露出(chū)来,所以必须把声音放得(dé)快一些。”

对于语音合(hé)成技术,司马华鹏(péng)表示:“我们全部技术都是自己(jǐ)的。从目前(qián)端到端 的生成来讲,(语(yǔ)音合成)已经是(shì)一个非常成熟(shú)的技(jì)术。”

数字人形(xíng)象、语音合成,都是外(wài)在(zài)展现形式,数(shù)字人直播内容仍旧离不开文本。对于文(wén)本,司马华(huá)鹏称:“文本大模型方面(miàn),我们基本上都是原创的技术,最近 ‘炎帝’大 模型(xíng)刚刚通过网信办的备案。”

能否(fǒu)替(tì)代真 人直播?

目前,大家看到的(de)直播带货(huò),很(hěn)可能就是数字人。司马华鹏介绍:“我们在2021年开创AIGC直播的大方向,(刘强(qiáng)东数字人(rén))基本上是我们2023年产品能够呈现出来的效果,这样(yàng)的直(zhí)播间我们已经卖掉了上万个(gè),京东、淘(táo)宝、抖音、快手和视频号平台都有。”

真人(rén)直播会面 临(lín)各种复杂场景 ,特别是情感交(jiāo)流(liú),数字人可以(yǐ)做到吗?司马(mǎ)华鹏表示:“我们在看东哥直(zhí)播(bō)的时候,会(huì)不会把他(数字人)当作真(zhēn)正的东哥来(lái)看,这是(shì)决定数字人智能化程度的重要标(biāo)志。从开播到现在,行业有非常多的评价(jià),大家觉得还(hái)是能看到一些机械的痕迹。”

“这个(数字人)行(xíng)业发展的核心就是‘看不出来’。”司马(mǎ)华鹏强调。

其认(rèn)为(wèi):“我们(men)现在也有大量的(de)直播间,效果比这个(刘强东数字人)要(yào)好(hǎo)很多(duō)。如果他这个直播(bō)不是在自家平台,而是在其他(tā)平台,很容易被机器识别出来,很快就会被限流。”

因此,在(zài)司马华鹏看来,数字人行业的核心是让整个直播间符(fú)合图灵测试。对于数字人行业的(de)发展,其认为:“(该领(lǐng)域)图(tú)灵测试(shì)1.0是分不清(是人类还是AI);图灵测试(shì)2.0则是双向情感交互;图灵测试3.0就是‘死生相契’,未来(lái)我(wǒ)们与AI之间,可能是 Soul Mate(心灵(líng)伴侣)的(de)关系(xì),它是你非(fēi)常重要的助(zhù)手、朋友,也可能是你(nǐ)亲密的(de)合作伙伴。”

目前,很多问答式大(dà)模型主要给受(shòu)众提供专业类(lèi)辅助,但 若诉诸情感,是否兼具图像、声音和文本的多模态大硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西模型更具(jù)优势(shì)?对此,司马华鹏表示(shì)认可。“人类大脑的设计中,90%以(yǐ)上是针对图形,所以(yǐ)我们说有图有真相。基于文本(běn),产生的是想象力,(阅(yuè)读文本)的能力确(què)实非常重要,但对大部分(fēn)人而言,(自己的大(dà)脑)生(shēng)成图片,然后(hòu)再想象出一个空间,还原出这个东西,是非常累的。因此,多模态或者视频化交互能力 ,能够大大降低我(wǒ)们之(zhī)间信息沟通对应的(de)脑力消耗。”

对于未来AI电商(shāng)的形态,司马华鹏(péng)认(rèn)为,未(wèi)来更大的价值是专业性。比如(rú)说,假(jiǎ)设我们在食品(pǐn)领域有(yǒu)一个很好的AI专家,它可以从数据、算法的(de)角(jiǎo)度给我们提(tí)供很多的专(zhuān)业内容。这样的专家,它带来的影响力会(huì)超过现有的人类专家,这会带来真(zhēn)正的、更好的电商交易。

其进一步解释称:“人类在做很多行为的时候,有一定的偏颇或者偏见,或者带有一定的商业(yè)目的。而以(yǐ)数字和算(suàn)法(fǎ)驱动的AI专家,会(huì)成为我们的朋友、我们的伙伴,很有(yǒu)可能成为AI电商未来的主流。现在这些(xiē)成本(běn)还比(bǐ)较高,只是出现在奢侈品(pǐn)领域。我希望未来每一类小(xiǎo)产品上,都有这(zhè)样(yàng)一个专家顾问,来给我们提供非(fēi)常好的沟通交流方式。这是AI电商未来非常重要的一部分。”

未经允许不得转载:橘子百科-橘子都知道 硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

评论

5+2=