橘子百科-橘子都知道橘子百科-橘子都知道

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

“大家好,我是刘强东,今天是不是看起(qǐ)来有些不同?很久没直播(bō),还有些(xiē)许紧张……话不多说,老刘的数字直播带货现在开始。”4月16日,京东创始人刘强东在京东平台(tái)开启数字人直播。

“东哥”数字人(rén)直(zhí)播,迅速引起广泛关注,数字人替代真人(rén)直播的时代来 临了吗 ?

4月18日,数字人头部厂商(shāng)硅基智能创始人司马华鹏接受了(le)《每日经济新闻》记者的专(zhuān)访。司马华鹏表示:“刘强东这次数字人直播,对我们行业是 非常大(dà)的品牌宣传。他使用(数字人直(zhí)播),说明这(zhè)个(gè)行业得到了 一次非常重要的认可。”

对于AI的使用,司马华 鹏建议:“未来所有使用AI的人,应该专注到人类特有的东西(xī),比(bǐ)如创意,比如有温度的东西(xī)。”

拆解数字人技术

“数字人(rén)刘强 东 ”是否有硅基智能技术的支持?司(sī)马华鹏(péng)表示(shì):“我们不太方便对外公开,但这些技术最早的开(kāi)创者肯定是我们。我们在整个(数字人)直播上(shàng)大概有40多项(xiàng)发明专利,在(zài)申请的也(yě)有几十项。现在行业内有(yǒu)很(hěn)多在使用我们的技术 授权,也有很多在使用(yòng)硅基智能(néng)的API(应用(yòng)程序编程接口(kǒu))。”

“东(dōng)哥”数字人究竟是如何打造出来(lái)的?司马华鹏介绍:“它(数字人)这些内容(róng)是用AI渲染出来的。如果现在想做东(dōng)哥同款(kuǎn),你需要提供几 分钟的视频。然后我们会将其训练成一个数(shù)字人模型。这个数字(zì)人模型背后,将由大模型驱(qū)动它。定时(shí)去(qù)上(shàng)一些产品、定时回复一些客户需求、定(dìng)时作一些记录,这些都是事先做好硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西的剧本,这(zhè)些 剧本实质由(yóu)大(dà)模型驱动,比较接近于人类的行为(wèi)和反馈。”

那么,除了上述(shù)AI渲染技(jì)术外,数字人直播还(hái)需要哪些技术支持 ?司马华鹏称:“我们的大模型是(shì)多模态的,是文本生成、声音生成和数(shù)字人(rén)生成的结合。其实 很多人在反馈,他(刘强东)声音和节奏感与他原来讲话不太一样。这很可能(néng)克隆的是平时的语速,但是直(zhí)播(过程中(zhōng)),一个用(yòng)户停留时长是比较短(duǎn)的,你必须在很(hěn)短时间内把大量的信息(xī)披露出来,所以必须把声音放得快(kuài)一些(xiē)。”

对(duì)于语音合成技术,司马华鹏(péng)表(biǎo)示:“我(wǒ)们全部技术(shù)都是自己的。从目前端到(dào)端的生成来讲,(语音合成)已经是一个非常成熟的技术。”

数字人形(xíng)象、语 音合(hé)成(chéng),都是外在展现形式,数字人直播(bō)内容仍旧离不开文本。对于文本,司马(mǎ)华鹏称:“文本大模型方面(miàn),我们基本上都是原创的(de)技(jì)术,最近(jìn)‘炎帝(dì)’大模型刚刚通过网信办的备案。”

能否硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西替(tì)代真人直播?

目前,大(dà)家看到的直播带货,很可能就是数字人。司马华(huá)鹏介绍:“我们在2021年开创AIGC直播的大方(fāng)向,(刘强(qiáng)东数字(zì)人)基本上是(shì)我们2023年产品能够(gòu)呈现出来的效果,这样的直播间我(wǒ)们已经卖掉了上万个,京东、淘宝、抖音、快手和(hé)视频号平台都(dōu)有(yǒu)。”

真人直播会面临各种复杂场(chǎng)景,特(tè)别是情(qíng)感交流,数字人可以做(zuò)到吗?司马华鹏表示:“我们在看东哥(gē)直播的时候,会不(bù)会把他(tā)(数字 人)当作(zuò)真正(zhèng)的(de)东哥来看,这是决定数字人智能化程度的重要标志。从开播 到现在(zài),行(xíng)业有非(fēi)常多的评价,大家觉得还是(shì)能看到(dào)一些机械的痕迹。”

“这个(数字人)行业发展的核(hé)心就是‘看不出来’。”司马(mǎ)华鹏强调。

其认为:“我们现在(zài)也(yě)有大量的直播间(jiān),效果比这个(刘强东数字人(rén))要好很(hěn)多。如果他这个直播不是在(zài)自家平台,而(ér)是在其他平台,很容易(yì)被机器(qì)识别出来,很快就会被限流(liú)。”

因此,在司马华鹏看来,数字人行业的核(hé)心是让整个直播间符合图灵(líng)测试。对于数字人行(xíng)业的发(fā)展(zhǎn),其认为:“(该 领域)图灵测试(shì)1.0是分不清(是人类(lèi)还是AI);图灵(líng)测试(shì)2.0则是(shì)双向情感交互;图灵测试3.0就是‘死(sǐ)生相契(qì)’,未 来我们与AI之间(jiān),可能是Soul Mate(心 灵(líng)伴侣)的(de)关(guān)系,它是你非常(cháng)重要的助手、朋友,也(yě)可(kě)能是(shì)你亲密的合作伙伴。”

目前(qián),很多问答式大模型(xíng)主 要(yào)给受众提供专(zhuān)业类辅助,但若诉诸情感,是(shì)否兼具图(tú)像、声音和文本的多模态(tài)大(dà)模型更具优势?对此,司马华鹏表示(shì)认可。“人类大脑的设计中,90%以上是针(zhēn)对图(tú)形(xíng),所以我们说有图有(yǒu)真相。基于文本(běn),产生的是想象(xiàng)力,(阅读文本)的能力(lì)确(què)实非 常重要,但对大 部分人而言,(自己的大脑(nǎo))生成图片(piàn),然 后再想象出一个空间,还原出这个东西,是非常累的。因此,多模(mó)态或者视频化(huà)交互(hù)能力,能(néng)够大大(dà)降低我们之间信(xìn)息沟通对应的脑力消耗(hào)。”

对于未(wèi)来AI电商的形态(tài),司马华鹏认(rèn)为,未来更大的价值是(shì)专业性。比如(rú)说,假设(shè)我们在食品领域有一个(gè)很好 的AI专(zhuān)家,它可以从数据、算法的(de)角度给我们提供很多的专业内容。这样的专家(jiā),它带来(lái)的影响力会超过现有的人 类专家,这(zhè)会(huì)带来真正的、更(gèng)好的电商交易。

其进一步解释称:“人类在做(zuò)很(hěn)多行为的(de)时候,有一定(dìng)的偏颇或者偏见,或(huò)者(zhě)带有一定的商(shāng)业目的。而(ér)以数(shù)字和算法驱动的(de)AI专家,会(huì)成(chéng)为(wèi)我们的朋友、我们的(de)伙伴硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西,很有可能成(chéng)为AI电商未来的主流。现(xiàn)在这些成本还比较高,只(zhǐ)是出现在奢侈品领域。我希望未来每一(yī)类小产品上,都有这样一个(gè)专家顾(gù)问(wèn),来给我们(men)提供非常好(hǎo)的(de)沟通交流方式(shì)。这是AI电商未来非常重要的一部分。”

未经允许不得转载:橘子百科-橘子都知道 硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

评论

5+2=