IDC站长站,IDC站长,IDC资讯--IDC站长站IDC站长站,IDC站长,IDC资讯--IDC站长站

硅基智能创始人司马华鹏:所有使用AI的人,应该专注 到人类特有的东 西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注 到人类特有的东 西

“大家(jiā)好,我(wǒ)是刘强东,今(jīn)天是不是看起来有些不同?很久没直播,还有(yǒu)些许紧张……话不多说,老刘(liú)的数字(zì)直播带货现在开始。”4月16日,京东创始人(rén)刘强东在京东平台开启数字人(rén)直播。

“东哥”数字人直播,迅(xùn)速引起(qǐ)广泛关注,数字人替代真人直播的时代来临了(le)吗(ma)?

4月18日,数(shù)字人(rén)头(tóu)部厂商硅(guī)基智能创(chuàng)始人司马华鹏接受了《每日经 济(jì)新闻》记者的专访。司马华鹏表示:“刘(liú)强东这次数字人直播,对我们行业是非(fēi)常(cháng)大的品牌宣传。他 使用(数字(zì)人直播),说(shuō)明这个行业得到了一次(cì)非常重要的认可。”

对(duì)于AI的使用,司(sī)马华鹏建议(yì):“未来所 有使用AI的人,应该专注到人类特有的东(dōng)西,比如创意,比如有温度的东西。”

拆(chāi)解(jiě)数字人技术

“数字人刘强东”是否有(yǒu)硅基 智能(néng)技术的(de)支持?司(sī)马(mǎ)华鹏表示:“我们不太方便对外公开(kāi),但这些技术最早的开创者肯定是我(wǒ)们。我们在整个(数字人)直(zhí)播(bō)上大概有40多项发明专(zhuān)利 ,在申请的(de)也有几十项(xiàng)。现在行业内有很多在使用我们的技术授(shòu)权,也有很多在使(shǐ)用硅基智能的API(应用程(chéng)序编程接口(kǒu))。”

“东哥”数字人究竟是如何打造出来的?司马华鹏介绍(shào):“它(数(shù)字人)这(zhè)些内容是(shì)用(yòng)AI渲染出来的。如(rú)果现在想(xiǎng)做东哥(gē)同款,你需要提供几分钟的视频。然后我 们会将其训练成(chéng)一(yī)个数(shù)字人模型(xíng)。这个数字人(rén)模型背后,将(jiāng)由大(dà)模型(xíng)驱(qū)动它。定时(shí)去上一些产(chǎn)品(pǐn)、定时回复一些客(kè)户(hù)需求、定时 作一些(xiē)记录,这 些都是事先做好的剧(jù)本(běn),这些剧本实质由大模型(xíng)驱(qū)动,比较(jiào)接近于人类的行为和反馈。”

那么,除了上(shàng)述(shù)AI渲染(rǎn)技(jì)术外,数字人直播还(hái)需要(yào)哪些(xiē)技术支持?司马华鹏称:“我们的大模型是多模态的(de),是文本生成、声音生成(chéng)和(hé)数字人生成的(de)结合。其实(shí)很多人在反馈,他(刘 强东)声音和节 奏感与(yǔ)他原来讲话不(bù)太一样(yàng)。这(zhè)很可能克隆的(de)是平时的语(yǔ)速,但是直播(过程中),一(yī)个用户(hù)停留时长是比(bǐ)较短的,你必须在(zài)很短时间(jiān)内把大量的信息披露出来,所以(yǐ)必须 把声音(yīn)放得快一些。”

对于语音合(hé)成(chéng)技术,司马华鹏表示:“我们全部技术都是自己的。从目(mù)前端到端 的生(shēng)成(chéng)来讲(jiǎng),(语音合生活需要450字(hé)成)已经是一个非常成(chéng)熟的(生活需要450字de)技术。”

数字人形象、语音合成(chéng),都是外(wài)在展现形式,数(shù)字人 直播(bō)内容(róng)仍旧离不开文本。对(duì)于文本,司(sī)马华鹏称:“文(wén)本大(dà)模型方面(miàn),我们基本(běn)上都是原创的技术,最近‘炎帝’大模型刚刚通过(guò)网信办(bàn)的备案。”

能否替 代真人直播?

目前,大家看到的直播带货(huò),很可能就是数字人。司马华鹏介绍:“我们在2021年开创AIGC直播的(de)大方向,(刘强东数字人(rén))基本(běn)上是我们2023年产品(pǐn)能够呈现出来的效果,这样的直播间(jiān)我(wǒ)们已经卖(mài)掉了上万个,京东、淘宝、抖音、快手和视频号平台都有。”

真人直播会面临各种复杂场景,特(tè)别是情感交(jiāo)流,数(shù)字人可以做到吗?司(sī)马(mǎ)华鹏(péng)表示 :“我们在看东(dōng)哥直播(bō)的(de)时候,会不会把他(数字人)当(dāng)作真正的东哥来(lái)看,这是决定数字人智(zhì)能化(huà)程度的重要 标(biāo)志。从开播(bō)到现在,行业有非(fēi)常多的评价,大(dà)家(jiā)觉(jué)得还是 能看到一些机械的(de)痕迹(jì)。”

“这个(数字人)行业发展的核心就(jiù)是‘看 不出来’。”司马华鹏强调。

其认为:“我们现(xiàn)在也有大量的直播间,效果比(bǐ)这个(刘强东数字人)要好很多。如果他这个直播不是在自(zì)家平(píng)台,而是在其(qí)他平台,很(hěn)容易被机器(qì)识别出(chū)来,很快就会被限流。”

因此,在司马华鹏(péng)看来,数字人行业的核(hé)心是让整个直播间符合(hé)图灵测试。对于数字(zì)人行业的发展,其认为:“(该领域)图灵测试1.0是(shì)分不清(是(shì)人类还是AI);图灵测试2.0则是(shì)双向情感交互(hù);图灵测试3.0就是‘死生相契(qì)’,未(wèi)来我们与AI之间,可能是Soul Mate(心灵伴侣)的关(guān)系,它是你非常重要(yào)的助手、朋友,也可能是你亲密的合作(zuò)伙伴。”

目前,很(hěn)多问答式(shì)大模(mó)型主要给受众提供(gōng)专业类辅助(zhù),但若诉诸情感,是否兼具图(tú)像、声音(yīn)和文本的(de)多模(mó)态大模型更(gèng)具优势?对此,司马华鹏表示认 可(kě)。“人类大脑的设计(jì)中,90%以上是针对图形,所以我们说有图有真相。基于文本,产生的是想(xiǎng)象力,(阅读文本)的能力确实非常重要,但(dàn)对大部分人(rén)而言,(自 己的大脑(nǎo))生成图片,然后再(zài)想象出一个(gè)空间,还原出这个东(dōng)西,是非常(cháng)累的。因此,多模态或者视频化交互能力,能够大大降低我们之间信息沟通(tōng)对应的(de)脑力消耗。”

对于未来AI电商的形态,司马华鹏认为,未来更大的价值是专业(yè)性(xìng)。比如说,假设我们在食品领域有一个很好的AI专家,它可以从数据、算(suàn)法的(de)角度给我 们提(tí)供很多 的专(zhuān)业 内容。这样的专家,它带来的影(yǐng)响力会超过现有的人类专家,这会带来真正的、更好的电商交易。

其进一步解释称:“人类在(zài)做很多(duō)行为(wèi)的时候,有一定的偏颇或者(zhě)偏见,或者带有一定的商业目的(de)。而以数字和算法驱动的AI专(zhuān)家,会成为(wèi)我们的(de)朋友、我们的伙伴,很(hěn)有(yǒu)可能成为(wèi)AI电商未来的主流。现 在这些成本还比较高,只是出(chū)现在奢侈(chǐ)品领域。我(wǒ)希望未来每(měi)一类(lèi)小产品上,都有这样一个专家顾问,来给我们提供非常好的沟通交(jiāo)流(liú)方式。这是AI电商未来非常重 要 的一部分。”

未经允许不得转载:IDC站长站,IDC站长,IDC资讯--IDC站长站 生活需要450字

评论

5+2=