深夜,当你在网上冲浪,不经意间打开直播间,可能会看到一位妆容精致、精神饱满的主播正在推荐产品,丝毫不见熬夜的疲态。
如果不是屏幕角落的一行小字,你可能很难发现,这些不知疲倦的主播,实则是AI数字人。
AI数字人带货早已不是什么新鲜概念了。早在2020年的“双11”期间,飞利浦、欧莱雅等品牌就启用了早期虚拟人“AI主播”来带货。今年4月,刘强东的AI数字人“采销东哥”亮相京东采销直播间,首场直播成交额超5000万元,随后京东平台上的多家品牌旗舰店开启了总裁数字人直播……
近年来,“数字人带货”迅速升温,各大平台纷纷推出AI数字人直播,开启了一种全新的直播模式。但AI数字人带货真的靠谱吗?让人分不清真假的AI数字人主播,又是怎样炼成的?未来,AI数字人带货又将走向何方?近日,记者与人工智能领域及电商直播领域的专家学者一同探讨。
AI数字人主播是怎样炼成的?
“大家好,好久不见,我是你们的老朋友东哥……”4月16日,京东创始人刘强东的数字人分身“采销东哥”在自家直播间完成首秀,这场直播不到一个小时就吸引超两千万人次观看。
在各种关于“采销东哥”短视频上,记者看到,AI数字人“采销东哥”的语言贴近生活,言行之间还带有一些刘强东的标志性动作,人物形象生动、性格鲜明。
图源:平台截图
在直播期间,“采销东哥”还会时不时看下手机屏幕说:“看到你的留言了,回复了。”许多网友表示视频中不是AI数字人,“这么多小动作,肯定是真人!”
像采销东哥”这样的AI数字人主播是怎样炼成的?
中国AIGC产业联盟研究院院长、无界AI联合创始人马千里表示,当前AI数字人实际上是对人物的克隆和生成。主要通过根据上传的人物视频进行深度加工,经过声音采集、背景渲染等工序,就可以形成一个数字人。
而如何让数字人像真人一样在直播中侃侃而谈?马千里表示,唇形同步(Lip Sync)技术起到关键作用,直接影响数字人的逼真程度。该技术能够将语音的音速和音调与嘴唇动作进行匹配,使数字人的嘴部动作和他们的话语能准确配合,这为数字人赋予了更加真实的表情和动作。
图源:平台截图
现在越来越多的AI数字人走进直播间,直播话术也有了进化,还会主动规避平台敏感词,有些甚至还带着方言腔调。马千里表示这是使用了文本转语音技术,系统可以根据不同的销售场景形成相应的文案,并将其转化为语音并模拟主播的原有音色或定制新音色进行播报。“口音学的像不像主要和训练量有关,训练数据越多,模仿效果越好。”
为了追求逼真的直播效果,有些商家还会营造起直播氛围。比如你看到的主播会时不时看下手机和直播间的老铁互动,回答问题。“这些其实都是设计好的,直播间的老铁提问,实际上是用机器人流程自动化(RPA)程序自动提问,伪装成直播间提问而已。”马千里说道。
“电商直播未来有可能是90%都由AI数字人完成,纯人工直播将会变得奢侈。”马千里预测,未来几年AI生成的内容将会逐渐增多,以电商为切入点,越来越多的部分将由AI算法完成创作和编辑。
无人直播时代来临
相比于不可控的真人主播,不知疲倦的AI主播成为商家们新选择。
近年来,头部直播机构和平台在AI数字人直播赛道的尝试越来越密集。当越来越多的AI主播需求涌入市场,提供AI数字人服务也形成了产业链。
图源:平台截图
记者搜索“AI主播”,不少平台在售卖相关产品,从账号创建到直播技术支持的整套服务,不同商家对应着不同模式和价格。
浙江工商大学管理工程与电子商务学院副教授、国家级电子商务虚拟仿真实验教学中心副主任吴功兴表示,AI数字人由于其24小时在线、无时间地域限制,运营成本要远低于真人,并凭借强大的数据分析能力提供个性化的商品推荐,从而提高了购买转化率,在电商直播上具有一定优势。
此外,吴功兴还提到,AI数字人的多语言和多文化的表达能力,使得他们能够以实现跨地域和跨文化的直播对话,这对于拓宽市场和提升用户体验具有重要作用。
相关数据显示,中国虚拟人带动产业市场规模和核心市场规模预计2025年将分别达到6402.7亿元和480.6亿元。而虚拟人在直播行业中似乎具有巨大的发展潜力。
“AI数字人直播的兴起标志着无人直播时代到来,这将带来商业模式的变革。”吴功兴认为,无人直播极大地提高了直播时长和覆盖率,通过大数据分析跟智能预测,商家可以更加精准掌握市场需求、库存情况等,从而实现供应链的经营管理更高效的运作,重构行业生态。
AI数字人带货未来何去何从?
尽管优势显著,但在实际投用过程中,AI数字人直播也面临着一些问题。
越来越多的AI主播形象涌现,隐私侵权问题频频出现。AI生成形象愈发真实清晰的当下,主播身份无法分辨,成为在售假违法后确认主体明晰权责的主要困难。
吴功兴介绍,对于AI数字人直播,此前国家及地方也相继出台相应的规范措施。如《互联网直播服务管理规定》《网络主播行为规范》等文件,都提出类似使用数字人等技术的电商直播场景,都应明确标识。
马千里建议,一方面,直播平台在显著位置增强对消费者的提示;另一方面,在技术层面,也可以通过“技术水印”的方式,进行隐式标识,即采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识,从而防止侵权。
网页截图
近日,国家网信办公布了《人工智能生成合成内容标识办法(征求意见稿)》(以下简称《征求意见稿》),并面向社会公开征求意见,意见反馈截止时间为10月14日。《征求意见稿》提出,人工智能生成合成内容标识包括显式标识和隐式标识。网络信息服务提供者应当按照有关强制性国家标准的要求进行标识。
吴功兴提醒,对于AI数字人主播推向商业化进程中,尤其要关注三方面的问题:一是确保AI数字人主播的商业化的进程符合法律规范;二是坚持道德伦理原则,在AI数字人主播的研发部署应用的过程中,避免算法偏见等;三是建好审查机制对AI数字人主播的决策过程、应用场景等要进行全面的评估,确保不侵犯用户的权益。
来源: 浙江省科学技术协会
内容资源由项目单位提供