目前微软、百度、腾讯、抖音等各大平台,已开始提供相关数字人服务,总结各家平台的方案,可推测后续虚拟数字人的落地形态主要有:播报型数字人、交互型数字人、智能语音助手等。
随着虚拟数字人的技术逐渐标准化、模块化,除了满足大客户的定制化需求,面对中小商户的方案也逐步出现,使用价格大幅降低。 例如“万兴播爆”提供的数字人短视频播报服务,年费仅千元级别;“腾讯智影”提供的数字人SaaS工具,年花费万元,就可实现定制化形象、声音数字人的生成,4月份,腾讯智影还上线“千元级别,包月使用”的数字人直播解决方案。
据预测,2023年我国虚拟数字人的市场规模有望达到2700亿元。
在《中国AI数字人市场现状与机会分析》报告中,将数字人分为五个等级,目前数字人发展,经历了从手工制作到AI建模的阶段,初步具备人的外形,但还只能做简单的交互决策。
当智能化水平来到L4、L5级别时,AI驱动的数字人,能接管多数场景决策,支持更多模态的实时交互。
让虚拟数字人能说会道,可被训练用来担任智能客服、主持人、导游等角色。长期来看,随着个性化和情感理解能力的提高,微表情也会更丰富,说话时的表情、口型能够对得上,让AI为数字人注入灵魂,这样的数字人不仅“形似人”,而且“神似人”,为老人提供陪伴关怀、成为小孩子的“私人教师”也将很快实现。
专家认为,一方面我们应看到AI技术的强大潜力和创造力,未来AI在各领域中的“替代”功能都具有可能性。但同时,我们也应全面审视AI技术在审美、版权、伦理、法律等层面带来的隐忧。
有人表示,“在未获得歌手授权下,AI对歌手声音的模拟甚至公开展示,应属于对歌手表演权的侵权行为。”也有人指出,“在鼓励AI创作的语境里,所有试图绕过版权谈创新都是耍流氓。”
风险和挑战日益凸显的背景下,如何对AI技术进行有效治理,成为亟待解决的问题。