元宇宙网

您现在的位置是:首页 > 元宇宙项目 > 虚拟数字人

虚拟数字人

各平台数字人直播效果大比拼!

2023-09-14虚拟数字人
各平台数字人直播效果大比拼!
数字人直播领域的需求正在飙升,但在选择适合的数字人直播产品时,有一个不容忽视的问题:在某些平台上,比如抖音和视频号等,数字人直播可能会涉及到违规问题。

抖音在今年5月份制定了明确的规范,尽管承认数字人直播的存在,但同时也设立了一些限制。举例来说,直播画面必须清晰标明为AI生成的内容,而且数字人必须在一定程度上由人工进行操控或者有人工参与,而不允许完全依赖AI驱动。

然而,我们使用数字人进行直播通常是出于实现无需人工干预的自动化目的,以实现成本的降低和效率的提高。因此,我们需要采取各种数字人防封禁的策略,以确保数字人直播不会违反平台的规定。这些策略包括对画面和声音进行调整,以规避平台的规则,还包括提高数字人的互动能力。最终的解决方案无疑是提升AI的高级互动能力,使得平台和观众都无法分辨直播主是真人还是数字人。因此,数字人直播的竞争将主要依赖于AI能力,看哪家数字人具备最高水平的AI互动能力。

在市面上,有四家备受知名的数字人制造商,它们分别是百度、硅基智能、风平智能以及闪剪。我们对它们进行了详细的对比,旨在为有数字人直播需求的伙伴们提供一些有益的参考。

百度曦灵:优化带货直播

首先,让我们来看看百度曦灵。与其短视频功能相比,百度曦灵的直播功能相对更为完善,并且特别为带货直播进行了优化。它能够通过文心一言来生成AI话术,直接从文案中提取互动的问题线索,从而显著减少了人力投入,提高了搭建直播间的效率。然而,它也存在一些不足之处。生成的视频仍然呈现绿幕的形式,因此需要在直播伴侣中进行绿幕抠像并添加背景。这一操作不仅繁琐,还会增加直播电脑的CPU负担。如果电脑配置不够高,可能会导致直播帧率下降,甚至出现卡顿情况。

此外,在开始直播时,百度灵犀云端版只提供了一种导入直播伴侣的方法,即“窗口捕获”。这意味着曦灵会单独弹出一个网页窗口页面,然后使用直播伴侣的“窗口捕获”功能来获取画面源。这种方式可能会增加平台判定违规的风险。因为理论上,各个平台的直播伴侣可能具备一定的内容甄别功能,如果直播内容是从一个窗口中获取的,而不是从硬件摄像头设备中获取的,那么理论上容易被视为录播内容。

硅基智能和风平智能:防封禁策略和直播交互能力

接下来,让我们来看看硅基智能和风平智能。它们是四家数字人平台中在直播功能方面表现最出色的两家公司。小播秀和风平IP智造在防封禁方面进行了大量尝试,并开发了一些功能措施。


小播秀

重点是直播交互能力,「小播秀」和「风平IP智造」都支持自动应答、自动回复功能,也都支持插播和真人接管功能。自动回复方面,两家都可以支持插播功能,就是在直播过程中,可以根据直播的情况,可以随时通过文本驱动数字人,临时插入任意新加入的内容。

还有真人接管功能,得益于实时驱动能力,「小播秀」和「风平IP智造」可以用真人说话来实时驱动数字人。从抖音平台的规范看,这种就属于人工驱动的数字人,是规则被允许的不属于违规行为。其实这算是一个悖论,用数字人的目的是省去人工,但为了符合平台要求而用人工驱动数字人,又偏离了AI数字人节省人工成本的目的。

而「小播秀」和「风平IP智造」加入这个功能的初衷,更多的是在数字人直播中如果出现一些特殊情况,可以人工接管进行应对。


风平IP智造

闪剪:基础互动能力和实时驱动

"闪剪智播"的直播和互动能力相对较为初级,缺乏一些高级功能。首先,"闪剪智播"是四款产品中唯一不支持实时驱动的数字人直播产品。简而言之,创建新的话术需要先提交训练,然后才能在训练完成后直播使用。这意味着数字人的话术需要提前生成为视频,然后在直播时播放。这种方式存在一些不足之处。首先,训练需要花费时间,因此在开播前建议提前一天进行训练。如果在训练完成后发现话术错误并需要进行修改,将会打乱直播计划,并且会消耗合成时间。另外,如果直播需要暂停,数字人将完全静止不动。

与实时驱动的数字人相比,无需预先训练也无需等待,新插入的文案话术都可以直接用于直播。如果话术需要修改,也可以直接进行更改,无需等待重新训练。此外,还有一个小优点,就是在直播中如果需要暂停,数字人也只会闭嘴不说话,但身体动作会继续,增加了直播的流畅性和真实感。

文章评论