图片来源@视觉中国
文|白鲸出海
舆论热炒、资本入局,但粉丝并不买账
随着 ChatGPT 的出现,业界对于 AIGC 的能力的认知也更新了,资本和创业者的热情一下子被点高。在 4 月 16 日,我们观察到 Twitch 上的 AITuber-Neuro-sama 仅用五个月就快速积累了 30 万粉丝,她几乎全能,打游戏,聊天,和粉丝互动样样精通,尤其她和“老父亲” Vedal 相爱相杀的斗嘴场面更是笑翻了一众看客。
而且三月初,推出过 VTuber“斗和奇迹”的日本公司 Pictoria 也成立了世界首个专注 AITuber 的事务所 AI CAST,并已经推出了三位全新的 AITuber,开始了公司化运营的尝试。
AITuber,颇有一番颠覆 VTuber 行业的意味在。
但是在查看数据后我们发现,虽然 AITuber 的热度一度被炒得很高,但是在粉丝数据上,却呈现出相反的态势,观众似乎对 AITuber 不再买账了。
AI CAST 现在已经推出了三位 AITuber,“魔法少女艾曼”,“月夜野 Sama”和“朝日奈莱拉”,算上先前已经推出的“纺粘”,AI CAST 旗下已经有四位 AITuber 了。3 月 10 号,艾曼在 YouTube 首次直播,但到现在,三个月的时间只收获了 527 个订阅,除了初次直播之外,所有视频和直播的观看量不到 1000。而“月夜野 sama“也已经推出两周,直播三次,仅收获 180 个粉丝订阅。
之前,一炮而红的 Neuro-sama 也出现了新鲜感和热度下降的情况。她在 4 月 16 日粉丝数达到 30 万,但在之后的两个月仅涨粉 5 万,直播和视频观看量等互动数据也没有进一步增长。尽管她在 5 月 28 日,更新了更精致的第二代 Avatar,同时也拥有了更智能的语言模型、可以呈现更丰富的表情和动作,但数据表现却不尽人意。
Neuro-sama 和 Vedal 合体直播 | 图片来源:YouTube
此外,观看了 Neuro 的直播后,我们发现她并不是由 AI 单独进行直播,人类直接的参与是 Neuro-sama 直播的重要组成部分。Neuro 的直播内容中,以聊天形式进行的单独直播只占不到一半。而真正吸引人的部分在于 Neuro 与人类的互动。她的直播中会定期由开发者 Vedal 或者其他 VTuber 一同出镜,进行聊天、玩游戏、唱歌等活动,此时的 Neuro 就开启了“神评论”技能,时不时冒出的一句话让人类哭笑不得,节目效果满分。甚至,开发者 Vedal 会把维护和训练语音模型的代码开发过程进行直播,观众也会被修复 Bug 时 Neuro 的胡言乱语和 Vedal 的抓狂逗得哈哈大笑。
而根据观看量数据,有其他 VTuber 或 Vedal 参与的直播的观看量,明显高于 Neuro 单独直播时的观看量。也就是说,Neuro-sama 的爆红离不开人类的参与,用户观看 Neuro,一方面出于对 AITuber 的新鲜感、一方面也有对 Vedal“养 AI 女儿”过程的好奇,真正的 AI 单独直播目前的吸引力,看似是不足的。
左边两次是 Vedal 与 Neuro 合体直播,而右边则是 Neuro 单独直播 | 图片来源:Twitch
看 AITuber 直播,依然出戏
AI 直播没有那么受欢迎的一个主要原因是情绪表达过于单一,造成了交流的不自然,观众难免出戏。基于现在的 AI 技术,情绪表达主要的方式为,用预设表情表达情绪和基于语音表达情绪。在这两个方面,AI 的表现是无法和人类相提并论的。
魔法少女艾曼几种预设表情 | 图片来源:YouTube
上图是 AI CAST 的 AITuber 魔法少女艾曼的几种预设表情,分别是开心,生气,脸红。而在直播过程中,艾曼就是通过判断观众聊天的情绪,然后给出这些预设的情绪反应,丰富度不够。
另一个例子来自 Neuro-sama,虽然她的 AI 模型现在来看更好一些,但是情绪表达方面仍然很不自然。以下面的画面为例,此时 Neuro 应该是因为 Vedal 打断了她说话而生气,但画面上,却没法体现出生气的情绪。而 Vedal 套的 VTuber 皮却能够通过实时的动作和表情抓取,完全表现出有点无奈、有点不屑的情绪。
开发者 Vedal 以乌龟的 VTuber 的形象出现 | 图片来源:YouTube
在情绪与表情方面,AI 目前只能做到判断识别观众传达的情绪并表达自己的情绪,但是只能使用预设的模版表情,现在仍然做不到 VTuber 那样丰富的表情,这就限制了 AI 的情绪表达,没法做到像人类一样自然的交流。
另外一个问题来自于 AI 合成语音,与真人直播差别很大。目前 AI 语音在情绪表达方面不足是一个普遍的观点,AI 合成语音通常通过学习大量的语音数据并进行情感标注来生成语音,而与真实人声相似的细微差别就很难进行学习,所以 AI 合成语音听起来都缺乏真实感。同样 AITuber 也面临这个问题,在语音、语调、语气方面,无法达到人类的水平。声音作为塑造角色,与观众互动的主要方式,合成语音并不能令观众满意。
Neuro-sama 算是被认可的情绪丰富的 AITuber,但是整体语调依然很平,情绪的表达更多时候通过预设表情和在句末 Heart 或者 Wink 来打辅助。下面的画面是 Neuro 出 bug 时说 heart 时的搞笑场面。而最近很火的 AI 视频聊天 App Call Annie,无论受到质疑、还是道歉,也是一个语调应对所有场景。
在国内,小冰近期上线的 AI 驱动的“半藏森林”,也被各种吐槽,主要问题也集中在语音回复中情感表达困难,机器感强。在 1 v 1 环节,都无法清楚表达情感的 AI,在直播场景下,弊端会被进一步放大。再进一步,技术问题仍待解决。
但即便 AITuber 的市场反馈并不好,创业者和资本们还是一路小跑入局。
去观察这些公司的业务,会发现,AITuber 虽然有自己现在比较难解决的问题,但其本身商业模式和 VTuber 相同(直播、IP 授权、周边销售等等),市场需求已经得到验证,而如果技术问题能得到解决,也解决了 VTuber 产业的最大 Bug。
这些都能从 2023 年,VTuber 产业首个上市公司的财报中,看出端倪。
VTuber 产业出现首家****上市公司,一年收入 1.4 亿美金
VTuber 作为一个已经发展了多年的产业,其市场认可度、或商业模式,已经得到了验证,在 2023 年也迎来了行业首家上市公司。
在 2023 年一季度统计的女主播在 Twitch 和 YouTube 的观看时长排名,前 10 中有 6 位是都是 VTuber,而这其中有五位都是来自日本 VTuber 公司 Hololive production。其母公司 COVER 也于今年 3 月 27 日在东京交易所挂牌上市, 股价从上市时的 1400 日元一路飙涨,达到了 2729 日元(7 月 13 日收盘价)。
而 5 月 12 日 Hololive 发布了 2023 财年(2022.4.1-2023.3.31)的财务报表,这也是该公司公布的第一份财务报表。
女主播在 Twitch 和 YouTube 的观看时长排名(2023 年一季度) | 图片来源:Stream Charts
2023 财年,Hololive 营业收入 1.4 亿美元,相比去年增长 49.7%,净利润 1700 万美元,相比去年增加了 101.6%,净利润率 12.14%,其他各项数据对比去年也都有这不错的增长。
2023 财年 Hololive 财务数据 | 图片来源:Hololive production
从收入结构来看,Hololive 的收入主要分 4 块,直播及内容收入,活动收入,产品销售收入,授权及合作收入。其中,在 2023 财年直播收入仅占 31%,而且根据历年数据这个占比有下降的趋势。而活动、产品销售、授权合作等与 IP 有关的收入占据了更大的比例,主要增长点也在 IP 价值。
从 Hololive 的商业模式来看,VTuber 提供的主要服务是是直播与内容的输出,以积累粉丝基础,然而从历年的数据可以看出,随着 IP 逐渐成熟,直播收入的占比逐年下降,基于 IP 的收入比例提升,这也解释了利润增幅高于收入增幅的现象。
这是 Hololive 走向成熟的标志,更多地通过 IP 价值进行变现,而直播变成了维护和增加 IP 价值的手段。
2023 财年 Hololive 收入组成数据 | 图片来源:Hololive production
但实际上,Top 10 占其 6 的 Hololive,虽然已经是不折不扣的头部位置,但也有自己的问题。
繁华之下现问题,****本土市场饱和与“中之人”风险成瓶颈
2024 财年预期数据 | 图片来源:Hololive production
在对 2024 财年的展望中营业额和净利润的预期增幅仅有 30%,远远低于本财年增幅,说明公司对于收入的持续高增长缺乏信心,其主要原因是日本 VTuber 市场的饱和。这种情况,从财报中的 YouTube 订阅人数增长也可以窥见一二,日本频道在这一年只有少量的增长,而国际频道订阅数增长则占了绝大部分,日本市场的增长缓慢,可能是 Hololive 调低增长预期的原因。
Hololive YouTube 频道订阅数据 | 图片来源:Hololive production
所以,在对下一财年目标的阐述中,国际化是 Hololive 的主要目标,包括推出面向国际市场的 VTuber 并进一步扩展国际授权规模,继续执行“Holomeet”线下活动,扩展到更多的国家。
另外一个问题来自“中之人”,在 Hololive 的招股书的风险提示部分也阐述了这个问题,当“中之人”因为负面事件影响或个人原因,活动频率下降或无法继续其活动时,将会对 IP、内容和商品价值造成负面影响。也就是说,虽然公司能够通过多元业务,在营收上减少对中之人直接活动的依赖,但是IP价值依然需要其维护,IP 价值的降低,依然会对其他应收造成影响。
虽然 Hololive 内部,还没有出现类似问题。但相似的情况早有出现。
绊爱是世界首个达到 100 万和 200 万 YouTube 订阅的 VTuber,由于更换中之人的风波被粉丝大量取关。虽然公司解决了问题,但是关注度大幅下降,粉丝的增长也停止了。陷入了空有 300 万订阅数,但视频播放量不足 10 万的窘境。不久之后便宣布无限期休眠,退出了 VTuber 市场。VTuber 的价值,是和“中之人”深度绑定的,而对以公司来运营 VTuber 业务的模式来说,这一直是一个难解之题。
绊爱告别 | 图片来源:B 站视频截图
AITuber 正在一波热,****但貌似依然是“正确方向”
VTuber 这些年的发展,已经验证了市场需求,Hololive 不错的收入与利润率也证明了公司运营的可能性。虽然现在的运营模式,有点类似于 MCN,其本质问题,也是一样,人的变动性太大,而导致公司增长依然受到限制。
VTuber 相较于传统经纪公司,如果说往前了一步,那么 AITuber,虽然问题依然很多,但显然是能够在一定程度上找到了解决核心问题的正确方向。因此,我们可以看到 AITuber 虽然问题多多,但资本和创业者们依然一路小跑入局。
2023 年 AITuber 相关新闻
以最近完成融资的硅谷的初创公司 Hyper 为例,主要做 2 个方向的研究。
一方面,解决 VTuber 的成本问题,可以看出,Hyper 并没有直接想要用 AI 一步替代中之人,这个方向还是比较接地气的,可能也是相较于很多短期无法实际落地的项目,Hyper 能融资的一个重要原因。另一方面,就是去尝试解决 AI 技术现有的应用难题。
在硬件方面,VTuber 的成本是非常高的,进行直播时需要专业的动作捕捉套件和一台配置很高的电脑,才能实现 Avatar 的实时渲染和动作呈现。Hyper 推出了一项技术,只需要一台 iPhone 和一个应用,就可以生成一个 Avatar 并进行直播,大大降低 VTuber 的门槛。也就是说,人人都可以做 VTuber 了。
反观以公司化运营 VTuber 的 Hololive,则需要在“中之人”上付出高昂的成本。Hololive 的成本主要分为,演员报酬,活动成本、外包成本、其他成本。除了财年的第四季度举办大型线下活动“Hololive Super EXPO”会额外活动成本之外,在 2022 和 2023 财年“中之人“报酬的成本占比平均达到了 40%-50%。从历年数据来看,当公司的 IP 价值较低,以直播作为主要业务的时期,“中之人”报酬的成本占比更高。随着 IP 价值的提升,更多的活动以及其他成本开始增长,但是“中之人”报酬成本仍占据很大的比例。VTuber 公司通过 IP 产出源源不断的利润,必须靠“中之人”进行直播维护和增长 IP 的价值,同时要为此付出高昂的成本。
Hololive 历年成本数据 | 图片来源:Hololive production
而在 AI 方面,公司新推出的 Hyper AI,可以自动为用户生成 Avatar 和 AI 语言模型内核。这项功能基于 OpenAI 的 GPT 模型,由 Hyper 进行定制化训练以适应语言环境。创始人透露,目前它已经可以实现问答和讲故事的功能,未来它将可以在直播间进行流畅互动,成为真正的 AITuber。
鉴于还没有办法体验到的产品,所以也无法确认效果,而针对于现在比较明显的表情生意、合成语音等问题,Hyper 也没有特别提出。
但 Hyper 针对于虚拟直播产业专门去训练垂类模型,总算是往前前进了一步,未来能让不论是个人、还是公司,都有更多尝试的可能性。而 AI 作为“中之人”,起码在成本方面,确实能够省下不少钱。根据现在所掌握的情况来看,训练 AI 模型的成本是显著低于“中之人“的报酬成本。以 Vedal 的案例来看,虽然无法知道具体数字,但是开发 Neuro-sama 的成本是他个人可以负担的。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
版权归原作者 钛媒体 所有, 如有侵权,请联系我们删除。