游戏公司面对AI的困境

Posted by ilyee on February 21, 2024

大模型的火爆,让中国游戏圈感受到了前所未有的“AI焦虑症”。AIGC在游戏美术、游戏文案甚至游戏建模等领域都带来了不小的冲击,AI高效高质量且低成本的内容生成本让每个从业人员都倍感压力,我们也在23年年底看到大量游戏从业人员的失业(当然也不只是因为AIGC)。因此,游戏公司AI技术的储备显得格外重要。

但是,游戏公司真的能做好AI吗?

AI团队的分工

首先我们得知道,AI可不只是找几个算法就完事了的,一个完整的AI团队组织架构一般要有如下的分工:

AI团队分工

其中:

  • 算法团队专注于理论,简单来说就是读论文、用python搭模型做实验跑分打榜。因为大模型的训练大概率要涉及多机多卡,所以他们需要从工程团队中获得框架上的支持(封装好的分布式训练等),同时他们也要从基建团队获得算力使用上的支持(直接使用封装好的存储网络计算节点环境跑训练任务,不需要感知资源如何申请)。
  • 算法工程团队专注于训推框架,即模型训练的代码层。假设算法构想了一个1000B的模型(当然截止目前还没这么大的开源模型),就算用FP16精度,这模型本身就得2T了,单机训练是不可能的了,因此一定需要多机多卡分布式训练的框架支持,而这就是工程团队要解决的事情。简单来说,工程团队负责将算法团队构思的模型变得可以实现。他们给算法团队提供框架和数据的支持,同时从基建团队获得一些推理服务上的支持(例如模型上线后线上服务质量保证等)。
  • 基建团队可以理解为偏底层的团队了,简单来说就是PAAS,负责对其他团队屏蔽算力使用上的复杂度。他们直接对接底层算力资源,对上层屏蔽这些资源和环境拼积木(服务器,分布式存储,网络方案都是积木的原材料)的复杂性,即上面要啥你就给啥,所有的算力封装都自动化。
  • IAAS团队是独立于三个团队之外的,可以理解为他们对资源本身负责,即基建团队拼积木的原材料提供方,一般而言IAAS团队并不直接对接算法团队。

很明显,一个完整的AI团队需要十分昂贵的成本,不止算法的工资高,行业内真正从事相关工作的算法工程和算法基建也是少之又少,而且和底层算力的成本比起来,这些人员的工资甚至都是零头了。

游戏公司会怎么做?

回到游戏公司视角,此时,假设你是一个游戏公司老板,身患AI焦虑的你却很可能对AI一窍不通,迫切想要寻求突破的你在市场上看到了如下几个解决方案:

  • 买SAAS服务:直接购买其他公司训练好的AIGC服务,举个例子就是ChatGPT,Midjourney等花钱买内容的服务,这种方法大多见于个人开发者。优点是便宜省事,整个AI团队都不需要任何投入;但缺点也很明显,这么带不来任何的AI技术积累,只是用别人现成的服务,这并不是AIGC时代的船票,你只是被动的接受别人给你的玩法而不是自己创造。

  • 买PAAS服务:相当于把基建团队交给别人(如云厂商),自己只保留算法团队和部分算法工程团队,甚至算法工程团队的部分工作(比如分布式框架等)也可以使用外部方案。经典的案例就是腾讯云提供的stable diffusion服务,它直接给用户一套搭建好的框架,用户只需要塞入训练图片数据,配置好训练参数就可以得到一个理想中的图片生成模型。这个方案的优点很多,它最大限度的屏蔽了算力和资源的技术瓶颈,让所有复杂的底层工作都由云厂商去代劳,团队也只需要保留少量工程和算法;但这个方案也不是没有缺点,因为要知道这种方案相当于把公司的敏感数据交给了云厂商保管,这种风险是不可预知的,而且这玩意的成本比SAAS方案高太多了,且目前AI PAAS的方案也有限,云厂商并不能完美的覆盖游戏公司的需求。所以该方案的使用其实比较少,目前可能只有部分个人开发和小规模团队在试用。

  • 买IAAS服务:这个好理解,就是直接从云厂商买虚拟机,这甚至就是很多互联网公司正在用的方案,只不过放AI领域从CPU虚拟机变成了GPU甚至裸金属罢了,这是目前最主流的方法,大部分叫得上名字的没有云业务的公司大多采用这个方案。该方案优点很多,上文也提到了IAAS团队可以是独立于AI团队之外的,这个方案便是把这个独立的团队变成了各大云厂商;但同样的,由于大模型的火爆,加上美国算力制裁,现在的GPU虚拟机可不便宜(动辄一个月几十万几百万),何况目前主流的训练卡(A100,H100)能不能在云厂商租到都是个问题。

  • 完全自己来:最一步到位的方法,也是AI创业团队一致选择的方法,优缺点很明显,一步到位确实能积累完全的AI技术,但是由于算力禁令现在买卡可不容易,再加上从0到1的建设需要大量的人力资源,如果不是手头钱多或者自己魄力足够大,这种方案也一般不会被采用。

过少的技术积累

不难看出,免费的午餐是不存在的,技术的积累和低廉的成本是不可兼得的,何况尤其对于游戏公司而言,过少的技术积累导致公司对AI人才的引力显得不足。

假设你是一个有点技术有点理想抱负AI从业人员,在AI热潮的环境下好奇看了看头部AI创业公司的机会,因为自身技术过硬,有一家AI创业公司给你开了一个可观的数字,并且你也在他们的团队中发现了很多之前只会出现在阅读的文章作者列表里的大牛,团队负责人的发言也充满了他对行业前景的抱负,可能这家公司目前没有太多的技术积累(但是算力还是得有的,没有算力那一切都是空谈了哈),但是这个时候你很明显的就能感觉到,这个团队做AI可不是说着玩的。

但反过头来看看游戏公司呢?工资我们抛开不谈,光技术这一点你就会发现明显的代差,可能你进去后发现整个游戏公司里懂AI的寥寥无几,可能你也发现公司内的各种工具链一团糟,甚至有些最基础的场景都要从零开始构建,甚至你可能发现由于老板们并不懂技术,他们对你的期望可能只是套个API就行……过少的技术积累很容易让从业人员感受到被限制的上限,而不成熟的团队和负责人也会让游戏公司对AI人才的引力显得格外不足,就算目前能招聘到对应的人才,也很难说他们是真的想搞AI还是想找个地方摆烂。

我们处于追赶者的姿态

不得不承认的是,中美在AIGC的积累确实有很大的代差,GPT-3从论文到正式发布ChatGPT都用了3年的时间,更不用说处于追赶者的国内大模型了。在写这篇文章的当下,国内可用聊天大模型依然和ChatGPT有很明显的差距,李宏彦也提到过百度依然是个追赶者,而当下国内的AI公司也确实是。

对于追赶者而言,我们已经没有额外的成本去做更多的尝试了(哪怕lecun现在还在怒喷生成式大模型并且力推自己的通用模型),我认为我们应该集中力量去把所有的投入专注于一个方向,从上到下形成合力,这样才能以最小的成本在最快的时间内追赶上AI技术的鸿沟。但很可惜,从ChatGPT发布到现在为止,国内并没有哪家公司做出了能真正媲美GPT-4的服务,甚至OpenAI还用sora进一步拉大了AI技术的鸿沟。

当然这扯的有点远了,追赶者的姿态很明显已经不是游戏公司的问题了,整个中国的AI行业都在面临这个问题的当下,如何快速的追赶始终是一个难以解决的问题,而算力禁令很明显也加剧了这一问题,我只不过是把一些通用的想法摆出来了而已,哪怕这种做法其实也并不能完全解决这些问题。

放在结尾

所以回到开头的问题,游戏公司真的能做好AI吗?

优质解答:我不知道。