与论证性数据分析不同,游戏中的探索性数据分析方式,在数据波动时更注重挖掘固有认知外的原因。这对于实现精细化运营而言至关重要。
那么,这种数据探索的思维与能力该如何培养?数据探索在实操中对应游戏的哪些场景?实现探索性数据分析,需要哪几个步骤?
定义:何为探索性数据分析
探索性数据分析,是一种相对于论证性数据分析的方法。在论证性数据分析过程中,数据分析师在开展分析工作前通常会基于业务的经验、常识提出假设,在后续聚焦具体问题时,再围绕假设条件进行数据提取,从而完成逻辑层面的验证。
面对 80% 以上的游戏场景,在分析前都可以针对问题作出预判,比如,当用户留存率产生明显变化的时候,需求方通常会基于市场营销策略推断产生变化的原因,认为数据波动大概率是由于个别渠道广告位的调整或预算及素材上的调整所导致的,因此,数据分析师也会在渠道构成层面观察数据。
在这种假设场景下,产品、新手引导变化,以及商业化层面的调整就不在数据分析师聚焦的范围内。
相对的,探索性数据分析则拒绝在得出结论前基于经验或行业背景进行假设。举例来说,如果游戏数据在产品或者运营本身没有做任何调整的情况下,产生了明显波动,那么就需要进一步对各个层面的数据进行挖掘。
譬如,之前做用户流失归因时,我们通过了解不同等级用户的流失率,发现第 9 级的玩家流失很普遍,在与策划人员沟通后,却发现游戏本身在第 9 级并没有设计任何的卡点,难度设置也在正常范围内。此时,原有对于用户流失的经验就已经不起作用了。
再比如,一些游戏工作室干扰到数据判断的时候,需要把异常现象排除掉再看指标,然而我们用了很多方法却比较难把异常排除得干净,导致指标失真。这些都属于不知道方向、目标,难以作出假设的情况,所以需要去尝试探索数据。
关于探索性数据分析,可以总结为 3 句话——发现未知的现象,提炼未知的规律,最后总结未知的结论。做数据分析前,我们其实有很多不知道的事情,在分析的过程将“未知”变成“已知”,就是一个探索性的更新。
案例:探索性数据分析经验
在探索性数据分析中,最常见的应用场景就是课题分析,而最经典的课题就是用户留存以及用户付费。
用户留存方面,上文提及的 9 级用户大量流失的原因,只有在分析师把其中一个在 9 级流失用户的具体明细拿出来之后才可被发现,即这个用户在 4 到 8 级之间曾出现过一个从前不知道的特殊现象——该用户连续挑战一个训练关卡。
一些竞技类产品在完成新手引导之后,会设置多层训练关卡用于挑战,挑战完成之后可得到一些奖励。正常来说,玩家在学习最基础的操作后,就会返回游戏其他的正常关卡。但是我们发现,有些用户他在 4 到 8 级之间出现连续挑战训练关卡的行为,继而在凑齐 10 张抽奖券后进行抽奖,如果该用户没有抽到合适的奖品,便可能会就此流失。因此,这就说明 9 级用户流失的本质原因在于,训练关卡的奖励机制设计存在问题。
再有,直播导流的用户跟其他渠道用户相比具有更加独特的属性,一个典型现象是,从直播端口来的用户在资源产出和消耗上会远远地落后于其余渠道来的用户。当我们探索直播导流用户的消耗行为时,发现这批玩家的资源主要消耗在完成任务上, 而并没有任何涉及新服活动的消耗。
经过数据探索,仔细观察服务器 ID 后,才发现直播导流玩家新建的角色所对应的服务器都是较老的服务器,继而发现这些由经过直播间主播导流的玩家, 选择了和主播相同的老服务器, 自然没有享受到新服前期的福利活动, 因此付费较低。
类似这些现象,分析师在仔细查看用户明细前,是难以通过经验判断出原委的。
此外,探索性数据分析,在用户分层、用户画像的场景下也能被频繁应用。用户分层是为了制定差异化的策略,而用户画像则是为了刻画出用户的具体状态。通常情况下,一些用户分层或用户属性的维度是超出经验范畴的。譬如一个新的品类,会对应有新的玩法、新的系统,这时候就需要先探索用户的行为,再抽象出新的规律。
类似的探索性数据分析运用场景,还有识别工作室在 MMO 、卡牌等游戏内刷道具的问题。各种交易小号其实都会影响游戏的数据指标。通常,我们会从设备、账号、IP 等维度尝试着把这种小号给筛掉,然而, 也依然会有一些“刷不干净”的状况,需要运用数据探索的思路去解决。
总之,无论是构建用户画像、识别工作室、追溯交易轨迹,还是排查异常现象,仅仅靠一些常规的经验维度是不够的,还需要去做个性化的探索,发现它背后的一些规律和原因。
沉淀:探索性数据分析方法
想要实现探索性数据分析,就需要聚焦背后的方法论。
如果把探索性分析比作破案,那么破案之前的第一件事情就是搜集线索——圈定人群。假设因为工作室的存在导致留存特别高或者特别低,那么我们就会选择从这些特别高或特别低的留存用户中挑选一些玩家作为线索人群。
接下来第二步,提取明细。这一步骤尤其考验分析人员的能力和耐心,也涉及到对于数据的敏感度。在这一阶段,需要优先提取和探索课题相关的事件。在挑选事件的时候,玩家被动触发的那些事件一般不用提取。
随后,观察明细则针对被提取的每一个明细的各个字段,同时注意事件和事件之间的时间顺序关系,运用同理心去还原玩家当时的场景。如果顺利的话,就能够从中发现一些规律,不顺利的话,这个环节也会被多次重复。
举例来看,在分析一个枪战游戏的用户留存时,发现很多用户在新手结束后的第一次对局就流失了,这意味着这些用户可能在新手引导阶段的体验很好,但在真实对局的第一局内,产生了心理落差。继而,我们就需要验证该规律是否作为一个普遍现象发生,同时,如果要得出一个准确的结论,就应该去做一些显著性检验。
最后,在观察明细的时候需要注意由于事件所带来的变化,这在一定程度上能反映用户在游戏内的主观感性体验。比如说积分的增长,等级、战力的提升等,都是有可能和其他行为或者分析的课题直接相关的,这些字段需要细致观察才有可能被发现。
数据探索的整体流程不存在太高的技术门槛,更多是考验大家的耐心。在观察的过程中,一定要结合自己的经验或者是同理心去还原用户的行为,才能够找到一些此前不知道的真实原因。
探索性数据分析的特点
探索性数据分析要求相关游戏人对于业务有很深入的理解,要求对游戏系统本身以及对应的上报事件非常了解。
其次,探索性数据分析是需要分析人员有足够的耐心,尤其是提取明细和观察明细的过程中,如果明细的数量比较多,就会有繁琐耗时的整理工作。
因此,探索性数据分析也需要我们时刻保持对数据的敏感性和好奇心。
探索性数据分析所带来的成就感和乐趣也不是论证性数据分析可以比拟的。它是一种从 0 到 1 的挑战,总是比从 1 到 10 更让人印象深刻。对于数据分析师而言,成功完成一次探索性数据分析,会产生更多的成就感。
总之,探索性数据分析能够帮我们跳出经验的束缚,不断去发散思维,避免走进过去的思维惯性,希望所有正在做和计划做探索性数据分析的分析师们能不忘初心,时刻保持对于未知的好奇。