2015 年成立,经过 6 年的成长发展,数数科技目前已服务 400+ 家游戏公司,产品已接入 2000+ 款游戏。我们研发的游戏大数据分析平台 Thinking Analytics (简称“TA 系统”) ,凭借强大灵活的数据分析能力和稳定健壮的集群性能,获得了游戏行业的一致认可。
TA 系统不仅是专业的数据分析工具,更是我们在游戏数据分析领域经验沉淀的集中转化。而这些经验沉淀的起点,一定是客户的反馈和需求。
在过去半年里,我们围绕游戏行业数据分析的核心需求,从产品功能和技术架构上,对 TA 系统进行了重磅更新:
-
一图胜千言: 为 SQL 报表构建可视化图表
-
历史标签: 回到过去,了解用户成长轨迹
-
间隔分析: 让核心行为的转化时长一目了然
-
打造行业 Know-How: 游戏数据分析模板中心上线
-
行业领先的游戏数据集成能力
-
弹性伸缩能力: “帮客户省钱”
-
系统鲁棒性和查询性能大幅提升
SQL 可视化
为SQL 报表构建可视化图表
在 TA 系统 3.0 版本中,我们推出了 SQL 报表化功能,允许通过自定义 SQL 突破一般分析模型的限制,以满足契合游戏业务的复杂需求。SQL 可视化模块,为 SQL 报表提供了更直观丰富的数据展示形式。
业务场景的多样化,决定了用户对图表配置的多元需求。特别是对 SQL 报表,用户的需求更是多样。不同于一般的分析模型,SQL 报表的结果字段数目和类型都可灵活自定义,所以简单的预置图表无法满足多样的结果数据展示需求。
在 TA 系统 3.3 版本中,我们构建了可视化模块,并率先引入到自定义查询模块中。可视化模块支持通过拖拽字段的方式进行灵活、高效的自助式探索分析。基于实际业务需求,可视化模块支持对图表类型和样式进行精细化配置,实现双轴图、柱线组合图、嵌套排序等复杂样式图表的构建和展示。
在后续版本中,我们会快速丰富可视化模块所支持的图表类型和图表样式,并将可视化模块的能力推广到更多分析模型中,作为分析能力的重要补充。
历史标签回到过去,了解用户成长轨迹
TA 系统用户标签,提供了从多种角度将玩家分层的能力,并支持针对不同分层的用户进一步下钻分析,有着丰富的应用场景。用户标签和标签值,反应了某个维度下用户特征的最新数据,但是无法反应随着时间推移标签值的变化情况。
在 TA 系统 3.3 版本中,我们上线了历史标签,可以为标签创建和历史日期备份,让使用者可以直观地看到用户标签值随时间推移而发生的变化,从而掌握用户的成长轨迹。
常用的分析场景:
-
回流趋势快速查看:创建用户回流标签,通过回溯找到历史上每一天符合标签条件的用户,用户回流趋势一目了然
-
回流用户行为分析:通过标签筛选找到回流用户,在模型内分析他们在回流当日的核心行为,并计算付费转化情况
-
付费级别精准分组:每天记录用户截至当天的总付费金额,精准定位用户事件发生当天的付费级别,分组查看更加准确
间隔分析让核心行为的转化时长一目了然
另外,TA 系统 3.3 版本还新增了间隔分析模型,用于分析两个行为事件之间的时间间隔。间隔分析可以作为漏斗的一种补充,在转化率之外,通过转化时长更全面细致地衡量核心行为的转化情况。
模型化是 TA 系统的重要特性。通过抽象出一系列分析模型,允许用户通过简单的界面配置就能完成往常需要写复杂 SQL,甚至需要提交需求等待数据团队开发的指标计算,极大地提升了企业内部数据使用的效率。
在间隔分析中,用户只需要定义起点事件和终点事件,就可以计算出两个事件发生时刻的时长分布情况,包括:「最大值」、「上四分位」、「中位数」、「下四分位」与「最小值」等指标。两个事件可以是相同事件,也可以是不同事件。
常用的分析场景:
-
新用户注册到首次付费的转化时长分布:既可以评估破冰付费的效果,也可以将该指标作为评估新用户转化的重点关注指标
-
会员等级或者关卡的驻留时长分布:可以通过间隔分析的关联属性与分组,评估不同等级或者关卡设计的合理性
-
玩家完成两次付费行为之间的时长分布:通过每个时长区间对应的用户数,可以评估用户付费意愿和付费频次
模板中心
打造游戏数据分析 Know-How
模板中心,是 TA 系统最重要的新功能之一。
我们希望将游戏数据分析领域的经验方法系统地组织起来,分享给我们的客户。通过模板中心,帮助游戏企业从数据意识、数据分析方法论、数据分析工具等层面提升使用数据的效率,挖掘数据价值。
模板,是一种交互型的功能案例,涵盖了 TA 系统各功能模块的实际应用场景。根据参数设置指引,选择项目中对应的事件和属性,用户就可以一键创建模板对应的报表。一方面,模板让使用者可以更高效地创建常用的报表;另一方面,模板也承载了通过 TA 系统构建常用指标的最佳实践。用户可以通过模板了解 TA 系统的各功能模块、分析模型的使用方法。
我们会逐步丰富完善模板中心的内容和功能,努力打造一个游戏数据分析共创、共享的平台,让模板中心成为游戏数据分析的知识中心。
数据集成能力全面提升
目前,TA 系统支持通过客户端/服务端 SDK 的数据接入、使用数据传输工具 (如数数自研的 LogBus 高性能的导数工具)、Restful API 的导数方式以及第三方数据的集成。
在目前的数据接入与集成能力基础上,我们持续新增对不同数据源的支持、优化数据管道、提高数据流转效率和准确性,以满足客户实际多端数据接入与集成的场景需求,为实现不同闭环分析场景提供强有力的数据工程支持。
// 游戏引擎
在游戏引擎集成方面,TA 系统已经集成了包括 Unity、虚幻引擎等市面上所有的主流游戏引擎,为广大游戏开发者提供了最快、最全面的系统对接支持。
// 营销数据集成
在营销数据集成方面,我们已经支持包括 AppsFlyer、Adjust、热云等主流的第三方广告归因平台,为游戏增长的用户渠道归因分析提供了坚实的数据基础。
同时支持例如巨量引擎、Facebook、Google 等头部媒体渠道,在第三方归因平台回传广告信息的基础上提供例如广告优化方式、广告版位等更多分析字段。
还支持例如 TopOn、Tradplus、IronSource、AppLovin 等广告变现平台,为以广告变现为主的游戏公司,尤其是以休闲/超休闲游戏为主的客户,提供了全面的变现数据精细化分析。
另外,由于部分平台无法提供用户级别的数据,TA 系统也可以同时支持用户级别原始数据和聚合数据的关联、集成,解决数据粒度不足时深度分析的场景。
弹性伸缩能力
与其他行业相比,游戏行业的数据分析场景复杂,数据量也更庞大,因此对数据分析产品的性能和效率要求都很高。为了保证在海量数据的情况下有强大的查询性能,企业会投入很多的资源在集群存储成本和计算节点上。
如何帮助企业提高资源的利用率,避免不必要的浪费,一直是我们系统迭代的核心关注点。
在 TA 系统 3.0 版本中,我们率先实现了动态扩缩容,客户可以根据业务情况在高峰前扩容,高峰后缩容,以实现资源的合理使用。在最新版本中,我们将这一理念继续推进到更细粒度的弹性伸缩:支持弹性存储和弹性计算。
// 弹性存储
随着集群海量数据的不断涌入,存储成本对企业来说将是一笔不小的开支。新版本的 TA 系统将支持AWS、阿里云、腾讯云、华为云等主流云厂商对象存储方案对集群冷数据进行归档处理。
归档的冷数据仍然能够支持联合查询、联合分析,并且扫描性能仍能保持在一定的水平,用户在使用和分析过程中也不会有明显的感觉。
归档的冷数据部分相对之前的云硬盘存储将有 3 倍左右的成本节约,对企业降本增效有着巨大的价值。
// 弹性计算
数据量增长的同时,TA 系统集群自助查询的压力也会随之增大,特别是在业务使用高峰期,随着并发量的增大,集群资源持续处于高水位。同样以降本增效为目的,目前 TA 系统支持基于云厂商弹性 ECS 的弹性计算方案。
该弹性方案会在业务高峰期申请更多廉价的弹性节点,并作为计算负载进行计算集群扩展,进而加速业务查询,高峰过后及时回收弹性资源,避免资源浪费。
系统鲁棒性和查询性能大幅提升
系统鲁棒性和性能是保障产品体验的重要组成部分,也是我们产品迭代的永恒主题。在最新版本中,我们上线了可视化告警系统,极大地提升了系统鲁棒性。在查询性能方向,对 Kudu 和 Presto 等组件也都进行了许多重要优化,整体查询性能大幅提升。
基于 promtheus 和 grafana,我们重构了监控告警系统,将自动化运维准确性从 95% 提升至 99%,响应时间从 2 分钟缩短至秒级。借助 grafana 的能力,实现了监控系统可视化。可视化监控从节点层、系统层和组件层等层面全面展示集群的各项运维指标,极大提升了监控的便捷性和直观性。
我们对查询引擎做了重要升级,引入了更多的特性,查询性能有了大幅提升:
-
新增对 Kudu 表的 Dynamic Filtering 支持。TA系统中从模型分析结果下钻到用户列表的的性能可得到 10 倍的提升。
-
提升了 SQL 优化器的性能, TA 系统中使用任意事件时,SQL语句 Planning 时间过长的问题得到解决。
-
优化了漏斗模型和留存模型的 UDF 实现,内存占用减少 30%,查询时间减少 20%。
除此之外,存储引擎也完成了重要更新,改进了 DeltaMemStore 的 flush 策略,减少了内存占用。升级后的 TA 系统在处理大量用户属性更新时,性能显著提升。
结语
精于数据,专于游戏。作为一家专注游戏领域数据分析的公司,我们始终坚信,只有在产品功能、集群架构、客户服务等多方面都紧跟客户需求,才能打造出能真正帮助企业把数据用好的产品。
未来,我们会继续秉持「让数据价值触手可及」的初心,围绕游戏行业的核心需求,不断提升 TA 系统的分析深度和易用性,打造最专业好用的数据分析产品。
想了解 TA 系统更多最新功能特性?
来 2021 ChinaJoy 现场找我们!
数数科技 VIP 观众
将享受全新的产品体验,全方位的产品演示
⬆️扫码预订数数 VIP 观众席位⬆️
可预约现场享受:
01 数数最新版 TA 系统全方位演示02 爆款游戏数据分析思路方法解读03 企业数据分析能力诊断 & 解决方案04 十大主流游戏类型数据分析痛点剖析
地址 :上海新国际博览中心
时间:2021 年 7 月 30 日-8 月 1 日
展位坐标:ChinaJoy BTOB 展区 W4馆 B201