手机版 欢迎访问人人都是自媒体网站

当前位置:主页 > 体验 >

数据分析产品从可视化到智能化:快速分析订单量为什么下降了

时间:2020-12-29 09:15|来源:网络整理|编辑:采集侠|点击:

本文作者结合数据分析产品从可视化升级到智能化的一个实践案例,对“今天订单量为什么下降了”这一问题展开了分析探究,并对过程中存在的问题和解决方法进行了总结,与大家分享。

 数据分析产品从可视化到智能化:快速分析订单量为什么下降了

提到数据产品,大家经常会想到的可能是tableau、growing io、神策数据、诸葛IO等商业化数据产品,也可能是企业内部的报表工具、提取工具等数据平台产品,或者是A/B-test、用户画像、埋点系统等数据应用产品,以及面向业务的各类数据可视化、Dashboard等数据分析产品。

今天我为大家分享下数据分析产品从可视化升级到智能化的一个实践案例。

在企业发展初期,最需要的其实是报表工具和提取工具等平台型数据产品,面向分析师和开发团队,实现数据的提取和加工过程,业务侧也基本上只看几个核心指标。发展到一定阶段,才会有数据可视化分析产品的需求,或采购tableau、BDP、网易有数等商业化产品,或自研分业务主题的Dashboard数据产品。

从基础的报表工具进化到数据可视化产品后,在用户体验上有了极大地提升,数据统一、及时性也可以通过数据产品的反推方式,逐步得到保证。但如何更好地提升业务团队的数据分析水平,还是会存在一些问题和提升空间。举例来讲:

问题一:方法论不统一和水平参差不齐。有了各类Dashboard,但还是无法保证每个业务同学都能按照预想的思路去使用数据产品,也无法确保业务同学能够自我探索新的分析思路,以及每位同学分析水平的高低。

问题二:分析过程仍旧很繁琐耗时。各类Dashboard虽然以自动化的形式提供了数据,并且不需要再进行数据处理,有一定的可视化分析能力,但遇到问题后的分析过程并不能减少,还是需要进行大量的多维度多角度下钻分析,时间效率上还有待提升。

 数据分析产品从可视化到智能化:快速分析订单量为什么下降了

那如何来解决这个问题呢?答案是数据分析产品的分析智能化。我以各大企业业务团队和分析师团队经常会遇到的问题「今天订单量为什么下降了」,来分享下数据产品应该如何快速、高效、直接地回答业绩波动的问题,并且以产品的方式统一方法论、拉齐分析水平。

分析智能化的两大核心:分析方法抽象化+产品自动化 1. 分析方法抽象化

「今天订单量为什么下降了」,是高频出现在每天早上与老板的对话里。一般情况下,都会由数据分析师进行跑SQL、整理数据、进行问题拆解分析,最后给老板一个回复。效率高的情况下,大概需要花1个小时的时间,效率低、或者赶上数仓计算排队压力时,可能要花费半天甚至一天的时间,来回答这个问题。

对于这个问题,分析方法一般都会有相对固定的思路和过程,在此举一个例子作为参考,分析方法可抽象为三个部分:

波动情况如何?是否属于正常波动?

影响范围的细分,哪些城市、哪些时段、哪些类型的业务波动影响最大?

是什么原因引起的?应该如何解决?

(1)波动的情况和异常判断

一般情况下,波动的情况可以用环同比的数值和比例进行衡量,比如昨天的订单量周同比下降了7.36%。日环比下降了2.48%。异常判断是一个更难的问题,可以借鉴三个方法:

a. 阈值法:根据业务经验设定阈值,比如波动范围[-1%, 1%]属于平稳,在[-3%, -1%)和(-1%, -3%]属于略微波动,超过±3%的波动属于大幅波动,并判定为业务异常;

b. 回归预测:根据时序进行订单量的回归预测,通过对历史数据的拟合,预测出昨天数据的数值范围,比如在置信度95%时的置信区间,如果超出置信区间,则认为是异常波动;

c. 同级城市排序或相似城市对比法:对于业务的局部单元,比如全国开展的业务,判断成都市业务的波动是否异常,可以通过找到与成都市相似的对标城市或者同级城市,判断相似或同级城市订单量的波动差异,如果大家都普遍下降,则认为城市角度的业务单元未发生异常。

波动的异常分析,在数学和统计学中还有非常多的方法可以使用,大家可自行检索,在此不做赘述。

(2)影响范围的细分

有了波动情况的判断,就需要进一步下钻分析波动影响的范围,根据业务场景的不同,会有不同的下钻方式。比如常见的时空角度,分析哪些城市的业务波动对全国影响最大,哪些时段的业务波动对全天影响最大,哪些下钻维度的波动最全局影响最大。这里会涉及一个「影响最大」的量化逻辑,方法有很多,以城市维度下钻举例,这里列举2个简单规则:

a.绝对值影响度:将各城市订单量波动值的绝对值进行降序排列,取TOP5或TOP10进行展示,并辅助以各城市的波动比例;

Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP