数据分析理论
对数据分析进行一个简单的了解. (´▽`)
Q1: 数据分析是什么?
A1: 数据分析:从数据中找到有用的信息来帮助我们做出更明智、更准确的决策.
你从预订系统中导出了包含销售量、产品类别、顾客年龄、区域分布等信息的数据表格.
但是这份数据很庞杂,有很多重复、不准确的信息,难以直观地看清销售情况,更不能针对性地提出具体的业务建议.
于是你需要进行数据分析,对数据表格中的数据进行加工和整理,从中找出关键的信息.
比如按不同的产品类别或地区分组,计算出每个产品或地区的销售额、销售量以及同比增长率等,结合这些数据,分析出产品或地区销售的走势和趋势.
1
2
3
4
5
2
3
4
5
Q2: 如何成为一位优秀的数据分析师?
A2: 要懂业务 + 专业知识(统计学-Python-机器学习等) + 会数据分析逻辑&分析方法 + 会借助一些工具(Excel-sql-BI).
- 要懂业务: 这个非常重要!!
- 专业知识: Python必须掌握; 分析基于统计学原理,对其的要求不是很高
- BI工具: Tableau等.
1
2
3
2
3
Q3: 什么是业务指标?
A3: 我们有当前业务很多维度的数据, 为了提高解决某个业务问题的效果, 需要对其中n个维度进行分析, 将其转换为业务指标.
>>举例1
前面Q1的回答中,提到的预订系统中 的 同步增长率 就是一个指标.
>>举例2 "一个贴切的例子"
问题:酒店管理公司希望提高客户满意度
指标:
服务质量评分=各客户服务评分总和/客户数
问题解决时间=所有客户问题解决所需时间总和/客户数
员工互动率=员工与客户互动次数/总客户数
服务效率=客户停留期间所需办理时间总和/客户数
反馈投诉次数=客户投诉和反馈次数
注:这里我说的维度是指 客户服务评分、互动次数 这些数据.(可能用词不准确,但就是那个意思Hhh 别跟后面的多维度拆分法混淆了
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
Q4: 分析业务场景, 指标是非常重要,有哪些常见的指标呢?
A4: 第一要点还是要懂业务,然后进行 指标体系的搭建.
"有些指标是现成的,拿来用即可!" ※ 以互联网电商数据为例,其常用的指标如下: (这些在下面Q6数据分析模型中会用到)
>> 用户数据
- 日新增用户数
- 活跃用户数: 日|周|月 注:每个公司对活跃用户的定义不同.
- 活跃率: 活跃用户数/总用户数
- 留存率: 在第N天还访问你的应用的用户数/第1天访问你的应用的用户数(N一般等于3|7|30 单位-日) 注:有个40-20-10的法则
- 单位获客成本: 在流量推广中,广告活动产生的投放费用与广告活动带来的UV(独立访客数量)的比值.
- 客单价: 订单总额与订单数量的比值.
- ARPU(Average Revenue Per User: 每个用户的平均收入)
- ARPPU(Average Revenue Per Paying User: 每位付费用户的平均收入)
>> 行为数据
- PV: 页面访问量,也叫页面点击量 注:同一个网页刷新一次就算一次访问,用户对同一页面的多次访问,访问量累计
- UV: 独立访客数. 注:一个cookie来标记这个用户.
- IP
- 平均访问时长: 平均访问时长=总访问时长/访问次数.
- 跳出率: 跳出率=只访问一个页面就离开网站的访问次数/总访问次数.
- 转化率: 潜在用户在我们的网站上完成一次我们期望的行为,就叫做一次转化. 转化率=转化次数/访问次数
- 复购率: 购买两次及以上的客户/总购买客户数
>> 产品数据
- 成交总额(GMV): 也就是零售业说的“流水“
- SKU(Stock Keeping Unit): 例如,一款商品多色,则是有多个SKU
- SPU(Standard Product Unit): 通俗点讲,属性值、特性相同的商品就可以称为一个SPU
- ROI(Return On Investment): 投资回报率=产生的交易金额/活动投放成本金额
PS: iphone5S是一个SPU; iPhone 5S配置为16G版、4G手机、颜色为金色、网络类型为TD-LTE/TD-SCDMA/WCDMA/GSM则是一个SKU
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
★ 我们要学会收集积累不同业务场景下的指标!
Q5: 在前面Q2,我们说一位优秀的数据分析师需要掌握 一定的分析方法. 分析方法是啥呢?
A5: 把零散的想法, 整理成有条理的思路
首先大家要明白,进行相关业务场景的数据分析并不是完全基于个人不同的想法贸然进行分析处理,而是有章法可循的.
我们可以借鉴一些已经成熟数据分析的思维和方法进行实现,也就是所谓的分析方法.
- 如果把数据分析比作盖房子,那么(Excel,sql,python等)就是施工工具,而数据分析方法就是盖房子的设计图.
1
2
3
4
2
3
4
Q6: 常用的分析方法/模型有哪些呢?
A5: 多维度拆解分析法; RFM分析模型; 漏斗分析模型; AARRR模型; AIPL分析法
多维度拆解分析法
业务问题: 一家线上购物平台做了一次广告推广,老板想看看推广效果如何?
解决方案: 我们需要了解业务流程,对业务流程进行拆解,提取出解决该业务问题的指标. (业务流程和业务指标就是两个维度.
业务流程如下:
-第1步- 看到渠道的广告
-第2步- 被广告吸引进入店铺
-第3步- 在店铺选择感兴趣的商品
-第4步- 选择好商品,最终决定购买
业务指标:
1> 推广效果最直观的是看用户增长了多少. 将不同渠道的新增用户进行统计(每个渠道新增用户占所有新增用户的百分比)
2> 哪个渠道来的用户更愿意在店铺购买呢?统计不同渠道新增的用户的购买率.
根据业务指标进行分析,提出优化意见.
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
RFM分析模型
不同用户对公司带来的收益差别很大(二八定律20%的做有价值用户能带来80%的收益).
因此需要对用户进行价值评价,找到最有价值的用户群,并针对这部分用户进行差异化的营销!!
RFM是3个指标的缩写
- R-Recency 最近一次购买时间间隔 > 上一次购物时间距今最近的顾客,通常在近期响应营销活动的可能性也最大
- F-Frequency 消费频次 > 消费频率越高意味着这部分用户对产品的满意度最高,用户粘性最好,忠诚度也最高
- M-Money 消费金额 > 为公司带来价值的最直接体现,是需要重点争取的对象
1
2
3
4
5
6
7
2
3
4
5
6
7
漏斗分析模型
通常在电商模式中,提到“转化率”,就往往配有一张“漏斗分析图”作为辅助的说明.
比如,分析从用户进入网站到最终购买商品的变化趋势:
-1- 进入网站 100%
-2- 浏览商品 40%
-3- 加入购物车 20%
-4- 支付订单 16%
-5- 支付成功 13%
1
2
3
4
5
6
7
8
2
3
4
5
6
7
8
AARRR模型
AARRR模型是一个以用户的生命周期为线索,从拉新、到促活、到留存、再到付费、再到推荐的整个过程
拉新 要关注 新访客的注册率
促活 要关注 新注册用户激活率
留存 要关注 新用户的留存率
付费 要关注 用户的付费率
推荐 要关注 留存用户的推荐率
1
2
3
4
5
6
7
2
3
4
5
6
7
AIPL分析法
某一天,你在某应用上看到一条推广广告,然后点击进入了一个某商城的购物平台,看到了自己感兴趣的商品
经过自己的阅览下单购买了一件该商品,在后期对该商品使用了一段时间后,感觉使用体验非常好,于是有购买了一件.
在这段消费旅程中,你经历了发现广告、产生兴趣、下单购买和重复购买的完整过程.
这个过程正好符合AIPL分析模型反应的消费者的4个典型的消费行为:
-A- Awareness 认知 > 关键指标:广告覆盖率
-I- Interest 兴趣 > 进店率、点击率
-P- Purchase 购买 > 成交率、转化率
-L- Loyalty 忠诚 > 复购率、分享率
1
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9