搜索

登录

注册

数说咖啡 | Python 分析瑞幸与星巴克

阅读:906评论:0点赞:2收藏:12020-11-25
本文通过 Python 分析瑞幸和星巴克之间的数据,通过地理分布、价格、评分、评价等维度,结合两者的产品,分析一下基本现状:瑞幸在大众眼中的口碑是怎么样的?星巴克是否有可能会被颠覆?

引导:全中国(含港澳台)咖啡店一共 6 万多家,星巴克占总共 3000 多家,瑞幸 2000 多家,不得不说瑞幸的扩张速度「飞快」。

另一方也在加快脚步的是,星巴克在今年 5 月左右上线了「啡快」服务,对标瑞幸线下交付的方式。咖啡巨头之间的竞争可以说是非常激烈。

恰好 4 月下旬的时候获取到一份数据,本文就借此机会通过 Python 分析瑞幸和星巴克之间的数据,通过地理分布、价格、评分、评价等维度,结合两者的产品,分析一下基本现状:瑞幸在大众眼中的口碑是怎么样的?星巴克是否有可能会被颠覆?



前言


一次标准的数据分析不可避免的需要包含以下几个步骤:


1 问题定义:数据分析的目的是什么?本文旨在利用 @梁斌 梁博分享的某点评网站的热门城市瑞幸、星巴克的数据,探求二者之间的基本现状,借助已有数据描述二者在某点评网站上的客观形象,视图挖掘隐藏差异,并结合自己对产品的思考对比得出一些结论。这里的基本问题,从几个维度来看,包括:


地理分布维度:


  • 瑞幸、星巴克在热门城市的门店数量是怎么样的?整体规模如何?
  • 瑞幸、星巴克在热门城市的分布是怎么样的?不同城市之间的门店规模如何?有什么异同?


价格维度:


  • 瑞幸、星巴克在全部样本中的价格分布是怎么样的?消费水平有什么异同?


评分维度:


  • 标榜咖啡大师的瑞幸,与星巴克相比,顾客对其评分在口味、环境、服务上的分布是怎么样的?有什么异同?


评论维度:


  • 基于已有数据,瑞幸、星巴克的评论数分布是怎么样的?有什么异同?


店铺画像:


  • 怎么样算优质咖啡店?



2 数据获取:对于公共数据,这里是直接拿的 @梁斌 梁博的数据,获取其它平台的数据的爬虫步骤本文没有涉及,当然如果为了更准确地产出结论,除已有的数据外,其实还需要覆盖更多城市更全面的数据,且最好包含 TOP10 点赞产品,以及评论用户属性、评论内容等维度,后期感兴趣的同学可以在此基础上进一步探索。


3 数据处理:清洗、转化数据的环节,将数据转化为可以用于分析的数据。



4 数据分析:基于清洗后的数据,针对第一阶段提出的问题进行分析。



5 数据展示:与分析过程相辅相成,本文的撰写过程也是数据分析的最后一步,即把数据分析的这个故事通过可视化的方式尽可能讲的完整一些。



目录

1 数据准备及处理

2 数据可视化展示并结合产品进行分析


1 数据准备及处理

导入数据看下数据格式,包含了店名、星级、评论量、价格、评分、位置、城市、地址共 8 列数据,就这些维度,能分析出哪些东西,一起来看:



以上述原始数据的维度来看,发现有一些数据列无法直接用于分析,需进行简单处理,我们编写好数据处理方法,包括:


  • poi 地理位置数据转化为可以绘制热力图的列表



  • price 字符串的价格数据拆分,转化为可以用于分析的标准价格



  • score 分数聚合在了一起,需拆分为口味、环境、服务共 3 列





2 数据可视化展示并结合产品进行分析


地理空间维度

基于已有数据(仅包含热门城市的门店),对于地理空间维度,我们由大到小,分别来看。


全国范围对比:



北京范围对比:



上海范围对比:




我们已有的数据中,星巴克门店数量为 1997,瑞幸门店数量为 1325,从存量门店数据来看,星巴克整体门店的线下覆盖度更胜一筹,但众所周知,假如我们加上时间尺度,去看最近的月均开店量或年均开店量,那么瑞幸的赶超速度就不容小视了。


热力图中以北京、上海、广州、深圳为例,除上海热力度差异较大外,其它城市的热力度比较相仿。(上海的热度,星巴克以压倒性优势超出瑞幸。怎么讲,上海咖啡文化的发展程度可见一斑..)


那么,其它城市呢?


我们找出数据中瑞幸、星巴克共有的城市,拉出来看下对比,这些城市分别是:上海市、北京市、南京市、广州市、成都市、杭州市、深圳市。



从柱状图对比来看,对于成都、南京、杭州这些新一线城市来说,除杭州外,南京、成都的门店数量依然是比较相近


这里再次感叹下文章开头所提到的瑞幸的扩张速度「飞快」。那对于瑞幸来说,速度保证了,质量呢?夸张的开店速度的背后的价格、顾客评分、店内服务等方面到底怎么样呢?


价格维度

瑞幸产品包括咖啡、瑞纳冰、轻食以及新增的茶类饮品,产品种类与星巴克的「重叠度」很高。直接来看二者消费产品在价格方面的对比:



星巴克共 1884 条有效价格记录,人均价格平均值为 39.99 元,最大值为 100 元,最小值为 28 元。


瑞幸共 735 条有效价格记录,人均价格平均值为 23.22 元,最大值为 38 元,最小值为 12 元。

(此处笔者随便在某点评网站捞了一家瑞幸门店观察,确实人均价格就在 24 元左右,这里数据还是比较靠谱)


从价格维度可看出:瑞幸的最大消费程度仍没有沾到星巴克的平均消费程度的边儿,可以说是「性价比」咖啡、「亲民」咖啡了。


这当然也印证了瑞幸的品牌主张,短平快、高性价比、咖啡消费观念的革新。


那么问题又来了,标榜咖啡大师的瑞幸价格做的如此之低,实际口味到底如何?实际到底评价如何呢?



评分维度

从左至右,绿色部分为星巴克的口味、环境、服务评价箱型图,蓝色部分为瑞幸的口味、环境、服务评分箱型图。



不同维度的评分代表着顾客对内、对外评价的不同角度,反映的问题不同,我们拆解来看:


  • 从口味角度:


星巴克的口味评分均值为 7.91,50% 中位为 7.90;

瑞幸的口味评分均值为 7.75,50% 中位为 7.70


且星巴克的口味评分的标准差更小,代表其评分更为稳定。那么从咖啡出品的角度来讲,以上述数据来看,大众顾客其实还是更为青睐于星巴克的口味了。


但笔者还是有一点抱有怀疑就是,咖啡口味真差很多吗?很难简单得出谁的口味好、坏的结论。与口味相关的因素太多,甚至环境、服务都可能隐形影响顾客对口味的评价。所以我们在此也只能得出:顾客更加认同星巴克的咖啡出品。背后原因还需要更多交叉性的分析。


  • 从环境角度:


星巴克的环境评分均值为 7.91,50% 中位为 7.90

瑞幸的环境评分均值为 7.78,50% 中位为 7.70


这个数据一点也不意外,星巴克的环境不容分说,我们把时间切到早、中、晚,分别去两家店体验下氛围能感受到:在瑞幸,一切都「快」。在星巴克,一切可以「慢」下来。


瑞幸的门店环境更具有「便利」的属性,而星巴克的门店环境,更具有一定的「社交」的属性。当然,星巴克还有不少高端门店,如北京、上海的臻选旗舰店。所以这一部分结论比较明显:顾客更加认同星巴克的环境氛围。


  • 从服务角度:


这里瑞幸就开始发力了:

瑞幸的服务评分均值为 7.90,50% 中位为 7.90

星巴克的环境评分均值为 7.74,50% 中位为 7.70


由于没法统计评论热词,从某点评网站赞叹瑞幸的服务的内容中捞取几条可以发现,大多数顾客在赞叹瑞幸的「自助点餐」、「自提服务」等方面,的确如此,线上下单 + 线下交付的方式足够快速便捷。对于瑞幸的服务,可以说是击中顾客的痛点。


所以今年5月左右星巴克也推出了对标瑞幸服务模式的「啡快」服务,同样可以在线点、到店付,试图减弱瑞幸的差异化,但星巴克的啡快服务的覆盖面积仍然有限。因此,服务角度,瑞幸更胜一筹。



评论维度



星巴克的评论数超过 255 的有 499 家门店,超过 1000 的有 41 家门店,超过 10000 的有 1 家门店,头部的门店的评论热度还是将其与瑞幸拉开了较大的差距


从以上评论维度来看,瑞幸未来需要赢得更多的有效评论(无论是自发还是非自发形式),可影响更多人在咖啡购买及选择决策时的倾向性。


优质门店画像

优质门店的标准通过以下 2 点进行定义,包括:


1 计算 口味/环境/服务 评分的平均值。该平均值数据需在本品牌全部门店数据从小到大排序后的 75% 位置之上。


2 评论数需在本品牌全部门店数据从小到大排序后的 75% 位置之上。


分别导出二者的数据,计算符合上述标准的门店,双方均不超过 200 家,将这些门店的核心数据计算后,得到以下门店画像:



横向对比可以发现:优质门店星级基本一致(换算为 5 星标准,各自均为 4.2),评分平均值星巴克较低与瑞幸,评论数星巴克高于瑞幸。


最后,回过头来看,从整体数据表现上,星巴克虽有长时间品牌、口碑的积累优势,但瑞幸创新的线上 + 线下玩法、门店扩张、更多补贴、裂变分享等方式,使二者差距逐渐缩小,但要说「颠覆」,其实还是有些困难。但瑞幸的势头也使得星巴克被迫进行一系列调整,在稳中求「变」。总而言之,期待瑞幸、星巴克在接下来的半年会有更多的新动作,看好瑞幸,也看好星巴克。


不管如何,对普通消费者来说,资本的对抗让普通消费者拥有了更多的机会可以体验到更丰富的咖啡、更好的环境、更好的服务。这是好的。


所以一起用力感受这个多元的咖啡文化时代吧。


数据源: 公众号回复「咖啡」获取本文所用的数据

End.
爱数据网专栏作者:Salt
专栏名称:PMSalt
专栏简介:盐分汲取,数据观察,常年指北。
个人公众号:PMSalt



收藏 1 +点赞 2
评论