中国统计网

登录

首页

分类浏览

专题

专栏作者

问答

线下活动

企业招聘

app下载

投稿

注册




从0开始学电商数据分析-13
头像 零一 数据分析
数据分析

大家好,我是零一,经过深思熟虑,我把制作分析模型作为高阶的内容。学完高阶的预期效果是可以独立用Excel制作分析模型,并且还要掌握多一个分析工具。

 

鉴于本人的知识水平有限,依旧求拍砖,谢谢!

 

很喜欢一个小伙伴发的说说,我稍微改了下:学海无涯,分享是岸!赞同的转起!

 

最近的感慨是这社会浮躁的人真多啊!总想着快速致富或者达到目的,却不想万丈高楼平地起。

 

好!我们开始。

 

首先给大家介绍一些相关的数据分析工具:

开源工具有RRapidminerWeka等等

 

闭源工具有Spss StatisticsSpss ModelerSasExcel等等

(在我的网盘里面都有得下载)

 

开源是免费的工具,源码是可以从网上下载下来的,一般只有英文版本。闭源工具是一些商业软件,都是需要破解才能正常使用,否则就购买版权。

 

首先是Modeler,它比EXCEL是要简单方便,图也是可以编辑的,这里除了做图之外还有很多模型,这些都是在实际数据挖掘里面都会应用到。Modeler是专门做商业数据分析与挖掘的工具.

 

Modeler设计好数据流,也是可以达到分析自动化的目的,并且分析的方法会更加丰富。

image.png

 

Statistics也是SPSS系列的工具,主要是做统计分析的,跟SAS一样都是业界内非常古老的软件。SAS现在已经是一套系统了,体积有10G+。相应的也比较繁琐。

 

EXCEL特点是易学难精。它是非常强大的,虽然容易入门,但不容易精通。它可以解决大部分的数据分析需求,也是界面化操作,但可以用VBA编程语言拓展功能。

image.png

 

RapidMiner只有英文版本,也是界面化操作且具有流程化,也是非常强大的一款工具,它在某些方面要比Modeler要强大很多。

image.png

 

R语言需要有一定的编程基础的,可扩展性非常强。我非常喜欢的一款工具,相对来说比较难一点的。可以整出很炫丽的图,非常的强大。

image.png

image.png

 

我个人喜欢的工具是ExcelRRapidminer。如果除了EXCEL外,让我推荐,我建议大家可以考虑SPSS Modeler。因为这个是最简单的工具,有中文版本,它的特点就是简单易学,又是界面操作,专业度强且是流程化的工具。

 

=======================================================

下面,我们来学习用Excel 2013为大家演示做一个分析模型。

 

这里是我提前抓取的数据。把数据全部选中,点击插入表格后,数据表格周围会出现流动的蚂蚁线,会有一个创建表的对话框弹出,我们直接点确定就OK了。

image.png

image.png

 

点击确定后我们发现,出现了一个全新的界面。

image.png

 

到了这一个界面,我们再把子行业成交量拖到行标签,成交量拖到数值。再选中插入饼图,会成为下面的一个样式。

image.png

 

接着把右边的图例给删除,右击添加数据标签,选中设置数据标签格式,会出现一个图例选项,我们选中类别名称跟百分比。之后,我们这个饼图就做好了,做好后,我们可以将它进行调整到美观跟清晰大小。另外加上图表的配色这些都是可以自定义的哦。图标的名称更改都是可以自行进行设置。

 

第一步:删除图例

image.png

 

第二步:右击图片,选中添加数据标签

image.png

 

第三步:点中数据,选中设置数据标签格式

image.png

 

第四步:选中类别名称跟百分比

image.png

 

第五步:修改图标标题

image.png

 

到这里就已经完成了单个的占比图,如果要看每个月的占比情况,可以选择堆积条形图。

image.png

 

这张图就是堆积条形图,每个月都是100%,反映每个月下,各个分类的占比情况,色块越大代表占比越大。可以清晰看出某个子行业全年的占比走势。

image.png

image.png

 

把行业数据(子行业和属性)展示出来,配合饼图、折线图(参考初阶第一篇)和堆积条形图可以做出漂亮的分析模型。下面教大家做个按键,来实现半自动刷新。

 

首先插入一个ActiveX控件,选择命令按钮

image.png

 

右击命令按钮设置属性

image.png

 

修改命令按键显示的文字

image.png

 

进入设置代码

image.png

 

敲入ThisWorkbook.RefreshAll这段代码,然后关闭工程编辑器,并退出设计模式(在设计模式下,命令按键是不起作用的。

image.png

 


点击【设计模式】退出设计模式

image.png

 

下面,我们来试下刷新数据

先把旧的数据删除(不包含列名),注意是删除表行,不是按delete(我相信虽然我说了,但还是有一大堆朋友会按delete,然后来找我,怎么跟你的不一样。我表示这个问题我会自动屏蔽)

image.png

 

然后,把新的数据粘贴入表格里面

image.png

 

点击一下刷新图表,即可刷新

image.png

 

下图是刷新后的结果

image.png

 

另外,可以插入日程表,来实现切换时间维度,比如分季度查看每个记录的数据报表(数据源必需有日期格式的数据,否则不能插入日程表)

image.png

image.png

image.png

image.png

image.png

 

 

另外也可以配合切片器(参考初阶第三篇)来实现维度的切换,整个报表会更加智能。

 

========================================================

 

下面我们来做一份有关店铺的转化率,访问深度,等纬度进行分析。

 

这是一份从量子导出的店铺数据分PC和无线两个终端,分别在两个CSV文件里面

image.png

image.png

 

先简单处理下数据,把周总和、平均值删除。另外把“-”给替换成0

 

接着,用我写好的模块。来处理这些数据。

 

进入Visual Basic,导入我写好的模块。(模块在我网盘)

image.png

image.png

image.png

 

然后新建一个sheet

image.png

 

运行我写好的模块

image.png

image.png

 

执行宏后会看到标准的数据结构

image.png

 

 

把日期的格式给设置一下

image.png

 

效果:

image.png

 

然后重复前面的操作,插入表格-插入数据透视表-插入图表-插入切片器和日程表

 

稍微排版一下,工作表名:分析报表

 

image.png

image.png

 

这样子一个简单的监控分析模型就做好了,这里没有任何的分析方法,只是实现了数据展现,方便分析师对各种数据维度进行对比。

 

另外,用数据分析,来看下最基本的各个维度的相关性。

 

首先打开Excel自带的分析工具库

image.png

 

勾选分析工具库后,可以在数据选项卡中找到这个工具库

image.png

image.png

image.png

 

关于相关性的知识可以参考中阶第九篇

image.png

 

另外,我们也可以将相关性可视化展示。

 

这时用到的是原始的数据结构,将数据转换成表格,工作表名:相关性源数

image.png

 

然后设置自定义名称

image.png

 

X轴的值

image.png

 

Y轴的值

image.png

 

插入散点图

image.png

image.png

image.png

image.png

image.png

 

 

确定后就可以看到散点图(读法依旧参考中阶第九篇)

 

现在我们要实现全维度的变换观察,插入表单控件的组合框

image.png

 

准备好列表(把表头复制了后转置粘贴即可)

image.png

 

设置控件

image.png

image.png

 

第一个控件设置好,复制多一个,只需要把单元格链接的105改成106就可以了,分别指向两个单元格,前面我们定义的名称,X是根据A105的值变化,Y是根据A106的值变化。

 

A105A106数值隐藏起来

image.png

 

简单排版一下

image.png

 

这个散点图,只要把源数据替换,就会自动刷新(原理是表格的功能特性)

 

整个模型的效果:

image.png

 

所有的中间层数据表我都隐藏了,可以通过取消隐藏来查看中间层数据

image.png


End.


作者:零一(中国统计网特邀认证作者)


本文为中国统计网原创文章,转载时请注明作者及出处,并保留本文链接。

我要评论
验证码
  • 0
暂无评论

关注公众号

中国统计网微信公众号

微信公众号:cntongji

今日热议

专栏作者

  • 傅一平
    统计网特邀认证作者
    浙江移动大数据中心 数据管理部经理 博士 毕业于浙江大学 10多年数据从业经验,专注于大数据采集、处理、建模、管理、变现及产业等研究
  • 黄成明
    统计网特邀认证作者
    黄成明 ,零售数据分析研究者,拥有15年的销售及数据分析经验,历经美国强生公司、妮维雅公司、雅芳公司和鼎盛时期的诺基亚公司。目前是数据化管理的咨询顾问和培训师。他独立研发了基于周销售权重指数的零售管理模型,可以有效地进行目标管理、销售预测、客流预估、促销评估、销售预警等。
  • tommy
    统计网特邀认证作者
    数据落地应用探索者
  • 秦路
    统计网特邀认证作者
  • 数据海洋
    统计网特邀认证作者
    数据应用的实践者!
  • 张溪梦
    统计网特邀认证作者
    GrowingIO创始人&CEO,前LinkedIn商务分析总监
立即下载
版权所有: 统计网. Copyright © 2016 itongji.cn All Rights Reserved. 备案号:ICP备15042641号-3