数据分析师要学统计学,适合看哪本书讲的好全?要最终面对阿里巴巴批发网官网的数据分析师职位。高手推荐,谢谢。

统计学专业的大四学生,想去公司应聘“数据分析师”这一职位,需要哪些必备技能?因为时间有限,必须赶在下学期的招聘季之前把最重要的东西学了,但是在这个学期的笔试中“数据分析师”的题目涉及到了算法,数据结构等非本专业的内容,所以想请教各位大大,能够面试上“数据分析师”职位,除了课本上的知识,还需具备那些技能,比如说C/C++,Java等编程语言啊,MySQL,SAS,SPSS,hadoop什么的?能给我一个主次顺序是最好不过了,谢谢:)
精通SQL+R或者spss+ppt,其他的最好懂点开发语言php或者python,懂点计算机和统计,有点相关的建模或者开发经历,这些是必不可少的。另外需要根据具体职位区分,有做数据管理的,也就是DBA,有做数据挖掘的,偏向于算法构建,即使数据分析也分为互联网行业,金融行业,咨询行业,传统行业,需要根据你的具体意向做一些相应的准备。个人观点,若有谬误,还请见谅。
从阿里巴巴笔试试题看数据分析师的职业要求以下试题是来自阿里巴巴2011年招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。一、异常值是指什么?请列举1种识别连续型变量异常值的方法?异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。Grubbs’ test(是以Frank E. Grubbs命名的),又叫maximum normed residual test,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。未知总体标准差σ,在五种检验法中,优劣次序为:t检验法、格拉布斯检验法、峰度检验法、狄克逊检验法、偏度检验法。点评:考察的内容是统计学基础功底。二、什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy)。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析计算方法主要有: 层次的方法(hierarchical method)、划分方法(partitioning method)、基于密度的方法(density-based method)、基于网格的方法(grid-based method)、基于模型的方法(model-based method)等。其中,前两种算法是利用统计学定义的距离进行度量。k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。其流程如下:(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;(3)重新计算每个(有变化)聚类的均值(中心对象);(4)循环(2)、(3)直到每个聚类不再发生变化为止(标准测量函数收敛)。优点:本算法确定的K 个划分到达平方误差最小。当聚类是密集的,且类与类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为 O(NKt),其中N是数据对象的数目,t是迭代的次数。一般来说,K&&N,t&&N 。缺点:1. K 是事先给定的,但非常难以选定;2. 初始聚类中心的选择对聚类结果有较大的影响。点评:考察的内容是常用数据分析方法,做数据分析一定要理解数据分析算法、应用场景、使用过程、以及优缺点。三、根据要求写出SQL表A结构如下:Member_ID(用户的ID,字符型)Log_time(用户访问页面时间,日期型(只有一天的数据))URL(访问的页面地址,字符型)要求:提取出每个用户访问的第一个URL(按时间最早),形成一个新表(新表名为B,表结构和表A一致)createtable B asselectMember_ID, min(Log_time), URL from Agroup byMember_ID ;点评:SQL语句,简单的数据获取能力,包括表查询、关联、汇总、函数等。另外,这个答案其实是不对的,实现有很多方法,任由大家去发挥吧。四、销售数据分析以下是一家B2C电子商务网站的一周销售数据,该网站主要用户群是办公室女性,销售额主要集中在5种产品上,如果你是这家公司的分析师,a) 从数据中,你看到了什么问题?你觉得背后的原因是什么?b) 如果你的老板要求你提出一个运营改进计划,你会怎么做?表如下:一组每天某网站的销售数据日期 9月6日(周一) 9月7日 9月8日 9月9日 9月10日 9月11日(周六) 9月12日(周日)小收入a) 从这一周的数据可以看出,周末的销售额明显偏低。这其中的原因,可以从两个角度来看:站在消费者的角度,周末可能不用上班,因而也没有购买该产品的欲望;站在产品的角度来看,该产品不能在周末的时候引起消费者足够的注意力。b) 针对该问题背后的两方面原因,我的运营改进计划也分两方面:一是,针对消费者周末没有购买欲望的心理,进行引导提醒消费者周末就应该准备好该产品;二是,通过该产品的一些类似于打折促销等活动来提升该产品在周末的人气和购买力。点评:数据解读能力,获取数据是基本功,仅仅有数据获取能力是不够的,其次是对数据的解读能力。五、用户调研某公司针对A、B、C三类客户,提出了一种统一的改进计划,用于提升客户的周消费次数,需要你来制定一个事前试验方案,来支持决策,请你思考下列问题:a) 试验需要为决策提供什么样的信息?c) 按照上述目的,请写出你的数据抽样方法、需要采集的数据指标项,以及你选择的统计方法。a) 试验要能证明该改进计划能显著提升A、B、C三类客户的周消费次数。b) 根据三类客户的数量,采用分层比例抽样;需要采集的数据指标项有:客户类别,改进计划前周消费次数,改进计划后周消费次数;选用统计方法为:分别针对A、B、C三类客户,进行改进前和后的周消费次数的,两独立样本T-检验(two-sample t-test)。点评:业务理解能力和数据分析思路,这是数据分析的核心竞争力。综上所述:一个合格的数据分析应该具备统计学基础知识、数据分析方法、数据获取、数据解读和业务理解、数据分析思想几个方面能力。转载自:。阿里粑粑-数据分析师:如果你,具有良好的商业敏感度和优秀的数据分析技能,能够开发创新而实际的分析方法以解决复杂的商业问题,擅长与商业伙伴的交流沟通;如果你,熟悉SAS、SPSS等统计分析软件,熟悉 SQL; 如果你,所学专业是数学,统计,运筹学等相关专业; 如果你,具备良好的沟通能力和报告讲解能力,并期望提升自己在管理及组织能力方面的锻炼;如果你,具备优秀的团队合作精神、诚实、勤奋、严谨;积极创新、乐于面对挑战、负责敬业等特质。 如果你对行为分析感兴趣,如果你喜欢从数据中发现规律,如果你想踏入大数据的门槛,那就加入数据分析师的行列吧!???????????????????? 分割线 ????????????????????2014 阿里巴巴校招数据分析师职位笔试题目(回忆版)1、选择题1、 一下哪个属于离散变量水稻亩产量 家庭收入 商品价格 汽车产量2、 卡方分布的样本方差分别是n 1 2n 4n3、 有个人买彩票,中奖概率为 1/10,每次花 200 元,连续买 5 次,如果中奖则奖金为 1000 元,问不赔钱的概率是多少4、 世界男女比例相当,黄种人比其他人种多的多,其他人种男的比女的多,以下那句是正确的黄种人男人比黑种人女人多黄种人女人比黑种人男人多5、 关于聚类分析的题目 ,判断哪句不正确6、 均值&中位数&众数,问这个分布偏左还是偏右7、 随机无放回抽样跟随机有放回抽样比较,哪个方差大,还是相等8、 回归分析 y=a+bx,如果存在自相关,问 b 的值如何,是正负还是 0,还有显著性如何。2、问答题1、 SQL 语句,表 A 有 member_id, city,表 B 有 member_id, price 几项,将 A 和 B 链接,且指定城市和 price&10. Member_id 为主键.如果不会写就给出数据分析的思想2、数据清理中,处理缺失值的方法3、回归分析中出现的多重共线性问题是什么,如何处理3、分析题1、对不同价位区间的商品做活动,表 A 给活动出流连次数与总体浏览次数,表 B 给出活动商品转换率和总体商品转换率,分析现象2、某电商推出一款新的产品,希望这个产品能大卖,让你给这个主题取个名字,如果你是数据分析师,设定哪些指标来判断,给出指标的定义和意义,至少三个。2014阿里巴巴数据分析实习生招聘笔试题目转载自:。
你应该去相关的校园招聘网站,看看相关企业的发布的岗位的要求。依据这些要求来提升自己将事半功倍。招聘网站也要看比较规范的,下像,应届生,新手党。
data scientist从阿里巴巴笔试试题看数据分析师的职业要求 - 今日头条()
从阿里巴巴笔试试题看数据分析师的职业要求
以下试题是来自阿里巴巴2011年招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。一、异常值是指什么?请列举1种识别连续型变量异常值的方法?异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。Grubbs’ test(是以Frank E. Grubbs命名的),又叫maximum normed residual test,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。未知总体标准差σ,在五种检验法中,优劣次序为:t检验法、格拉布斯检验法、峰度检验法、狄克逊检验法、偏度检验法。点评:考察的内容是统计学基础功底。二、什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy)。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析计算方法主要有: 层次的方法(hierarchical method)、划分方法(partitioning method)、基于密度的方法(density-based method)、基于网格的方法(grid-based method)、基于模型的方法(model-based method)等。其中,前两种算法是利用统计学定义的距离进行度量。k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。其流程如下:(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;(3)重新计算每个(有变化)聚类的均值(中心对象);(4)循环(2)、(3)直到每个聚类不再发生变化为止(标准测量函数收敛)。优点:本算法确定的K 个划分到达平方误差最小。当聚类是密集的,且类与类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为 O(NKt),其中N是数据对象的数目,t是迭代的次数。一般来说,K&&N,t&&N 。缺点:1. K 是事先给定的,但非常难以选定;2. 初始聚类中心的选择对聚类结果有较大的影响。点评:考察的内容是常用数据分析方法,做数据分析一定要理解数据分析算法、应用场景、使用过程、以及优缺点。三、根据要求写出SQL表A结构如下:Member_ID(用户的ID,字符型)Log_time(用户访问页面时间,日期型(只有一天的数据))URL(访问的页面地址,字符型)要求:提取出每个用户访问的第一个URL(按时间最早),形成一个新表(新表名为B,表结构和表A一致)createtable B asselectMember_ID, min(Log_time), URL from Agroup byMember_ID ;点评:SQL语句,简单的数据获取能力,包括表查询、关联、汇总、函数等。另外,这个答案其实是不对的,实现有很多方法,任由大家去发挥吧。四、销售数据分析以下是一家B2C电子商务网站的一周销售数据,该网站主要用户群是办公室女性,销售额主要集中在5种产品上,如果你是这家公司的分析师,a) 从数据中,你看到了什么问题?你觉得背后的原因是什么?b) 如果你的老板要求你提出一个运营改进计划,你会怎么做?表如下:一组每天某网站的销售数据a) 从这一周的数据可以看出,周末的销售额明显偏低。这其中的原因,可以从两个角度来看:站在消费者的角度,周末可能不用上班,因而也没有购买该产品的欲望;站在产品的角度来看,该产品不能在周末的时候引起消费者足够的注意力。b) 针对该问题背后的两方面原因,我的运营改进计划也分两方面:一是,针对消费者周末没有购买欲望的心理,进行引导提醒消费者周末就应该准备好该产品;二是,通过该产品的一些类似于打折促销等活动来提升该产品在周末的人气和购买力。点评:数据解读能力,获取数据是基本功,仅仅有数据获取能力是不够的,其次是对数据的解读能力。五、用户调研某公司针对A、B、C三类客户,提出了一种统一的改进计划,用于提升客户的周消费次数,需要你来制定一个事前试验方案,来支持决策,请你思考下列问题:a) 试验需要为决策提供什么样的信息?c) 按照上述目的,请写出你的数据抽样方法、需要采集的数据指标项,以及你选择的统计方法。a) 试验要能证明该改进计划能显著提升A、B、C三类客户的周消费次数。b) 根据三类客户的数量,采用分层比例抽样;需要采集的数据指标项有:客户类别,改进计划前周消费次数,改进计划后周消费次数;选用统计方法为:分别针对A、B、C三类客户,进行改进前和后的周消费次数的,两独立样本T-检验(two-sample t-test)。点评:业务理解能力和数据分析思路,这是数据分析的核心竞争力。综上所述:一个合格的数据分析应该具备统计学基础知识、数据分析方法、数据获取、数据解读和业务理解、数据分析思想几个方面能力,即将成为数据分析师的亲们,你们准备好了吗?
数据分析精选,专注大数据行业观察和研究!
2年前根据阿里笔试题整理的一篇文章
(C) 2015 今日头条
违法和不良信息举报电话:010-
公司名称:北京字节跳动科技有限公司/北京字节跳动网络技术有限公司读了四年文科 他却去阿里巴巴当数据分析师
 来源: 
昨日,工商大学,大四学生李湘阳利用空闲时间在图书室浏览书籍。 重庆晨报记者 许恢毅 摄
  当我们在淘宝上完成购买东西时,窗口中会出现“购买该商品的用户还购买过……”“你可能对……感兴趣”的链接,这些就是网站数据分析师通过网上购物数据分析后,向客户进行精准的商品推销。据招聘市场反映的信息显示,“数据分析师”目前很抢手,月薪2万;同时要求也高,最基本的要求是“重点大学数学、统计、计算机软件、管理信息系统、运筹学等相关专业本科或以上学历。”
  但最近大四学生李湘阳,作为一个市场营销专业学生竟然应聘“数据分析师”成功,这让身边的老师和同学震惊又好奇。  笔试要诀  发挥文科生擅长论述的强项
  昨日,重庆晨报记者在工商大学校园里见到了,来自湖北恩施的腼腆小伙李湘阳。他告诉记者,9月初,他在“应届生求职网”上看到全国最大网购平台阿里巴巴的校园招聘信息,“数据分析师”这个岗位让他眼前一亮。在招聘信息中称,该岗位偏重于数学、统计、运筹学等相关专业,招聘要求还明确写出“重点大学数学、统计、计算机软件、管理信息系统、运筹学等相关专业本科或以上学历。”
  李湘阳大学学习的专业是市场营销。虽然专业不对口,李湘阳还是大胆地决定试一下。几天后,他得到了通知到湖北参加笔试。那场笔试偏重于SAS、SPSS等统计分析软件。
  李湘阳说,这一场笔试下来,心里没了底。“笔试后,就感觉很不好,基础知识方面肯定没有别人掌握牢。”但李湘阳在笔试时没有让任何一道题留下空白,“可能概念我记得不清楚,但还是要发挥文科生的强项,把自己的理解,相关的知识要点统统写上去。”  面试技巧  展示社会实践中一手体验
  李湘阳没想到竟然顺利过了笔试关,但接下来的统计学知识问答又是一个雷区。“面试时,老师问了一些统计学方面的具体知识点,这类知识我并不精通,不是我的强项。但有关统计学方面的社会实践,我倒是有过一些尝试。”于是李湘阳在面试中大谈特谈,自己曾经对一个论坛客户群的数据分析案例。第一次面试,李湘阳的自我展示占去了很大一部分时间。
  李湘阳的理论与实际的接合展示让他顺利地闯入第二场面试。因为李湘阳平时就爱思考一些统计学应用方面的问题。当考官让他谈一谈,他很容易就打开话匣子。最终李湘阳成功拿下了阿里巴巴网购平台数据分析师的岗位。不久就与该公司签订了第三方协议。
  李湘阳总结自己这次应聘成功的经验:“如果专业知识你比不过别人,应聘时你要充分展示出自己的强项。”  企业观点  自学成才的学生应加分
  据了解,今年全国最大网购平台阿里巴巴校园招聘从9月初开始在北京、上海、天津、广州、武汉等20个城市陆续拉开。
  阿里巴巴公司是很多毕业生的“梦想单位”。阿里巴巴公关部张启告诉重庆晨报记者,该公司的“数据分析师”是一个很抢手的岗位,“待遇相当不错,对大学生很有吸引力”。因此该岗位的竞争较为激烈。“今年阿里校园招聘有1000个名额,其中数据分析师岗位只有20人左右。”
  “李湘阳这样的学生,我们之前也没想到他能在竞争中脱颖而出,”张启表示就阿里的企业文化来说,他们很欢迎这类自学的同学,“通过自学能达到我们认可的水平,很不错,这样的学生应该在考试官眼里有加分吧!”  幕后功课  知识面的拓宽助其成功
  文科生李湘阳逆袭成功应聘理科专业的岗位看似偶然,实则与他平时有心拓宽知识面,热衷社会实践有密切的关系。
  李湘阳所学的市场营销专业曾经开过一学期的统计学课程。这让他对统计学产生了浓厚的兴趣。如今,李湘阳为自学统计学已经写完4个笔记本。《数据挖掘概念与技术》、《基于的数据挖掘》这是最近常出现在李湘阳手中的两本课外书。
  重庆工商大学电子商务研究所所长詹川老师说:“严格地说,李湘阳不是我教的学生。可他常来听我讲课。关于电子商务、统计学、计算机语言方面的知识,他都感兴趣。他不仅上课来听,还会在课下跟我交流。”
  重庆晨报记者 黄晔  进潜力企业比进名企  更能获得丰富的收获
  昨天,重庆2014届普通高校毕业生中小型企业专场双选会在陈家坪展览中心举行。相比前一天的国有大中型企业的招聘,昨天现场招聘的中小型企业,对成绩、院校等门槛都设置得比较低。
  重庆朴川科技有限公司的招聘代表杨小姐告诉我们,在面试大学生过程中,她感觉很多学生还不够清楚自己到底想做什么。
  她说,在招聘中,他们并不太看重学生的成绩或者是学校,而是希望能从沟通中感受到学生自己是有想法的,并且对个人的定位清晰。最看重的还是学生的个人能力。
  相比大型企业与国企,她认为民营企业也有自己的优势。“我们的企业文化气氛更活跃,管理更自由,工作环境比较适合年轻人。”而在薪资方面,“国企与大型企业虽然工作稳定,但人事比较固定,升迁不容易。而我们这样的公司更支持学生敢想敢做,发挥每一个人的潜力。”
  某知识产权代理有限公司的招聘代表说,相比大型企业与国企,在民营企业实习的程序会更加简单,而公司也十分注重内部人员的团体合作,方便大学生尽快融入公司环境,薪资待遇也不低。
  国家高级职业指导师林浩说,有些学生感觉就业难的原因体现在放不下身段。对刚毕业的大学生来说,选择一个好的行业,选择一个有发展潜力的中小企业、选择一位善于用人的老板,比直接进入名企更可取。[责任编辑:赵徐州]
一周图片排行榜
光明网版权所有当前位置: >
从阿里巴巴笔试试题看数据分析师的职业要求
08:16 来源:
以下试题是来自阿里巴巴2011年招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。
一、异常值是指什么?请列举1种识别连续型变量异常值的方法?
异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。
Grubbs& test(是以Frank E. Grubbs命名的),又叫maximum normed residual test,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。
未知总体标准差&,在五种检验法中,优劣次序为:t检验法、格拉布斯检验法、峰度检验法、狄克逊检验法、偏度检验法。
点评:考察的内容是统计学基础功底。
二、什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。
聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。 聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy)。聚类与分类的不同在于,聚类所要求划分的类是未知的。
聚类分析计算方法主要有: 层次的方法(hierarchical method)、划分方法(partitioning method)、基于密度的方法(density-based method)、基于网格的方法(grid-based method)、基于模型的方法(model-based method)等。其中,前两种算法是利用统计学定义的距离进行度量。
k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
其流程如下:
(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;
(2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
(3)重新计算每个(有变化)聚类的均值(中心对象);
(4)循环(2)、(3)直到每个聚类不再发生变化为止(标准测量函数收敛)。
优点:本算法确定的K 个划分到达平方误差最小。当聚类是密集的,且类与类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为 O(NKt),其中N是数据对象的数目,t是迭代的次数。一般来说,K&&N,t&&N 。
缺点:1. K 是事先给定的,但非常难以选定;2. 初始聚类中心的选择对聚类结果有较大的影响。
点评:考察的内容是常用数据分析方法,做数据分析一定要理解数据分析算法、应用场景、使用过程、以及优缺点。
三、根据要求写出SQL
表A结构如下:
Member_ID(用户的ID,字符型)
Log_time(用户访问页面时间,日期型(只有一天的数据))
URL(访问的页面地址,字符型)
要求:提取出每个用户访问的第一个URL(按时间最早),形成一个新表(新表名为B,表结构和表A一致)
createtable B asselectMember_ID, min(Log_time), URL from Agroup byMember_ID ;
点评:SQL语句,简单的数据获取能力,包括表查询、关联、汇总、函数等。
另外,这个答案其实是不对的,实现有很多方法,任由大家去发挥吧。
四、销售数据分析
以下是一家B2C电子商务网站的一周销售数据,该网站主要用户群是办公室女性,销售额主要集中在5种产品上,如果你是这家公司的分析师,
a) 从数据中,你看到了什么问题?你觉得背后的原因是什么?
b) 如果你的老板要求你提出一个运营改进计划,你会怎么做?
表如下:一组每天某网站的销售数据
a) 从这一周的数据可以看出,周末的销售额明显偏低。这其中的原因,可以从两个角度来看:站在消费者的角度,周末可能不用上班,因而也没有购买该产品的欲望;站在产品的角度来看,该产品不能在周末的时候引起消费者足够的注意力。
b) 针对该问题背后的两方面原因,我的运营改进计划也分两方面:一是,针对消费者周末没有购买欲望的心理,进行引导提醒消费者周末就应该准备好该产品;二是,通过该产品的一些类似于打折促销等活动来提升该产品在周末的人气和购买力。
点评:数据解读能力,获取数据是基本功,仅仅有数据获取能力是不够的,其次是对数据的解读能力。
五、用户调研
某公司针对A、B、C三类客户,提出了一种统一的改进计划,用于提升客户的周消费次数,需要你来制定一个事前试验方案,来支持决策,请你思考下列问题:
a) 试验需要为决策提供什么样的信息?
c) 按照上述目的,请写出你的数据抽样方法、需要采集的数据指标项,以及你选择的统计方法。
a) 试验要能证明该改进计划能显著提升A、B、C三类客户的周消费次数。
b) 根据三类客户的数量,采用分层比例抽样;
需要采集的数据指标项有:客户类别,改进计划前周消费次数,改进计划后周消费次数;
选用统计方法为:分别针对A、B、C三类客户,进行改进前和后的周消费次数的,两独立样本T-检验(two-sample t-test)。
点评:业务理解能力和数据分析思路,这是数据分析的核心竞争力。
综上所述:一个合格的数据分析应该具备统计学基础知识、数据分析方法、数据获取、数据解读和业务理解、数据分析思想几个方面能力,即将成为数据分析师的亲们,你们准备好了吗?
【作者简介】
郑来轶,中国统计网创始人,江湖人称&数据哥&,微博/微信/今日头条大V帐号@数据分析精选,国内某知名互联网公司无线数据分析专家,前中国移动阅读基地资深数据分析师、每日轩昂BI总监,多年来深耕移动互联网行业的数据体系建设与数据分析应用。
(责任编辑:中国统计网)
本文链接:
版权声明:本站内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。}

我要回帖

更多关于 阿里巴巴 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信