5个要点,让你拥有数据分析思维
时间:2019-11-14 19:38:34 热度:37.1℃ 作者:网络
本文分析了如何拥有数据分析思维的5个要点:说事实,而不是观点、用客观标准代替主观判断、不预设立场、演绎而不是归纳、找出背后的逻辑。
引言
数据分析师究竟要掌握哪些技能?
大部分的数据分析教学都会教你excel,Python,sql,机器学习,还有一些分析方法比如对比分析、漏斗分析、留存分析等等技能。
但是,很多人掌握了这么多工具和技能,依然做不好数据分析。面对具体的业务问题,我们还是容易两眼一抹黑。
就像我们大部分人学习英语,都会学习单词、语法、音标等等,但是一开口就跪了。而英语母语的人就算不懂语法是什么,却能如同抬手睁眼一样自然地用英语表达。
这其中的区别,便是因为英语母语的人拥有“英语思维”。
想要做好数据分析也一样,单单会工具和技能是不够的,还必须拥有数据分析思维。数据思维决定了你如何思考问题,如何搭配这些分析方法,如何得出结论,如何确定问题。
那么究竟什么是分析思维呢?我认为有以下几个方面。
1. 说事实,而不是观点
数据分析师第一个要训练的思维方式便是:只说事实,不说观点。
事实和观点这两个名词看起来区别很大。但实际上在生活中我们经常会将两者混淆。
比如说你的同事告诉你:最近的转化率大幅下降。
这句话到底是事实还是观点呢?
很显然这句话是观点。究竟下降多少算大幅下降?也许你认为的大幅下降在我看来变化并不大。
那么如果他说:转化率下降了。这句话是事实还是观点呢?
这句话看起来已经非常像事实了,但是实际上它依然属于观点。
有这样一种情况,转化率在短期内它看起来是下降的,但是你站在宏观的层面上,以月为单位甚至以年为单位,它是它是上涨的,那么你究竟说他是上涨还是下跌呢?
那么什么是事实?
周一到周三的转化率持续下降,周三相比周一已经下跌了5%。这句话就是事实,这句话不同的人都能理解,不会出现歧义。
只有分清楚观点和事实才有继续分析的可能性。
因为观点的沟通会出现误差,而事实则不会。如果我们用观点进行沟通,自然会出现大量的误解。
如果连背景都没有理解清楚,后续的分析也就无从谈起。
2. 用客观标准代替主观判断
但是单纯只有数据,对业务问题的分析没有什么帮助。毕竟我们得知道这个数据到底带来了哪些业务信息。所以最后事实还是要归纳成“观点”。
不过如果我们用主观判断数据的好坏,那么还是回到了原来的老路上去。
那么周三相比周一转化率下跌了5%,这个数据到底表现如何呢?
想要解读出观点,我们需要先找到一个标准。
标准怎么找?
- 可以是老板定的标准,看数据是否符合老板心中的标准。虽然这也是拍脑袋,不过老板毕竟是老板,他们心中有些战略构想是建立在某些条件满足的基础上的。所以没什么说的,如果老板不满意,那这数据肯定是有问题的。
- 可以看行业和竞品的平均标准,看数据下降是否是行业的普遍现象。
- 看企业过去的平均水平,可以在历史数据中找到类似场景下的数据情况,和自己的过去对比。
然后我们通过数据和这些标准进行对比,得出一个观点。比如我们可以分析每周的情况,看历史上是否存在这一的趋势,平均下跌是多少?如果历史上每周三都会下跌,平均下跌7%,那么我们就可以认为目前数据比较正常,没有问题。
这样得出的结论全都是客观的,如果你不找标准,而用主观判断数据的好坏,那么不同部门的人会沟(shuai)通(guo)很久。
3. 不预设立场
人们总是习惯于通过自己的现存经验和知识去判断未知事物。
这本身是进化带来的优势,它能让人在信息不完备的情况下迅速做出决断并付诸实施。
这种预设立场的思维在原始人的时代很有价值,其优势在于:
- 第一,不浪费宝贵的能量,大脑是能量消耗大户;
- 第二,快速决断,避免因为低效决断而错失机会,这一点在避免伤害时尤为重要。
在数据分析的场景下,我们需要尽可能地找出真实原因。此时这种预设立场的决断方式会造成许多错误,因为现有经验和知识在应对未知事物时是不足的,是有偏差的。
而且不同岗位的人还会存在“屁股决定脑袋”的现象。
如果出现了业务问题,关联的业务方往往预设一个立场:这事没有看起来那么糟,或者这事和我没关系。
比如转化率下降了,业务方的反应往往是这个数据下降肯定跟自己无关。
自己的运营活动明明做的很成功,转化率下降一定是行业因素、用户质量等等其他因素导致的。于是为了证明这个观点,他们顺着这个预设的前提,找到一些相关的证据来解释转化率下降的现实。
实际上,想要证明一个观点,只要你肯去找,不管观点多么荒谬,总能找到支持你的理由。
不仅辛普森悖论这种统计学的把戏可以得出完全相反的结论,即使最简单的“真话不全说”的方法,也能达到这种目的。
比如,我说两个比较荒诞的列子:
1. 把正例说成反例
我想要证明一种物质是有害的,我列举出以下论点:
- 它是酸雨的主要成分;
- 对泥土流失有促进作用;
- 过多的摄取可能导致各种不适;
- 皮肤与其固体形式长时间的接触会导致严重的组织损伤;
- 吸入该物质容易引发窒息;
- 处在气体状态时,它能引起严重灼伤;
- 在不可救治的癌症病人肿瘤中已经发现该物质;
怎么样,你会不会觉得这是一种非常危险的物质,实际上上面描述的是“水”。
2. 想要把反例说成正例也没问题
比如中国男足,想要把男足描述成世界强队行不行?
当然行。
- 哥斯达黎加是世界杯史上为数不多能够战胜中国队的国家
- 即使是巴西队这样的世界强队也仅战胜过中国队一次
- 自2002年韩日世界杯后,中国队在世界杯正赛上不败纪录已经延续12年
- 纵观漫长的世界杯史,中国队也仅输过三次
- 中国队从未在世界杯点球大战中失利过
- 中国队在领先的情况下从未丢过球
你看,只要你想证明一件事,总能找出一些证据。
所以,预设立场再去找证据是一件相当不靠谱的事。
数据分析部门一般独立于业务部门之外,这样可以确保数据分析师没有业绩压力,分析具有独立性。
因为数据分析的独立性,所以最终问题究竟是在产品上、运营上或者市场上,数据分析师不会有明显的偏向,只认客观数据。
同样是转化率下降了,数据分析师的职责就是找出下降的真实原因。他们要梳理出和转化相关联的各个环节,获取数据,根据数据推演出合理的结论。
有些资深的数据分析师有一定的业务敏感度,他们会提出一些可能性很大的假设。比如他们猜测可能是运营出现了问题,那么就需要找到一些数据来验证这个假设。
但是假设验证和预设立场不同。
预设立场,是要找到证据来证明猜想,一个数据不行,那就换另一个数据。直到能证明这个观点为止。
而验证假设,则是事先规划验证这个假设需要的数据。如果数据最终不符合假设,那么就抛弃这个假设。
好的数据分析师,能够根据客观数据,随时抛弃旧的假设,并建立新的假设。
抛弃固有的思维定式,这是非常反人性的,这也是为什么说数据分析需要专业训练的原因。
4. 演绎而不是归纳
逻辑思维方法分为归纳法和演绎法。
归纳法是从特殊到一般的推理,是从结果找原因的方法。
也就是说,通过观察很多个别事物的特殊性,然后概括出同类事物的特征。
但是我们一般不可能观察到这个事物的所有样本。所以归纳法得出的结论是不确定正确性的。
你有没有听过这个故事:
在一个火鸡饲养场里,一只火鸡发现,不管是艳阳高照还是狂风暴雨,不管是天热还是天冷,不管是星期三和星期四,每一天上午的9点钟,主人都会准时出现,并给它喂食。
于是,它得出了一个惊天大定律:“主人总是在上午9点钟给我喂食。”
时间来到圣诞节的前一天,上午9点,主人又一次准时出现,但是这一次,主人带来的并不是食物,而是把它变成了食物….
这个是英国哲学家伯特兰·罗素提出的一个问题,被称为「罗素的火鸡」,用来讽刺那些归纳主义通过有限的观察,得出自以为正确的结论。
大部分人思考问题,会优先使用归纳法。因为这是人类认识世界的方法,这是人性决定的。
比如一月到三月的成交金额连续上升,初级分析师往往会说:成交金额呈现上升的趋势。
这句话的潜台词是,预计交易金额在四月份也会上升。
这是典型的归纳法思维:因为过去是这样的,所以未来应该也会继续这样。这和那只火鸡的思维其实也没有什么本质的差别。而且这和没分析一样,你把数据丢给业务方,他们也能看出目前呈现上涨的趋势。
如果想要做好数据分析,就不能滥用归纳法,这点依然很反人性。
那我们用演绎法,如何思考这个问题的呢?
演绎法是从一般到特殊的推理,是从原因找结果的方法。
要想预测四月份的成交金额会如何,首先需要分析前三个月的成交金额为什么会上涨?当时的背景是什么?上涨需要哪些条件?四月份的这些条件是否依然存在?如果维持成交金额上涨的条件不变,我们才能说四月份会继续延续这种上涨的势头。
经过演绎法推理的结论才是合理的,而且我们通过深挖找出了内部的原因,这才是业务人员想要知道的。
数据分析的价值就体现在这。
5. 找出背后的逻辑
数据分析师是需要大量的逻辑思维训练,但我们自己做好还不够,我们的工作必需和业务方沟通,帮助他们解决实际的业务问题。
但是很多业务人员没有考虑清楚就跑来沟通,他们的需求可能充满了逻辑问题,这时我们就需要帮对方理清思路,找出对方表述背后的逻辑。
数据分析师往往会听到业务方这样问:本周的转化率相比上周已经下降了5%,怎么办?
这句话听起来感觉没什么问题,实际上逻辑并不是特别严密。
首先,这句话的前半部分很好地表达了事实,值得表扬。如果前半句是一个观点,我们还要先找到事实。
但是这句话的后半句有问题,后半句的“怎么办”,放在这个语境中,潜台词其实是这样的:
- 本周转化率相比上周下降了5%
- 这是个不好的情况
- 需要解决这个问题
- 怎么办?
相比最开始的表述,我们分析出这句话中间出现了两个衍生的问题。
问题1:转化率下降5%真的是不好的情况吗?
这就涉及到了标准了,之前提到了我们要找到一个客观标准,通过标准解决出数据的业务含义。
因此我们首先要协助业务方找到一个标准。
问题2:如果数据表现真的不好,那么这是现在急需解决的问题吗?
这个问题的答案也是不一定。
商业世界要解决的问题太多,在同一时刻,永远存在着各种各样的问题。
而企业的资源是有限的,不可能同时解决所有的问题。问题的解决必然有轻重缓急之分。
那么凭什么要先解决转化率的问题,而不是解决引流的问题、留存的问题、活跃度的问题?
数据分析师必须了解企业当前的战略方向,把有限的资源投入到更重要的方向上。
如果上面这两个隐藏的问题不想清楚,就开始分析怎么办,那么这类分析师的工作往往会费力不讨好,做很多低绩效的工作。
技艺理性需要长时间的练习
说到这儿你有没有觉得,分析师的工作和法律工作者非常的像。
法官只看事实,一切都讲证据。
法官需要标准,标准就是法律文本。即使被告的行为看起来多么地不符合社会道德,只要法律没有规定不允许,那么法官就不能认为有罪。
法官不预设立场,法律的原则是无罪推断,任何人在未经证实和判决有罪之前,都视其无罪。
法官要用演绎法推断。法官的判决讲究证据链完整。证据链中的链字,就有一环扣一环的含义在其中。很明显就是需要用演绎法来进行分析。
最后律师要理清当事人的逻辑,大部分人是说不清一件事的,当事人在律师的引导下把事情逐渐还原。
法律史上有一个非常著名的故事,可以为我们带来一些启发。
在1608年,英国国王詹姆斯召见了法官,提出一项要求:既然法官只是国王的代理人,国王自然有权直接裁决诉讼案。
但大法官柯克反对说:国王本人不能裁决任何案件。
詹姆斯一世说:“法律以理性为基础,除了法官之外,我和其他人一样具有理性,为什么就不可以裁决诉讼案?”
柯克大法官很聪明,先夸了国王一番:“确实,上帝赋予了陛下卓越的技巧和高超的天赋;”
接着,他又说:
“但陛下对于英格兰本土的法律并没有研究,而涉及陛下之臣民的生命或遗产、或货物、或财富的案件,不应当由自然的理性,而应当依据技艺理性和法律的判断来决定,而法律是一门需要长时间地学习和历练的技艺,只有在此之后,一个人才能对它有所把握。”
这个故事中非常重要的观点就是“自然理性”不等同于“技艺理性”,而技艺理性是需要长时间的专业练习的。数据分析也一样。
总结
很多人想要数据分析速成。他们认为“自然理性”加上“分析工具和方法”就能做好数据分析。分析工具、分析方法等技能确实可以速成,但是数据分析的能力不是自然理性能够驾驭的。想要做一个好的数据分析师,必须拥有数据分析的思维,这是一种“技艺理性”,有一点反人性,必须花大量的时间训练才能掌握。
如果你学会了很多数据分析的工具和技巧,依然做不好数据分析。建议尝试练习本文提到的思维。要点很简单,坚持,坚持,坚持。
#专栏作家#
三元方差,公众号:三元方差(sanyuanfangcha),人人都是产品经理专栏作家。专注用数据驱动业务增长,擅长数据分析、用户增长。喜欢阅读、思考和创作。
题图来自Unsplash,基于CC0协议