一份优秀的数据分析报告应该这样写

2020-03-03    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
在每次的数据分析工作中,将分析过程与结果写成一份通俗易懂的报告是工作的最后一步,并且对有的人来说,这也是最难的一步。

一份技术报告的目的是传递信息。然而,技术信息是很难让人理解的,因为它不仅复杂,而且无法让人轻易的了解。将数学焦虑等融入到任何事情都可以被统计数据证实这一流行观念中,你就可以明白为什么做数据分析报告是一份挑战。如果你对数据分析报告撰写流程很陌生的话,可以考虑学习下面的内容。

一、明确内容

从你最了解的部分着手开始。在写一份数据分析报告时,你最了解的部分应该是你分析的统计数据、绘制的图形以及建立的模型。

 

 

你应该有能力去描述你是如何呈现总体特征的,如何生成这些数据的或者是提供了这些数据的源头,在做探索性的分析时你发现了数据存在哪些问题,你是如何处理这些数据的,对异常数据你做了怎样的处理,应用了怎样的变换方法,对于缺失的和重复的数据你做了什么,你是如何处理违反假设的情况和不显著的结果的。

 

 

接下来,你需要决定什么是重要的内容,以及,哪些内容对报告阅读者来说是重要的。因为除非你写的报告是面向你的大学教授或者是同龄的数据分析专业人员,否则的话,你可以十分确定的认为没有人想听你讲你是如何解决各类问题的,你用了什么技巧,或者你在分析数据的时候多么努力。没有人在意你的结果是来自Excel表格还是一段自己用R语言编写的程序。

一旦整理出了你需要的信息,就为这份报告写一个概述,这样你就会知道你都要写些什么内容。这样做可以帮助你不偏离主线。你的总结或许可以选择以下三种形式中的一种:

1.执行总结

执行总结面对的是决策者或者那些没有足够的时间或耐心去阅读超过400字的文章的人。把你的概述缩减到一页以内,不要使用任何术语,只提供那些决策者需要的,可以帮助他采取适当行动的结果信息(也就是:你想要传达的信息)。

2.总括

总括面对的是大部分读者,无论他们是否会阅读这份报告。一篇总括是报告内容的删减版,并且关注点在你想要传达的信息上。总括的内容也不应超过几页纸。

3.摘要

摘要面对的是同专业的人以及其他可以看懂数据分析的人。一篇摘要的内容通常是一页纸或者少于一页纸,并且总结了你所做的所有的重要的工作,从定义总体到评估效应量。摘要通常被用在学术论文写作中。一旦你知道了你的读者是谁,你就可以重新撰写概述以便抓住读者的注意力。

二、了解读者

每篇教你自学技术写作的文章都会首先告诉读者要考虑他们撰写报告的观众。即使如此,或许很少有作者真的这样去做。

在统计分析中,你通常会先开始考虑你想要做出推断的那些总体所具有的特征。与之相似的,当你开始撰写一篇分析报告时,你通常会先开始考虑你想要进行交流的那些读者所具有的特征。

 

 

你必须考虑那些即将阅读你的报告的读者的这些特征:是谁(who)、是什么(what)、为什么(why)、在哪里(where)、什么时间(when),以及如何做(how)。这里有一些你需要考虑的和读者有关的内容。

1.Who

读者通常是通过他针对报告所扮演的角色来定义的。一些读者会用这份报告来做决策。一些读者会通过这份报告学习新的信息。其他的会根据自己已经知道的情况来评论这份报告。因此,一份统计报告的读者通常会被定义为:决策人员、股东(利益相关者)、评论家或者对报告感兴趣的个人。

有的报告只会被一个人阅读,但是大部分报告会有很多读者。各行各业的人都有可能阅读你的报告。因此,会有初级的、中级的、甚至更多不同级别的读者参与阅读。这是有问题的,因为你无法取悦每个人。因此,要通过定位你的读者,首先关注接收你的信息的最重要的读者,其次关注读者中群体最大的那一部分。

2.What

一旦知道你的报告的目标受众是哪些人,你就应当尝试弄明白他们的特征。或许对于一个技术报告作者来说,最重要的特征是读者对报告的主题和报告中描述的统计技术的了解程度。你可能没办法改变读者对报告主题的知识储备,但是你可以通过调整呈现统计信息的方式帮助读者理解内容。例如,一个数据分析师可能遇到的读者类型包括:

(1)数学恐惧者

惧怕数字但是或许愿意了解概念。不要使用任何统计学术语。不要呈现公式。尽可能少的使用数字。例如,用“大约一半”代替任何百分比在50%左右的数字。那些额外的精度对数学恐惧者来说并不重要。

 

 

(2)游客

懂一些知识并且有兴趣。稳当一点。只是用你定义明确的基本术语。可以使用数字,只不过在一张表格里不要用得太多。将数值化为证书以保证你没有暗示错误的精确度。坚持使用饼图、柱状图,或许偶尔使用一下散点图,不要使用比这些更复杂的工具。不要使用任何公式。

(3)卖弄者

懂得比自己认为的少并且想要展示。只要你把你表达的意思定义出来,就可以使用术语。甚至一个喜欢卖弄的人也可能学到些东西。同样的,使用数字、统计图表,以及公式也是可以的,只要你能清晰的解释它们的含义。这类人如果没有指导的话可能会得出不正确的结论。

读者的特征为报告的长度、撰写的语调和风格提供了指导。

3.Why

那些读者很可能是对你的报告非常感兴趣呢还是仅仅是对它感到好奇(如果他们没有兴趣,那么他们就不算是读者)?对自己坦诚一点。为什么别人要有兴趣阅读你的报告呢?你将谁定义成为你的目标读者呢?他们会用你的发现做些什么呢?他们会了解到有用信息吗?他们将会做出一个决策呢还是会采取一个行动呢?这对他们来说是一个很重要的东西呢还是他们必须关注的?

4.Where

这份报告的受众是一个数量、范围有限的群体呢,例如为一个组织而进行的分析,还是任何人都有可能阅读它呢?这份报告的目标是组织中的上层人员呢还是普通人员(也就是说是自下而上还是自上而下)?关于这份报告有没有安全性或保密性的顾虑呢,无论是在个体还是组织层面上?

 

 

5.When

读者什么时候需要看到你的报告?在公布报告以前谁必须复查这份报告以及复查需要多久?截稿日期是否无法变动?你还剩多久的时间来撰写这份报告?是否有足够的时间让你想清楚你需要写什么?是不是有时间让你进行必要的额外的分析以填补报告大纲中的空白?当复查你的报告的时间是你撰写它所花费的时间的两倍的时候,你是否会因此生气呢?

这里有一些你应当牢记于心的建议。绝对,绝对,绝对不要将你没有写完、没有编辑好的报告的草稿提交上去应付复查。我告诉自己我写的每份报告都要遵守这条规则。不幸的是,像大多数人一样,我不听自己说的话。

最后,你要考虑如何呈现这份报告才能使读者从中得到最多的信息。

 

 

组装:你写的报告将被如何组装起来(也就是说:组装成一件可以被分销的产品)?它将是一个简短的书信式报告,一份综合报告,一篇博客或者是一篇网络文章,一篇专业的期刊文章,一份权威报告,还是你的报告会构成其他文件的组成部分呢?

形式:你的这份报告将以电子文件的形式还是纸质文件的形式被分发呢?如果它是以电子形式被分发的话,它能否在互联网上取得呢?它能否被编辑呢?它是否会以什么形式限制获取呢,例如密码?

外观:这份报告是只能以白纸黑字的形式来呈现呢还是可以使用彩色内容?图表与文字的比重是多少?这份报告是很传统的呢还是会很华丽,就像营销手册一样?报告里会有11×17英寸大的折叠页呢还是会有超大的像地图一样的插入页呢?

三、明确方法

从高中起你就被告知行文开始前要拟一个大纲,写分析报告也是这样。然而有许多可能的提纲你可以根据您的受众特点和期望来选择。你首先要决定的是报告最终的建议是什么。

您的报告是像政府部门的行政简报(不要混淆法律简报),信函报告,总结报告,综合报告,互联网文章或博客,专业期刊文章或白皮书等等。每一种报告都有自己的受众类型,内容和风格。

 

 

写报告就像是去旅行。信息就是你想要传递给最终目的地——观众的资产。报告的建议是持有信息的车辆。现在,您需要一张地图来了解如何到达目的地——那就是提供。

就像地图上有不只一条可能的路线,这里也有几种可能的大纲策略可以用来编写报告。

1. 跟随数据的方法

如果您具有非常结构化的数据分析,则可以按顺序报告每个数据片段。调查往往属于这一类。这种方法使编写报告变得容易,因为在按照原始顺序重新组合之前,可以将报告各个部分分开并分发给其他人写。缺点是这种方法通常没有给出综合的结果。读者只能自己思考这一切意味着什么。

2. 讲故事的方法

这种方法认为阅读统计报告不应该像修剪草坪一样枯燥。相反,你应该引导读者的好奇心,就像解开神秘的谋杀案之谜,你一点点地提供线索,但当把所有的线索放在一起时你给出的结论又十分合理。这与上述的“跟随数据的方法”几乎相反。

 

 

在讲故事的方法中,报告从最简单的数据分析开始,逐渐地过渡到精彩的高潮 – 分析的结论。与结论不相关的分析将被省略。通常报告的过程有一些弧线,譬如先前介绍的分析结果在后面的章节中被重申,以显示它是如何支撑整个故事情节。

图表在这种方法中非常重要。提纲更像是故事概述。对于每个文本页面,可能图表占据了一大半。讲故事的报告通常比其他方法的报告需要更长的时间,但是如果你的读者有耐心阅读完,那么结果将是会更深刻的(也就是说,不要试图把故事讲给路人听)。

所以,确保你有一个合适的提纲,但不要让它限制你。在构建提纲时,尽量平衡各部分,使读者有周期性的休息。但是,在每个部分中,小节的长度应与其重要性相对应。

文章来源于大数据分析和人工智能

标签: 数据分析 数据分析报告

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:机器学习研究者的养成指南,吴恩达建议这么读论文

下一篇:新冠病毒强传染性谜底揭晓:是SARS的10-20倍