数据分析与数据科学的未来

2020-04-20    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用


 

一、分析与数据科学的未来

通过对IADSS联合创始人Usama Fayyad博士在2019年波士顿ODSC的主题演讲后的采访,了解当前和未来的数据科学问题以及可能的解决方案。

数据技术对企业期望有什么影响?

Usama Fayyad博士表示:我们所看到的最大的变化是一股巨大的数字化浪潮。我认为,这是我最关心的,在很多数字化的过程中,或者说所谓的数字转型的努力中,人们开始把很多手工工作数字化,使它们更准确,减少重复,无趣,更快。所有那些好东西。但数据最终成为了事后诸葛亮。结果是他们创造了我们所说的“即时技术债务”因为你现在已经建立了数字化的机制而你忘记了诸如“我如何获取正确的数据?”“我如何表示这些数据?”“我如何存储这些数据?”“我如何在正确的时间检索它?”和“什么级别的数据?”人类通常会在图和摘要的层次上消费数据,而像机器学习算法这样的机器需要每一个小事务的细节和它周围的东西。

这对于人类来说是完全不可消耗的但是对于学习算法来说是必要的。所以,对我来说,现在的情况是人们现在反思说,好吧,如果我真的做适当的数字化,我想确保我放在正确的大脑和正确的情报来设计,这样当我获取正确的数据、管理数据正确,最重要的是,使算法非常挑剔的机器学习算法,只需要特定格式的数据,完全崩溃,如果不是这个格式,能够消费它。这就是我认为现在正在发生的变化,变得更好,尤其是在大数据方面,这使得处理不同类型的数据变得更容易。

 

 

原文:https://www.kdnuggets.com/2019/09/future-analytics-data-science.html

二、使用DC / OS加速企业中的数据科学

遵循此使用Tensorflow的分步教程,将DC / OS数据科学引擎设置为PaaS,以启用分布式多节点,多GPU模型训练。

 

 

1、为什么选择DC / OS数据科学引擎?

2、AWS上的数据科学引擎

3、自动化DC / OS数据科学引擎设置

原文:https://www.kdnuggets.com/2019/10/dc-os-accelerate-data-science-enterprise.html

三、最新SQL数据分析指南

据计算,到2020年,地球上每秒钟将为每个人生成1.7 MB的数据,数据将成为我们数字时代的新石油。这催生了许多数据管理和分析数据等相关专业。其中许多职业要求是精通数据库中的数据管理。本文则是目前流行的SQL数据分析指南。

原文:https://www.kdnuggets.com/2019/10/last-sql-guide-data-analysis-ever-need.html

标签: 数据分析 数据 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:微软数据可视化工具SandDance已经开源

下一篇:AI人才稀缺:全面解读数据科学家成长的4个阶段