数据科学、机器学习和人工智能

2020-04-20    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

By Paramita (Guha) Ghosh  来源:DATAVERSITY

在数据经济中,数据为王。今天,任何企业——无论大小——都依靠它的数据资产而蓬勃发展。最近,将数据驱动的见解作为一种服务提供给外部世界的趋势,为企业开辟了一条有利可图的收入渠道。云计算和托管分析将数据即服务(data-as-a-service)带到普通企业用户的桌面上,这在几年前还是闻所未闻的。
 

正如Gartner不久前预测的那样,随着全球商业环境迅速向“万物数字化”发展,人工智能(AI)、机器学习(ML)和深度学习(DL)将在重塑全球商业方面扮演与数据科学同样重要的角色。

数据管理与数据策略:业务成功的框架讨论了如何围绕企业数据资产构建业务模型和收入流。作者还提到,对于企业来说,理解数据管理和数据策略之间的巨大差异是至关重要的,因为后者通过一个精心指导的计划、计划、策略和实践框架来促进前者。

目前,所有开发良好的业务模型都包含一个定义好的数据策略,用于指导整个组织中的数据管理活动。在定义的数据策略框架中,数据管理远远超出了基本的数据库管理任务,并为数据收集方法、数据治理、数据访问和控制、数据隐私和安全性等创建了蓝图。

在这样一个以数据为中心的业务环境中,在全球it市场上期待更新更好的数据技术是正常的,这可能在不久的将来取代人类数据科学家和业务分析师。

在为高管讲解人工智能和机器学习的播客中,麦肯锡高级合伙人塔米姆•萨利赫(Tamim Saleh)讨论了先进的数据技术,尤其是人工智能和相关科学,并解释了如何将它们最好地应用于实际的商业环境。根据Saleh的说法,人类科学家开始通过输入数据与机器进行交互,这个过程通常是缓慢而错误的。在下一个阶段,当图像或语音分析与ML相结合时,机器将采用更多的人的特性,并开始表现得像一个代理。

从数据科学到人工智能& ML:技术转型

Newgenapps的一篇博客文章称,大数据的出现帮助数据科学项目迅速扩大规模。这些最受欢迎的流行语经常出现在科技新闻网站上,它们结合了数学原理、统计学、计算机科学、数据工程、数据库技术等等。数据科学可以被看作是数据管理的技术领域,它使用人工智能和相关领域来解释历史数据,识别当前数据中的模式,并对未来进行预测。从这个意义上说,人工智能和人工智能的子集(如ML和DL)帮助数据科学家从数据库存中获得见解,从而积累竞争情报。

人工智能可以被定义为一个具有许多子学科的广泛科学领域——所有这些子学科都协同工作,以实现业务流程的自动化,并使机器的行为更像人类。像ML和DL这样的领域,虽然是人工智能的分支,但已经深入到神经网络领域,从而将数据科学推进到自动化的下一个阶段,语音、图像、文本识别和虚拟现实融合在一起,创造了一个令人惊叹的“数字化商业生态系统”。“与数据科学和人工智能的基本实践相关的新技术仍然每天都在发展,现在有了大数据、云、物联网、edge和无服务器——谁知道它的终点在哪里?”

数字之旅似乎还没有结束

由于人工智能的出现,一直隐藏在内部数据中心背后的数据科学突然在整个企业中获得了巨大的可见性。业务流程和日常决策的一夜之间的转变,再加上大数据、Hadoop和社交、移动和物联网渠道的兴起,将数据技术带到了业务运营的前沿。如今,商业中的数据规则,在可预见的未来,这一趋势不会减弱。

数据科学、人工智能、ML和深度学习使用不同类型的ML算法来区分算法在实际数据管理项目中的适用性。数据科学的一个方面是“分析数据的业务”,它依靠人工智能支持的先进工具,如ML和DL算法或神经网络来预测和预测竞争优势。这意味着业务数据分析只在通过这些高级工具处理数据之后才开始。

“数据科学”是一个更全面的术语,包括“数据的收集、存储、组织、准备和端到端管理”,而支持人工智能的技术控制和促进了业务操作中的数据分析。数据科学、人工智能和机器学习协同工作,利用数据获得各种各样的商业利益。

一篇来自Data Flair的博客文章将数据科学与AI、ML和DL进行了比较,对比了数据科学与AI、ML和DL的好处。显著不同的数据科学和人工智能的数据技术可能是学习算法,它训练大量的数据。机器学习和深度学习算法对数据科学提供的数据进行训练,从而在反馈商业预测方面变得更聪明、更有见地。从这个意义上说,数据科学和人工智能共享一种共生关系,在两个方向上都是完全的互谅互让。

对比数据科学、人工智能和ML之间的特征

数据科学、人工智能和ML之间的对比特征包含了对数据管理的三个不同领域的复杂关系分析。根据这篇文章,是机器学习将人工智能与数据科学联系起来。另一方面,ML和DL具有父子关系,而AI和ML可能被描述为共享类似的父子关系。因此,人工智能、机器学习和深度学习被分层次地置于数据技术生态系统中,AI位于顶部,DL位于底部。

虽然数据科学本身是一个跨学科的领域,但当数据科学家进入数据分析领域时,他们从人工智能的最高自动化水平开始,逐渐下降到DL,承担越来越复杂、越来越有挑战性的分析任务。神经网络的功能类似于人脑,而密集的分析活动需要“脑模拟器类环境”来解决高度复杂的业务问题。

因此,人工智能的广泛领域及其所有子领域可以被视为数据科学的解决方案推动者。

Springboardblog上的这篇文章敏锐地观察了数据科学家和ML专家之间的基本区别。这篇文章指出,虽然ML专家在整个项目生命周期中都忙于构建有用的算法,但数据科学家在角色扮演方面必须更灵活一些——根据项目的需要在不同的数据角色之间进行切换。数据科学和人工智能在“数据”上重叠,这为协作构建业务解决方案提供了机会。

方差解释的一篇文章讨论了这三个字段之间的重叠部分。它指出,虽然AI和ML为业务问题提供了答案,但数据科学家最终通过可视化和报告工具构建了一个令人信服的故事,供更广泛的业务受众使用。业务受众可能不理解什么是随机森林,但是一旦数据驱动的故事出现在他们面前,他们就会立即理解不同业务组件之间的关系和模式,以及它们对业务的未来影响。毫无疑问,与人工智能或ML从业者相比,数据科学家更像是领域专家,能够从数据驱动的视角构建最终的故事。

人工智能与机器学习之间的细微差别,最好通过它们的适用“用例和实现”来理解。人工智能和ML一起工作来自动化人类活动,比如客户服务(数字助理)、驾驶车辆(自动驾驶汽车)和提供个性化推荐(推荐引擎)。使用人工智能和ML的一个好处经常被低估——通过从这些功能中消除人工智能节省大量成本的好处。

在《机器学习与深度学习》一书中,作者指出,在ML中,训练算法学习单层,而在DL中,同样的算法训练发生在多层,这就是所谓的“无监督学习”。DL中的学习与人类的学习条件非常相似。

最后请注意

对人工智能、机器学习和深度学习的研究和市场应用的竞争已经开始,并将持续到遥远的未来。投资和实施最适合其独特业务环境的先进数据技术的企业,将在未来十年保持竞争优势。

标签: 数据 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:8月Github上7个值得关注的数据科学项目

下一篇:微软数据可视化工具SandDance已经开源