探讨关于数据科学和人工智能战略的制定

2019-11-18    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

作者:Andrew Ross 编译来源:企业网D1Net

尽管关于创建业务战略的信息广为人知,但创建数据和人工智能战略仍然是一个充满挑战的新领域。

在行业媒体Information Age最近与 Informatica公司合作在伦敦举行的一次圆桌会议上,来自各个行业的技术领导者分享了有关开发数据和人工智能策略的见解,以及如何克服的常见障碍。

与会者包括:Starling Bank机器学习主管Alison Choy; M&S公司技术、数据主管Chris Waite;汇丰银行人工智能项目经理Sebastian Wilson;维珍航空公司数据和见解主管Tim Lum;Gowling WLG(英国)资讯科技总监Tony McKenna;Willis Towers Watson的数字主管George Zarkadakis;Trainline公司数据科学总监Fergus Weldon;Superbet公司高级顾问Finbarr Joy;Dun&Bradstreet全球业务数据战略和管理负责人Andy Crisp; Data Labs 英国和EMEA地区负责人Javier Campos;Informatica公司EMEA地区副总裁Greg Hanson以及Information Age编辑Nicholas Ismail。

尽管与会者来自不同领域,但整个讨论过程中都有一个共同的话题:人工智能和机器学习的成功始于拥有强大的数据基础。

人工智能与数据

分析、人工智能和机器学习继续在所有行业取得广泛进展,为企业带来重大机遇。然而,人工智能提高业务性能和竞争力的潜力要求采用不同的方法来管理数据生命周期。

根据专家在圆桌会议上达成的共识,许多人工智能计划未能启动是因为企业需要从数据中获得洞察,但没有找到实施它们的正确战略。

Dun&Bradstreet公司全球业务数据战略和管理负责人Andy Crisp认为,这一问题很大程度上源于缺乏技术专长。

他说:“我认为,要想在数据方面取得成功,企业需要一个非常好的数据管理计划。企业需要能够让人们了解数据背后的机制,并为数据提供场景。我认为在人工智能中看到的一个问题是,模型在没有这种知识的情况下被使用,将会一事无成。”

下一代数据湖

根据Informatica公司EMEA地区副总裁Greg Hanson的说法,问题在于缺乏良好的数据治理,而由于数据流的持续增长,这个问题变得更加严重。

他主张利用数据,必须拆除数据孤岛,并用更易访问的下一代数据湖代替,这将使更有效的决策、更全面的见识和更明智的自动化成为可能。

他说,“如果企业没有提供能够以数据科学家或业务人员可以利用的形式有效地提供数据的工具,那么他们将无法从数据中获得该价值。”

他补充道:“人工智能可以帮助确保数据的传播和数据的生命周期被跟踪,并提供给组织帮助管理,并证明他们是某人数据的良好监护人。”

他认为,不能做到这一点的组织将难以开发出高质量的数据产品。由于监管方面的影响,还存在阻碍消费者信任的实际风险。

提出正确的问题

虽然毫无疑问,人工智能可以缓解数据管理中的许多挑战,但Trainline公司数据科学总监Fergus Weldon表示,围绕试图找出数据中的需求还有其他问题。

他说:“我工作中最困难的部分是试图回答正确的问题。除了数据争论,我的团队花了很多时间让人们知道他们想问什么。”

维珍航空公司数据和洞察负责人Tim Lum补充说,收集数据还不够,然后希望人工智能能够对其进行整理。收集数据不应成为主要目标:应该找到收集数据的理由。

他说,“数据治理离不开数据策略。首先也是最重要的是,需要弄清楚需要解决的业务问题是什么。”

在这种信念下,Lum在维珍航空公司的大部分工作都涉及与业务利益相关者一起工作。例如,他最近与客户体验和客舱团队合作,为空乘人员创建客户信息应用程序;这样,通过跨部门分享见解和工作,他们可以更加关注客户。

他补充说:“从没有数据湖或数据仓库到拥有两个人工智能用例,我想说的是,如果已经有很多数据,那么治理就很重要,如果没有,则需要快速开发产品。治理总是可以跟进的。”

Starling Bank公司机器学习主管Alison Choy对此表示认同,他说:“企业必须了解自己的业务需求以及客户的需求,以便可以决定要生产什么产品,然后要决定如何做。同时还要确保每个人都了解实现此目标的必要步骤。”

定义数据产品

Gowling WLG(英国)信息技术总监Tony McKenna指出,这种方法也具有挑战性。根据他的经验,通常很难使数据团队与业务分析师处于同一页面上。

Experian DataLabs英国和EMEA地区负责人Javier Campos对此表示赞同,他说,“数据科学家和业务分析师似乎来自两种不同的文化。分析师关注业务利益相关者和业务影响,而许多数据科学家关注纯数据建模。”换句话说,大多数据科学家缺乏商业头脑。

作为Superbet公司高级顾问,Finbarr Joy非常清楚这个问题,他和他的团队希望避免这个问题。因此致力于彻底各自为政的部门孤岛。

他说:“虽然要使产品投入使用需要大量专业知识,但是数据实践需要与软件工程、产品管理以及其他业务融合在一起,因此他们必须以共同的客户为中心。在Superbet公司,我们没有发展独立的分析师和商业智能团队,而是在发展跨学科的产品团队,每个产品团队都拥有相关的专业知识(例如‘数据')。

它本质上是客户驱动的。我们必须建立并加强与客户的互动,并因此而增强其见识,这是我们的首要任务。对于我们作为数字团队的团队来说,如果我们的客户不购买我们的产品,那么我们将无法持续经营。”

Superbet公司高级顾问Finbarr Joy向与会代表解释了他为何建立多学科产品团队的原因。

敏捷性和标准化:不互斥

无论采用哪种数据管理方法都适合企业的业务,Hanson认为,尽可能地标准化技术堆栈通常会带来好处。

他说:“缺乏数据标准化会导致信息的碎片化,这会阻碍组织推动创新、变革和灵活性的能力。例如,我时常收到邮件,但对于我的称呼并不一致。这种不一致表明,许多公司仍然对客户及其与公司的整体互动没有统一的看法。”

这对M&S公司技术和数据主管Chris Waite来说是一个巨大的挑战。该零售商拥有大量来自不同系统和业务不同部分的数据。

为了取得进展,M&S公司需要将这些孤岛放在一起,以便业务用户可以在雄心勃勃的项目上进行创新。将这些联合数据组合在一起的方法是开始通过数据编目对数据产品进行可视化。一旦有了集中的信息目录;它可以开始将客户数据整合在一起并围绕它开发产品。

Hanson补充说,“到目前为止,人工智能在工程层的投资还不算太多。这就是数据所面临的巨大挑战。”

汇丰银行人工智能项目经理Sebastian Wilson表示,在其公司的数据湖中使用人工智能在其开发人工智能产品的过程中发挥了至关重要的作用。

汇丰银行于2017年开始创建其数据湖,当时它从数百个系统和数千个应用程序中收集数据。然后对这些数据进行标记和编目。人工智能被用来从其数据湖中获取见解,帮助发现商业机会;以及评估数据质量、数据就绪性和技术可行性。

对于许多公司而言,试图从低成熟度状态过渡到以人工智能为中心的模型是一个真正的挑战。最终,将由组织的客户培训他们的人工智能系统,企业制定数据和人工智能策略必须对它们有着更浓厚的兴趣。

标签: 数据 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:不交学费也能成为数据科学家,这里有一条免费学习路径

下一篇:数据科学中一些不常用但很有用的Python库