英特网资料中心(IDC)的分析家Sue Feldman称:有调查显示,完整的企业搜索已经屡次成为受调者心中最具优先权的考虑事项。她说,"在过去的两年中,当企业发现他们的决策系统一直在忽略内容层面的时候,它就变得更加重要了。 "
你需要的大部份数据都隐藏起来了------ 但是在哪里呢?它们藏在无组织的数据中,和深深的网络中。
随机搜索技术,在用于从网络中取回基本数据的时候是很好用的,或者在确定你硬盘上某个需要文件的位置也很管用。但只有商业智慧(BI:business intelligence) 工具才能对储存在庞大的公司数据库中的信息进行条分缕析。因而,对于知识工作者来说,对于搜索引擎和BI工具的需求同样都在增长。对他们来说,需要被发现并且进行分析的数据触目皆是。
它可能存在于公司的结构化数据库中, 或者,可能在无组织的文件和电子邮件中,也可能存在于普通的网络上,或者存在于不能被普通网络搜索引擎追踪到的众多网络站点上。它存在并隐藏于深深的网络中。
搜索引擎和BI工具的结合
将搜索引擎和BI工具结合,会使事情变得简单起来。无论有组织的或无组织的数据、在普通的网络上或深度网络上的数据,都可经由通用的网络搜索引擎界面接入。让我们假设一下,假如说你想要理解某一特定产品为什么销量下降。你可以从一个客户关系管理数据库(CRM)搜索请求开始, 去测定谁停止了订货。但是你可能还想要发现,那些客户是否发过电子邮件或打过电话,倾诉对产品的抱怨?
这些可能也存在于CRM(客户关系管理)文件中,也可能它被你专门负责与不痛快客户打交道的电话中心的代表们记在了笔记中。
但关键是,你不能通过查看某一种数据资源而得到全面的图景。好消息是你有许多数据来源、有许多工具和许多方法,可以改良得到所需数据的能力。
这篇文章探究搜索引擎和BI工具的结合,这是一个新兴的市场,一些厂商和行业分析家用其他的名字称呼它: 联合搜索,企业搜索,习惯搜索,知识管理和信息接入。无论什么术语,都说明,结合是一个正在成长的趋势。
数据越多,所需要挖掘的数据也越多
举例来说,Endeca ,Fast Search(快速搜索)和其他一些企业正在为自己的,搜索引擎和BI工具的结合能力鼓吹。还有一些企业, 包括Bright Planet(明亮的行星)和Deep Web Technologies(深度网络技术)在内,则提供搜索多样数据库的通用界面。
华盛顿咨询公司“Barquín国际”的首脑及数据仓库学会的第一任会长Ramon C. Barquín说:“"第一个步骤是认识分析家们的现状, 他们是 BI 的传统消费者,他们必须超越他们现有的工具。"
Barquín坚持认为BI 分析家们,知识工作者们和随机的网络搜索者们错过了 "90%甚至更多的本应为他们找到的数据------或者是因为他们不能搜索无组织的公司资源,例如文件和电子邮件,或者是因为他们没有超越普通网络界面的工具。
深度网络(有时被叫做隐藏的网络,或不可见的网络)上的资源,包括这样一些英特网站点,如果你知道网址,你就能拜访它,而且在里面搜索,但是如果不知道网址,这些站点的内容不会被商业网络搜索引擎发现。
一些通常的深度网络站点,包括那些专攻天气数据的站点、航空公司飞行行程安排和价格的站点、股票的站点、专利权的站点,电话号码的站点和更多其它站点。科学研究者和网络开发者要比随机使用者们更清楚,在深度网络中隐藏了多少资源。对于能提升网络搜索宽度和深度的工具,例如Sitemap Protocol, mod oai 和 OAIster等,他们也知道的更多
深度网络搜索公司Bright Planet(明亮的行星)的共同创办人Jerry Tardiff说:“在 2000 年,我们做了一些分析并且发现,来自那些深度网络数据库的文件量远比每个人所说的那个英特网要大的多-------比已知的英特网大200到500倍。"
因此我们需要考虑,这些努力会给我们带来什么,在今天可以利用它做什么?并且,我们在不久的将来内能期望得到什么?
横跨两个领域的共同梦想
任何人都想从每次搜索中得到尽可能多的数据,这貌似合乎逻辑,真实不是那么简单的。个人事物、商业策略和技术使这个场景变得复杂起来。举例来说, BI 和搜索,传统上分属于二种不同类型的使用者,他们各操作各的工具。
"对于一个正在进行广告搜索的随机使用者来说,他想在搜索中,将无组织的数据和有组织的数据联合起来。而应用有组织的BI界面是完全错的。" Forrester 研究机构的分析家 Boris Evelson说: "对于这些使用者,搜索引擎提供了更好的应用。"
在这种情况下,最好是应用一个,能在后端对有组织和无组织的数据均进行梳理、而且可将结果显示在单一窗口的搜索引擎。这样的产品可从 Endeca 和FAST那里获得。同时 , 一些网络搜索引擎,例如 Alacra , CloserLookSearch 和Northern Light,也正致力于为企业开发这项技术。
另一方面, Evelson 继续说道, 简单搜索的样本例子是“不需要为责任沉重的分析家工作, 分析家需要对数据切片、整理、将数据整合 (依照某领域或种类做数据概述),从摘要深化到细节,从一个维度跳跃到另一个维度。"
Evelson又补充说,这些使用者需要一个传统的 BI界面,就象Business Objects或 Cognos的产品那样,特别是假如他们想要 "跨越时间分析出一个模式, 接着再跳跃一步,跨越地域分析出一个模式, 然后将二者联合,看看其中一个是如何影响另一个的。"
BI 工具能产生文本搜索所不可能达到的理解深度,但是由于潜在数据库的坚硬结构,它们的洞察力也被限制了。相反地,文本搜索不受BI"规则"的强制,也不受BI所运行的数据结构的限制。二者结合的目标是:让人们能对无组织数据进行信息挖掘和BI分析,让人们对有组织数据做随机搜索。
BI 和搜索结合所取得的进展
一些公司藉由让一般的职员(不仅仅是分析家)放手使用 BI 工具而获得新的洞察力。举例来说,Labarge,一个电子元器件制造商, 将 IBM的Websphere 和数据建设工具这样的BI 前端,放置在公司的企业资源计划(ERP) 系统上的主框架内,使得数以百计的职员可以直接使用这款工具。而先前职员们不得不仰赖IT人员为他们做报告。
文章整理:西部数码--专业提供域名注册、虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!




