商业智能携手大数据
沃尔玛超市 “啤酒与尿布” 的案例, 曾被奉为商业智能的经典。它体现了数据对市场营销的巨大价值。故事大致如此: 在美国的沃尔玛超市, 人们发现了一个十分有趣的现象——尿布与啤酒的捆绑销售。咋一看将这两样毫无共同点的商品结合在一起令人疑惑丛生, 但惊愕的是, 这一举措居然使尿布和啤酒的销量双双大幅提高。之后的市场调查给出了原因: 原来美国家庭的妻子通常在家照顾孩子, 因而经常会叮嘱丈夫在下班回家途中顺便给孩子买尿布, 购物途中的丈夫则又顺手拿了几瓶自己爱喝的啤酒。在商家发现这一奥秘之后, 投其所好进行捆绑销售, 为商家带来了大量的利润。
“啤酒与尿布” 的故事彰显了数据的价值。看似风马牛不相及的商品, 通过海量的信息数据挖掘, 它们之间的潜在关联得以显现。
从 “数据” 到 “数据价值” 之间的转换, 这便是 “商业智能” (Business Intelligence, 简称BI) 的核心。通常情况下, 新的业务和商业模式便诞生于此。
海量数据
IT圈子里常常会有一些共识, 比如: 数据也是企业的重要资产。关于大数据的研究与预测, 也早已成为行业里炙手可热的课题。
IDC调查的研究报告表明, 2012年, 全球信息化资料量为2.8ZB。随着全球PC与智能手机的普及、 愈来愈多的数据正在被产生。到2020年, 全球数据资料存储量将达到40ZB。这一数据量约等于地球沙滩上所有沙粒总和的47倍, 这意味着平均每人将拥有5247GB的数据量。如果把40ZB全存到蓝光光碟中, 光碟的重量将与424台尼米兹 (Nimitz) 级航母相当。而数字信息的主要制造者也将从现有的成熟市场转移至新兴市场。
在存储世界里, 这或者相当于世界末日;但从另一方面来看, 庞大的数据就像是一座金矿, 以 “啤酒与尿布” 为例, 巨大的市场机会蕴含其中。而在信息技术发展迅速的当下, 其价值将越来越容易被挖掘。
事实上, 围绕着大数据而涌现的一大批新兴商业智能, 如数据挖掘、 数据存储、 数据处理和分析等, 也正迅速席卷市场。由于数据挖掘等商业智能技术的应用, 让不少企业从大量的历史数据中剥茧抽丝, 发现很多有价值的信息, 大大改善了管理人员决策的科学性。
长期以来, 商业智能的应用一直局限于结构化数据, 但实际上, 生活中更多的是非结构化数据, 这一类型的数据近年来增长更为迅速。例如社交媒体中的各种交互活动、 购物网站用户点击行为、 图片、 电子邮件等。大数据就是要打破传统商业智能领域的这一局限, 甚至从某种程度上, 它将更擅长处理非结构化数据。
不难预料的是, 随着大数据相关技术的成熟, 数据分析和处理将逐渐从传统的结构化数据扩展至非结构化数据领域中, 越来越多的行业将从中受益。如何利用大数据, 通过商业智能将其价值发挥到最大, 已成为企业寻找商业价值的根基。
[page] 大数据挖掘拓展
在摩尔定律的作用下, IT设备的硬件成本一直在不断降低, 加上现代IT技术的发展, 使得很多服务器连接到一起组建服务器群集变得非常容易。诸多因素的结合为大数据时代的到来提供了平台。
从微博等社交媒体中挖掘实时数据,再将它们同实际销售信息进行整合, 能够为企业提供真正意义上的智能, 帮助其了解市场发展趋势、 理解客户的消费行为并为将来制定更加有针对性的策略, 对于企业提升其服务质量有着积极的作用。
相对于传统媒体而言, 在新媒体环境下,用户不仅能够随时随地接收丰富的多模态信息, 同时, 产生并分享丰富的多模态信息, 这对数据挖掘提出了新的要求。在清华大学计算机系教授杨士强看来, 如今, 信息量的激增、 信息源的不可控和传播模式的多样化、 复杂化等, 令寻找可信的精准的信息变得更具挑战性。
作为信息平台, 需要注意如何将用户需要的信息和个性需求相结合, 精准地传递用户需要的信息。另一方面, 要对网络进行监控和引导, 构建健康的网络环境。数据挖掘是一种海量、 多模态、 多尺度、 多类型的技术,进行关联预测、 分类与聚类、 趋势预测等等,在现有的技术上, 需要寻找新的技术, 来适应新媒体环境下的数据挖掘。
杨士强教授给出了信息→信息流→行为性信息流的新挖掘思路。在信息层面, 通过内容理解, 进行信息内容的语义挖掘; 在信息流层面, 进行结构分析, 进行信息传播的结构挖掘及演化规律挖掘; 在行为性信息流层面,通过行为建模, 进行用户偏好挖掘 (如图) 。
一些大数据技术正在被那些迫切需要这些技术, 且对新技术异常敏感的人们积极使用, 大数据挖掘正向各行各业扩展。几年前,或许还仅仅只是Facebook、 雅虎这样的大型网络公司应用大数据技术。如今, 银行业、 公共事业、 智能社区等等, 几乎所有拥有海量数据的企业都在使用大数据技术, 这些技术在部分项目中也起到了关键作用, 如创建由社交媒体驱动的基于Web的服务。而在其他一些垂直行业、 企业也已经意识到, 与之前相比, 自己正处于业务转型的一个绝佳机会当口。它们在产业链上的价值越来越依赖于信息。
BI→BA
商业智能的关键是从企业运作系统的数据中提取出有用的数据并进行清理, 以保证数据的正确性, 然后经过抽取(extraction) 、 转换(transformation) 和装载 (load) , 即ETL过程, 合并到一个数据仓库里, 从而得到企业数据的一个全局视图。在此基础上, 利用一些工具对其进行分析和处理, 最后将结果呈现给管理者,为管理者的决策过程提供支持。
(编辑:ASP站长网) |