大数据的商业智能

 

商业智能是从许多来自不同系统的数据中提取出有用的数据,并进行清理,以保证数据的正确性,然后经过抽取、转换和装...



商业智能是从许多来自不同系统的数据中提取出有用的数据,并进行清理,以保证数据的正确性,然后经过抽取、转换和装载的过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图。在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理,最后将知识呈现给管理者,为管理者的决策过程提供支持。

经历二十多年的发展以及多轮并购潮之后,BI厂商分为两类,一类是综合性BI提供商。例如IBM、Oracle 、SAP和Microsoft等。另一类是专业化BI提供商,例如Teradata和SAS。在中国BI工具的应用遇到挑战:(1)报表格式复杂。中国的报表设计思想与西方不同,西方报表倾向于仅用一张报表说明一个问题,而中国的报表倾向于将尽可能多的问题集中在一张报表中,这种思路直接导致了中国报表的复杂格式。(2)数据量大。以中国移动为例,仅我国一个省的用户数量,就相当于欧洲一个中等国家的人口,是真正的海量数据,BI系统的分析耗时较长。(3)数据回写。BI系统是以真实再现源数据为原则,但是实际应用中许多公司都提出了数据修改的需求。

传统BI主要用于分析历史情况,目前主要集中于以下几个领域:

  • 固定报表:目前中国市场上的商业智能应用停留在这个层面,主要过程是通过ETL工具,将业务系统源数据抽取到数据仓库中,在装载到数据集市,建立模型,利用前端工具将数据展现出来。
  • OLAP分析:生成OLAP多维模型,实现多指标分析。
  • 数据挖掘:通过分析具体数据,发现潜在的、有价值的信息,例如啤酒和尿布。
  • 分析应用:与业务信息系统相结合。例如企业绩效管理。随着企业应用的复杂和数据量的增加,传统BI应用也面临着一些的局限性:
  • 传统BI的过滤、上钻、下钻、比较等功能难于满足一些特殊企业用户的分析要求。
  • 如何来保证外部数据的准确性、实时性和有效性是个重大问题。
  • 在多媒体、智能手机和社交网站获取的信息,我们正面临着比以往任何时候都更多的数据,传统数据仓库的性能已无法应付庞大的信息。只有通过大数据(BigData)技术才能够访问和使用这些宝贵的、大规模数据集,以应对越来越复杂的数据分析和更好的商业决策制定。
     未来BI主要用于预测情况,其发展方向为:建立实时动态数据仓库。传统数据仓库是基于历史数据分析,动态数据仓库支持前端应用,利用分析结果发起业务流程。增加对非结构化数据的处理并缩短响应时间。为满足未来商业智能的发展,应该将大数据技术和商业智能技术结合起来。数据海洋中的大数据要做的事不仅要对大规模的信息运行分析,而且其自身也成为数据仓库的一种来源,大数据有益于大型分析以及长期的战略方向。大数据是传统数据库、数据仓库、BI概念外延的扩展,手段的扩充,对传统的数据应用不存在取代的关系,也并不是互斥的关系。通过用户行为分析实现精准营销是大数据的典型应用,但是大数据在各行各业特别是公共服务领域具有广阔的应用前景。

大数据BI系统的底层技术主要包括分布式计算、内存计算和列存储。大数据BI系统的演变过程可分为如下三阶段。

第一阶段:OLTP&OLAP

第二阶段:MaterializedView(物化视图),STAGE(直接拷贝接口层)、ODS(企业运营数据仓库)、DWD(细节数据层)、DWA(衍生汇总层)

第三阶段:一体机,MPP (大规模并行处理)DW(数据仓库),MPP(大规模并行处理) DM(数据集市)

     大数据下的BI系统不仅仅是数据展现,还要实现:能够掌握情况,分析问题,找到答案;前端系统的交互和分析能力要强大;数据挖掘、预测变成重要的需求。

移动互联网、物联网、云计算的快速兴起以及移动智能终端的快速普及,正使得当前人类社会的数据增长比以往任何一个时期都要快,大数据和商业智能结合已应用于各行各业,通过用户行为分析实现精准营销是大数据的典型应用,但大数据在各领域都具有广阔的应用前景。

文章作者:中国移动设计院技术通讯

通信让我们的生活更美好!
我们的微信号:ZTE1415,或长按指纹扫描,并点击“识别图中二维码”关注更多精彩,一触即发!


    关注 中兴通讯东北实训基地


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册