大数据的商业智能
商业智能是从许多来自不同系统的数据中提取出有用的数据,并进行清理,以保证数据的正确性,然后经过抽取、转换和装...
商业智能是从许多来自不同系统的数据中提取出有用的数据,并进行清理,以保证数据的正确性,然后经过抽取、转换和装载的过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图。在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理,最后将知识呈现给管理者,为管理者的决策过程提供支持。
经历二十多年的发展以及多轮并购潮之后,BI厂商分为两类,一类是综合性BI提供商。例如IBM、Oracle 、SAP和Microsoft等。另一类是专业化BI提供商,例如Teradata和SAS。在中国BI工具的应用遇到挑战:(1)报表格式复杂。中国的报表设计思想与西方不同,西方报表倾向于仅用一张报表说明一个问题,而中国的报表倾向于将尽可能多的问题集中在一张报表中,这种思路直接导致了中国报表的复杂格式。(2)数据量大。以中国移动为例,仅我国一个省的用户数量,就相当于欧洲一个中等国家的人口,是真正的海量数据,BI系统的分析耗时较长。(3)数据回写。BI系统是以真实再现源数据为原则,但是实际应用中许多公司都提出了数据修改的需求。
传统BI主要用于分析历史情况,目前主要集中于以下几个领域:
- 固定报表:目前中国市场上的商业智能应用停留在这个层面,主要过程是通过ETL工具,将业务系统源数据抽取到数据仓库中,在装载到数据集市,建立模型,利用前端工具将数据展现出来。
- OLAP分析:生成OLAP多维模型,实现多指标分析。
- 数据挖掘:通过分析具体数据,发现潜在的、有价值的信息,例如啤酒和尿布。
- 分析应用:与业务信息系统相结合。例如企业绩效管理。随着企业应用的复杂和数据量的增加,传统BI应用也面临着一些的局限性:
- 传统BI的过滤、上钻、下钻、比较等功能难于满足一些特殊企业用户的分析要求。
- 如何来保证外部数据的准确性、实时性和有效性是个重大问题。
- 在多媒体、智能手机和社交网站获取的信息,我们正面临着比以往任何时候都更多的数据,传统数据仓库的性能已无法应付庞大的信息。只有通过大数据(BigData)技术才能够访问和使用这些宝贵的、大规模数据集,以应对越来越复杂的数据分析和更好的商业决策制定。
大数据BI系统的底层技术主要包括分布式计算、内存计算和列存储。大数据BI系统的演变过程可分为如下三阶段。
第一阶段:OLTP&OLAP
第二阶段:MaterializedView(物化视图),STAGE(直接拷贝接口层)、ODS(企业运营数据仓库)、DWD(细节数据层)、DWA(衍生汇总层)
第三阶段:一体机,MPP (大规模并行处理)DW(数据仓库),MPP(大规模并行处理) DM(数据集市)
大数据下的BI系统不仅仅是数据展现,还要实现:能够掌握情况,分析问题,找到答案;前端系统的交互和分析能力要强大;数据挖掘、预测变成重要的需求。
移动互联网、物联网、云计算的快速兴起以及移动智能终端的快速普及,正使得当前人类社会的数据增长比以往任何一个时期都要快,大数据和商业智能结合已应用于各行各业,通过用户行为分析实现精准营销是大数据的典型应用,但大数据在各领域都具有广阔的应用前景。
文章作者:中国移动设计院技术通讯
通信让我们的生活更美好!
我们的微信号:ZTE1415,或长按指纹扫描,并点击“识别图中二维码”关注更多精彩,一触即发!
关注 中兴通讯东北实训基地
微信扫一扫关注公众号