从数据仓库到数据视图

 

如何根据业务需求交付数据产品?一系列步骤可以帮助你理解亿贝的实践:1.选择合适的数据仓库2.建立数据模型3.利用第三方数据4.使用数据库小工具5.数据集市的使用和管理6.制作数据视图。...





Author: Shu, Alison

作为亿贝数据平台的技术支持团队,我们定期会和业务部门交流,了解他们对数据平台的使用和期望。这一次,我们接触了业务拓展团队。他们需要根据亿贝集市的品类销售情况及中国卖家的渗透率,部署各省的人手。他们对数据平台和工具的了解和使用仅限于MS Excel。由于资源有限,他们期望一个快速的解决方案,一次部署不用维护。相应的他们的需求也非常清晰,并且一定期限内保持不变。

作为亿贝数据分析平台推广活动之一,我们数据支持团队根据以上的用户需求制作了演示产品。完整步骤呈现如下:

一、选择合适的数据仓库

二、建立数据模型

三、利用第三方数据

四、使用数据库小工具

五、数据集市的使用和管理

六、制作数据视图

一、选择合适的数据仓库

亿贝有各种数据仓库支持不同的应用场景。结合业务需求,判断是否满足以下一个或几个应用场景,我们决定选择Teradata数据仓库。

数据仓库不同的的业务场景:

  • OLAP (Online TransactionProcessing)应用
  • 储存限制级数据,比如用户人个身份信息
  • 数据容错性高
  • 支持商业智能报告或分析应用
  • 读写操作密集度不同,比如侧重写,或者侧重读
  • 内存或缓存中储存数据
  • 支付多维度立方体的切片和切块


市场上企业级的数据平台及基本特性:

  • Mongo DB: NoSQL, 支持分布式数据存储
  • Couchbase:NoSQL, 缓存中储存数据,支持高性能读写
  • Hadoop:NoSQL,开源,支持分布式数据存储、计算的大数据应用平台
  • Hbase:NoSQL,分布式面向列的开源数据库。
  • Oracle:SQL,世界上最流行的关系型数据库管理系统。
  • MySQL:SQL,开源的关系型数据库管理系统
  • Teradata Database:SQL,高性能和精密的工作负管理


我们的业务需求:

  • 结构化数据(业务交易数据)
  • 可靠性高(减少额外维护成本)
  • 支持商业智能报告和视图化(业务用户是数据的消费者)


更多内容,请点击“ 阅读原文 ”。


    关注 亿贝招聘


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册