题名:
|
Hadoop构建数据仓库实践 [ 专著] Hadoop gou jian shu ju cang ku shi jian / 王雪迎著 , |
ISBN:
|
978-7-302-46980-3 价格: CNY89.00 |
语种:
|
chi |
载体形态:
|
434页 26cm |
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2017 |
内容提要:
|
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。 |
主题词:
|
数据处理软件 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
王雪迎 wang xue ying 著 |
附注:
|
大数据技术 |
索书号:
|
TP274/glg1013 |