失效链接处理 |
Spark SQL 大数据实例开发教E?PDF 下蝲
本站整理下蝲Q?/strong>
版权归出版社和原作者所有,链接已删除,误买正?/b>
用户下蝲说明Q?/strong>
?sh)子版仅供预览,下蝲?4时内务必删除,支持正版Q喜Ƣ的误买正版书c:
http://product.dangdang.com/25255619.html
相关截图Q?br />
![]() 资料介: Spark SQL是Spark生态环境中核心和基的组Ӟ是掌握Spark的关键所在。本书完全从企业U开发的角度出发Q结合多个企业应用案例Q深入剖析Spark SQL。全书共分ؓ8章,包括Q认识Spark SQL、DataFrame原理与常用操作、Spark SQL操作多种数据源、Parquet列式存储、Spark SQL内置函数与窗口函数、Spark SQL UDF与UDAF、Thrift Server、Spark SQLl合应用案例?/span> 本书可以使读者对Spark SQL有深入彻底的理解Q本书适合于Spark学习(fn)爱好者,是学?fn)Spark SQL的入门和提高教材Q也是Spark开发工E师开发过E中查阅Spark SQL的案头手册?/span>
资料目录Q?br /> 前言 W?章认识Spark SQL 1.1Spark SQL概述 1.1.1Spark SQL与DataFrame 1.1.2DataFrame与RDD的差?/span> 1.1.3Spark SQL的发展历E?/span> 1.2从零h掌握Hive 1.2.1Hive的本质是什?/span> 1.2.2Hive安装和配|?/span> 1.2.3使用Hive分析搜烦数据 1.3Spark SQL on Hive安装与配|?/span> 1.3.1安装Spark SQL 1.3.2安装MySQL 1.3.3启动Hive Metastore 1.4Spark SQL初试 1.4.1通过spark-shell来用Spark SQL 1.4.2Spark SQL的命令终?/span> 1.4.3Spark的Web UI 1.5本章结 W?章DataFrame原理与常用操?/span> 2.1DataFrame~程模型 2.2DataFrame基本操作实战 2.2.1数据准备 2.2.2启动交互式界?/span> 2.2.3数据处理与分?/span> 2.3通过RDD来构建DataFrame 2.4~存表(列式存储Q?/span> 2.5DataFrame API应用CZ 2.6本章结 W?章Spark SQL 操作多种数据?/span> 3.1通用的加?保存功能 3.1.1Spark SQL加蝲数据 3.1.2Spark SQL保存数据 3.1.3l合案例——?sh)商热销商品排名 3.2Spark SQL操作HiveCZ 3.3Spark SQL操作JSON数据集示?/span> 3.4Spark SQL操作HBaseCZ 3.5Spark SQL操作MySQLCZ 3.5.1安装q启动MySQL 3.5.2准备数据?/span> 3.5.3操作MySQL?/span> 3.6Spark SQL操作MongoDBCZ 3.6.1安装配置MongoDB 3.6.2启动MongoDB 3.6.3准备数据 3.6.4Spark SQL操作MongoDB 3.7本章结 W?章Parquet列式存储 4.1Parquet概述 4.1.1Parquet的基本概?/span> 4.1.2Parquet数据列式存储格式应用举例 4.2Parquet的Block配置及数据分?/span> 4.2.1Parquet的Block的配|?/span> 4.2.2Parquet 内部的数据分?/span> 4.3Parquet序列?/span> 4.3.1Spark实施序列化的目的 4.3.2Parquet两种序列化方?/span> 4.4本章结 W?章Spark SQL内置函数与窗口函?/span> 5.1Spark SQL内置函数 5.1.1Spark SQL内置函数概述 5.1.2Spark SQL内置函数应用实例 5.2Spark SQLH口函数 5.2.1Spark SQLH口函数概述 5.2.2Spark SQLH口函数分数查询l计案例 5.2.3Spark SQLH口函数NBA常规赛数据统计案?/span> 5.3本章结 W?章Spark SQL UDF与UDAF 6.1UDF概述 6.2UDFCZ 6.2.1Hobby_count函数 6.2.2Combine函数 6.2.3Str2Int函数 6.2.4Wsternstate函数 6.2.5ManyCustomers函数 6.2.6StateRegion函数 6.2.7DiscountRatio函数 6.2.8MakeStruct函数 6.2.9MyDateFilter函数 6.2.10MakeDT函数 6.3UDAF概述 6.4UDAFCZ 6.4.1ScalaAggregateFunction函数 6.4.2GeometricMean函数 6.4.3CustomMean函数 6.4.4BelowThreshold函数 6.4.5YearCompare函数 6.4.6WordCount函数 6.5本章结 W?章Thrift Server 7.1Thrift概述 7.1.1Thrift的基本概?/span> 7.1.2Thrift的工作机?/span> 7.1.3Thrift的运行机?/span> 7.1.4一个简单的Thrift 实例 7.2Thrift Server的启动过E?/span> 7.2.1Thrift Sever启动详解 7.2.2HiveThriftServer2cȝ解析 7.3Beeline操作 7.3.1Beelineq接方式 7.3.2在Beeline中进行SQL查询操作 7.3.3通过Web控制台查看用戯行的操作 7.4Thrift Server应用CZ 7.4.1CZ源代?/span> 7.4.2关键代码行解?/span> 7.4.3试q行 7.4.4q行l果解析 7.4.5Spark Web控制台查看运行日?/span> 7.5本章结 W?章Spark SQLl合应用案例 8.1l合案例实战——?sh)商|站日志多维度数据分?/span> 8.1.1数据准备 8.1.2数据说明 8.1.3数据创徏 8.1.4数据导入 8.1.5数据试和处?/span> 8.2l合案例实战——?sh)商|站搜烦排名l计 8.2.1案例概述 8.2.2数据准备 8.2.3实现用户每天搜烦?名的商品排名l计 8.3本章结 |