失效链接处理 |
SPARK大数据分析与实战 黑马E序?PDF 下蝲
下蝲地址Q?/strong>
版权归出版社和原作者所有,链接已删除,误买正?br style="padding: 0px; margin: 0px;" />
用户下蝲说明Q?/strong>
?sh)子版仅供预览,下蝲?4时内务必删除,支持正版Q喜Ƣ的误买正版书c:
http://product.dangdang.com/27927073.html
相关截图Q?br /> ![]() 资料介: 本书从初学者角度详l介l了Spark应用E序体系架构的核心技术,全书?章。第1章详l介l开发Spark框架的Scala~程语言Q第2???章主要讲解Spark核心基础、SparkRDDҎ(gu)分布式数据集、Spark SQL处理l构化数据、Spark Streaming实时计算框架、Spark MLlib机器学习(fn)库,q包含了搭徏Spark集群、Spark集群的操作方式、利用Spark解决大数据工作中遇到的基本问题。第5?章主要讲解大数据环境中常见的辅助pȝQHBase数据库以及Kafka处理^収ͼ包含辅助pȝ的搭建方式、用方法以及相兛_层实现的基本原理Q第9章是一个综合项目,利用Spark框架开发流式计系l。掌握Spark相关技术,能够很好地适应企业开发的技术需要,为离Uѝ实时数据处理^台的开发奠定基?本书附有配套源代码、教学PPT、题库、教学视频、教学补充案例、教学设计等资源。ؓ了帮助初学者更好地学习(fn)本书中的内容Q还提供了在U答疑,Ƣ迎读者关注?本书可作为高{院校本、专U计机相关专业Q大数据评的专用教材,是一本适合q大计算机编E爱好者的优秀ȝ?br /> 资料目录Q?/strong> W?章Scala语言基础1
1.1初识Scala1
1.1.1Scala概述1
1.1.2Scala的下载安?
1.1.3在IDEA开发工具中下蝲安装
Scala插g4
1.1.4开发个ScalaE序6
1.2Scala的基语法9
1.2.1声明值和变量9
1.2.2数据cd9
1.2.3术和操作符重蝲10
1.2.4控制l构语句10
1.2.5Ҏ(gu)和函?3
1.3Scala的数据结?5
1.3.1数组15
1.3.2元组18
1.3.3集合19
1.4Scala面向对象的特?4
1.4.1cM对象24
1.4.2l承25
1.4.3单例对象和伴生对?6
1.4.4特质28
1.5Scala的模式匹配与样例c?9
1.5.1模式匚w30
1.5.2样例c?1
1.6本章结31
1.7译?fn)?2
W?章Spark基础33
2.1初识Spark33目录Spark大数据分析与实战
2.1.1Spark概述33
2.1.2Spark的特?4
2.1.3Spark应用场景35
2.1.4Spark与HadoopҎ(gu)36
2.2搭徏Spark开发环?7
2.2.1环境准备37
2.2.2Spark的部|方?7
2.2.3Spark集群安装部v38
2.2.4Spark HA集群部v41
2.3Sparkq行架构与原?5
2.3.1基本概念45
2.3.2Spark集群q行架构45
2.3.3Sparkq行基本程46
2.4体验个SparkE序47
2.5启动SparkShell49
2.5.1q行SparkShell命o49
2.5.2q行SparkShelldHDFS文g50
2.6IDEA开发WordCountE序52
2.6.1以本地模式执行SparkE序52
2.6.2集群模式执行SparkE序54
2.7本章结58
2.8译?fn)?9
W?章Spark RDDҎ(gu)分布式数据?0
3.1RDD?0
3.2RDD的创建方?1
3.2.1从文件系l加载数据创建RDD61
3.2.2通过q行集合创徏RDD62
3.3RDD的处理过E?3
3.3.1转换子63
3.3.2行动子67
3.3.3~写WordCount词频l计案例70
3.4RDD的分?1
3.5RDD的依赖关p?1
3.6RDD机制73
3.6.1持久化机?3
3.6.2定w机制75
3.7Spark的Q务调?6
3.7.1DAG的概?6
3.7.2RDD在Spark中的q行程76
3.8本章结78
3.9译?fn)?8
W?章Spark SQLl构化数据文件处?0
4.1Spark SQL的基知识80
4.1.1Spark SQL的简?0
4.1.2Spark SQL架构81
4.2DataFrame的基知识82
4.2.1DataFrame?2
4.2.2DataFrame的创?3
4.2.3DataFrame的常用操?6
4.3Dataset的基知识89
4.3.1Dataset?9
4.3.2Dataset对象的创?9
4.4RDD转换为DataFrame90
4.4.1反射机制推断Schema90
4.4.2~程方式定义Schema92
4.5Spark SQL操作数据?4
4.5.1操作MySQL94
4.5.2操作Hive数据?6
4.6本章结99
4.7译?fn)?9
W?章HBase分布式数据库101
5.1HBase的基知识101
5.1.1HBase的简?01
5.1.2HBase的数据模?02
5.2HBase的集部|?03
5.3HBase的基本操?07
5.3.1HBase的Shell操作107
5.3.2HBase的Java API操作112
5.4深入学习(fn)HBase原理120
5.4.1HBase架构121
5.4.2物理存储122
5.4.3d机制123
5.4.4HBased数据程124
5.5HBase和Hive的整?25
5.6本章结130
5.7译?fn)?30
W?章Kafka分布式发布订阅消息系l?32
6.1Kafka的基知识132
6.1.1消息传递模式简?32
6.1.2Kafka?33
6.2Kafka工作原理134
6.2.1Kafka核心lg介绍134
6.2.2Kafka工作程分析136
6.3Kafka集群部v与测?38
6.3.1安装Kafka138
6.3.2启动Kafka服务140
6.4Kafka生者和消费者实?41
6.4.1Z命o行方式用Kafka141
6.4.2ZJava API方式使用Kafka143
6.5Kafka Streams148
6.5.1Kafka Streams概述149
6.5.2Kafka Streams开发单词计数应?49
6.6本章结153
6.7译?fn)?53
W?章Spark Streaming实时计算框架155
7.1实时计算的基知识155
7.1.1什么是实时计算155
7.1.2常用的实时计框?55
7.2Spark Streaming的基知识156
7.2.1Spark Streaming?56
7.2.2Spark Streaming工作原理157
7.3Spark的DStream157
7.3.1DStream?57
7.3.2DStream~程模型158
7.3.3DStream转换操作158
7.3.4DStreamH口操作164
7.3.5DStream输出操作168
7.3.6DStream实例——实现|站热词排序170
7.4Spark Streaming整合Kafka实战173
7.4.1KafkaUtils.createDstream方式173
7.4.2KafkaUtils.createDirectStream方式177
7.5本章结180
7.6译?fn)?80
W?章Spark MLlib 机器学习(fn)法?82
8.1初识机器学习(fn)182
8.1.1什么是机器学习(fn)182
8.1.2机器学习(fn)的应?83
8.2Spark机器学习(fn)库MLlib的概q?84
8.2.1MLlib的简?84
8.2.2Spark机器学习(fn)工作程185
8.3数据cd186
8.3.1本地向量186
8.3.2标注?86
8.3.3本地矩阵187
8.4Spark MLlib基本l计188
8.4.1摘要l计188
8.4.2相关l计189
8.4.3分层抽样190
8.5分类191
8.5.1U性支持向量机191
8.5.2逻辑回归192
8.6案例——构徏推荐pȝ193
8.6.1推荐模型分类194
8.6.2利用MLlib实现?sh)媄推?94
8.7本章结200
8.8译?fn)?00
W?章综合案?mdash;—Spark实时交易数据l计202
9.1pȝ概述202
9.1.1pȝ背景介绍202
9.1.2pȝ架构设计202
9.1.3pȝ预览203
9.2Redis数据?03
9.2.1Redis介绍204
9.2.2Redis部v与启?04
9.2.3Redis操作及命?05
9.3模块开?mdash;—构徏工程l构206
9.4模块开?mdash;—构徏订单pȝ211
9.4.1模拟订单数据211
9.4.2向Kafka集群发送订单数?12
9.5模块开?mdash;—分析订单数据215
9.6模块开?mdash;—数据展示219
9.6.1搭徏Web开发环?19
9.6.2实现数据展示功能221
9.6.3可视化^台展C?27
9.7本章结228
|