失效链接处理 |
深入理解Flink实时大数据处理实?PDF 下蝲
本站整理下蝲Q?/strong>
版权归出版社和原作者所有,链接已删除,误买正?/b>
用户下蝲说明Q?/strong>
?sh)子版仅供预览,下蝲?4时内务必删除,支持正版Q喜Ƣ的误买正版书c:(x)
http://product.dangdang.com/27857702.html
相关截图Q?br />
![]() 资料介:(x) 本书介绍了当下流行的实时数据处理引擎FlinkQ讲解了处理API、批处理API、机器学?fn)引擎FlinkML、关pdAPI、复杂事件处理FLinkCEPQ以?qing)指标度量与部v模式。此外,本书展开分析了流式数据处理理Z旉、窗口、水印、触发器、迟到生存期之间的关联关p;深入分析了多式曲线拟合、分cȝ法SVM、推荐算法ALS-WR的理论和FlinkML实现。希望快速上手Flink以开展实时大数据处理与在U机器学?fn)应用的从业者,本书是不二的选择Q本书首先介l相x念引入的原因、解x案的演进q程、Flink的对应架构、编E案例以?qing)开攑ּ的思考问题?/span> 资料目录Q?br /> W??式数据架构理论 1 1.1 大数据处理架构演q历E?1 1.2 案例分析 8 1.2.1 SK ?sh)信N安全性评?8 1.2.2 式机器学习(fn)应用 12 1.3 式数据架构基本概念 17 1.3.1 ?17 1.3.2 旉 18 1.3.3 H口 21 1.3.4 水印 23 1.3.5 触发?23 1.3.6 数据处理模式 23 1.3.7 如何理解式数据架构的内在机?27 1.4 Ҏ(gu)事g旉开滚动H口 28 1.4.1 whatQ{换/whereQ窗?29 1.4.2 whenQ水?29 1.4.3 whenQ触发器 32 1.4.4 whenQ迟到生存期 34 1.4.5 howQ篏加模?35 1.5 一致?37 1.5.1 有状态计?37 1.5.2 exactly-once 语义 38 1.5.3 异步屏障快照 39 1.5.4 保存?44
1.6 思考题 45
2.1 Flink 概述 46 2.2 让轮子{h 47 2.2.1 本书U定 47 2.2.2 搭徏单机版环?48 2.2.3 配置IDEA 51 2.3 ~程模型 53 2.3.1 分层lg?53 2.3.2 式计算模型 54 2.3.3 处理编E?57 2.4 q行?62 2.4.1 q行时结?62 2.4.2 d调度 66 2.4.3 物理执行计划 69
2.5 思考题 70
3.1 处理API 概述 71 3.2 旉处理 73 3.2.1 旉 73 3.2.2 水印 74 3.2.3 周期性水印生成器 75 3.2.4 间歇性水印生成器 77 3.2.5 递增式水印生成器 78 3.3 子 79 3.3.1 子函数 80 3.3.2 数据分区 83 3.3.3 资源׃n 85 3.3.4 RichFunction 85 3.3.5 输出带外数据 86 3.4 H口 86 3.4.1 H口分类 87 3.4.2 H口函数 90 3.4.3 触发?94 3.4.4 清除?96 3.4.5 q到生存?96 3.5 q接?97 3.5.1 HDFS q接?98 3.5.2 Kafka 99 3.5.3 异步I/O 102 3.6 状态管?104 3.6.1 状态分c?104 3.6.2 托管的Keyed State 104 3.6.3 状态后端配|?106 3.7 (g)查点 107
3.8 思考题 108
4.1 批处理API 概述. 109 4.1.1 E序l构 110 4.1.2 Source 111 4.1.3 Sink 112 4.1.4 q接?112 4.2 子 113 4.2.1 子函数 113 4.2.2 q播变量 121 4.2.3 文g~存 122 4.2.4 定w 123 4.3 q代 123 4.3.1 深度经|络训练 123 4.3.2 |络C֛发现法 125 4.3.3 Bulk Iteration 127 4.3.4 Delta Iteration 的P代Ş?128 4.4 注解 130 4.4.1 直接转发 130 4.4.2 非直接{?131 4.4.3 触达 132
4.5 思考题 132
5.1 概述 133 5.1.1 数据加蝲 134 5.1.2 多项式曲U拟合的例子 135 5.2 水U?137 5.2.1 机器学习(fn)面(f)的架构问?137 5.2.2 Scikit-learn 架构实践ȝ 138 5.2.3 FlinkML 实现 140 5.3 深入分析多项式曲U拟?170 5.3.1 数D的底层框架 170 5.3.2 向量 172 5.3.3 数据预处?178 5.3.4 特征变换 184 5.3.5 U性拟?188 5.4 分类法 190 5.4.1 最优超q面 190 5.4.2 怼化理?193 5.4.3 求解最优超q面 198 5.4.4 核方?200 5.4.5 软间?205 5.4.6 优化解法 208 5.4.7 SVM 的FlinkML 实现 211 5.4.8 SVM 的应?220 5.5 推荐法 221 5.5.1 推荐pȝ的分c?221 5.5.2 ALS-WR 法 223 5.5.3 FlinkML 实现 225 5.5.4 ALS-WR 的应?230
5.6 思考题 230
6.1 Z么需要关pdAPI 234 6.2 Calcite 235 6.3 关系型API 概述. 236 6.3.1 E序l构 236 6.3.2 Table q行?239 6.3.3 表注?241 6.3.4 TableSource 与TableSink 242 6.3.5 查询 244 6.3.6 怺转换 244 6.4 动态表概述 247 6.4.1 式关系代数 247 6.4.2 动态表 248 6.4.3 持箋查询 250
6.5 思考题 255
7.1 什么是复杂事g处理 256 7.1.1 股票异常交易(g)?256 7.1.2 重新审视DataStream 与Table API 258 7.2 复杂事g处理的自动机理论 259 7.2.1 有穷自动机模型NFA 259 7.2.2 NFAb 模型 261 7.2.3 带版本号的共享缓?263 7.3 FlinkCEP API 265 7.3.1 基本模式 266 7.3.2 模式拼合 267 7.3.3 模式分组 268 7.3.4 匚w输出 269 7.4 ZFlinkCEP 的股异怺易检的实现 270
7.5 思考题 274
8.1 监控 275 8.1.1 度量指标 275 8.1.2 指标的作用域 279 8.1.3 监控配置 279 8.2 集群部v模式 281 8.2.1 Standalone 281 8.2.2 YARN 281 8.2.3 高可?284 8.3 讉K安全 284 8.4 思考题 286 参考资?287 |