Apache Spark源码剖析( 货号:712125420) 下载 网盘 kindle mobi 115盘 pdf pdb rtf

Apache Spark源码剖析( 货号:712125420)电子书下载地址
- 文件名
- [epub 下载] Apache Spark源码剖析( 货号:712125420) epub格式电子书
- [azw3 下载] Apache Spark源码剖析( 货号:712125420) azw3格式电子书
- [pdf 下载] Apache Spark源码剖析( 货号:712125420) pdf格式电子书
- [txt 下载] Apache Spark源码剖析( 货号:712125420) txt格式电子书
- [mobi 下载] Apache Spark源码剖析( 货号:712125420) mobi格式电子书
- [word 下载] Apache Spark源码剖析( 货号:712125420) word格式电子书
- [kindle 下载] Apache Spark源码剖析( 货号:712125420) kindle格式电子书
内容简介:
基本信息
商品名称: Apache Spark源码剖析
出版社: 电子工业出版社
出版时间:2015-03-01
作者:许鹏
译者:
开本: 16开
定价: 68.00
页数:285
印次: 1
ISBN号:9787121254208
商品类型:图书
版次: 1 内容提要
内容简介本书以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。
本书第3~5章详细介绍了sparkcore中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握spark实现机理。第6~9章对spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握sPark技术。
本书对于Spark应用开发人员及spark集群管理人员都有J好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。
书籍目录:
第一部分Spark概述1
第1章初识Spark 3
1.1 大数据和Spark 3
1.1.1 大数据的由来4
1.1.2 大数据的分析4
1.1.3 Hadoop 5
1.1.4 Spark简介6
1.2 与Spark的第一次亲密接触7
1.2.1 环境准备7
1.2.2 下载安装Spark 8
1.2.3 Spark下的WordCount 8
第二部分Spark核心概念13
第2章Spark整体框架 15
2.1 编程模型15
2.1.1 RDD 17
2.1.2 Operation 17
2.2 运行框架18
2.2.1 作业提交18
2.2.2 集群的节点构成18
2.2.3 容错处理19
2.2.4 为什么是Scala 19
2.3 源码阅读环境准备19
2.3.1 源码下载及编译19
2.3.2 源码目录结构21
2.3.3 源码阅读工具21
2.3.4 本章小结22
第3章SparkContext初始化 23
3.1 spark-shell 23
3.2 SparkContext的初始化综述27
3.3 Spark Repl综述30
3.3.1 Scala Repl执行过程31
3.3.2 Spark Repl 32
第4章Spark作业提交 33
4.1 作业提交33
4.2 作业执行38
4.2.1 依赖性分析及Stage划分39
4.2.2 Actor Model和Akka 46
4.2.3 任务的创建和分发47
4.2.4 任务执行53
4.2.5 Checkpoint和Cache 62
4.2.6 WebUI和Metrics 62
4.3 存储机制71
4.3.1 Shuffle结果的写入和读取71
4.3.2 Memory Store 80
4.3.3 存储子模块启动过程分析81
4.3.4 数据写入过程分析82
4.3.5 数据读取过程分析84
4.3.6 TachyonStore 88
第5章部署方式分析 91
5.1 部署模型91
5.2 单机模式local 92
5.3 伪集群部署local-cluster 93
5.4 原生集群Standalone Cluster 95
5.4.1 启动Master 96
5.4.2 启动Worker 97
5.4.3 运行spark-shell 102
5.4.4 容错性分析106
5.5 Spark On YARN 112
5.5.1 YARN的编程模型112
5.5.2 YARN中的作业提交112
5.5.3 Spark On YARN实现详解113
5.5.4 SparkPi on YARN 122
第三部分Spark Lib 129
第6章Spark Streaming 131
6.1 Spark Streaming整体架构131
6.1.1 DStream 132
6.1.2 编程接口133
6.1.3 Streaming WordCount 134
6.2 Spark Streaming执行过程135
6.2.1 StreamingContext初始化过程136
6.2.2 数据接收141
6.2.3 数据处理146
6.2.4 BlockRDD 155
6.3 窗口操作158
6.4 容错性分析159
6.5 Spark Streaming vs. Storm 165
6.5.1 Storm简介165
6.5.2 Storm和Spark Streaming对比168
6.6 应用举例168
6.6.1 搭建Kafka Cluster 168
6.6.2 KafkaWordCount 169
第7章SQL 173
7.1 SQL语句的通用执行过程分析175
7.2 SQL On Spark的实现分析178
7.2.1 SqlParser 178
7.2.2 Analyzer 184
7.2.3 Optimizer 191
7.2.4 SparkPlan 192
7.3 Parquet 文件和JSON数据集196
7.4 Hive简介197
7.4.1 Hive 架构197
7.4.2 HiveQL On MapReduce执行过程分析199
7.5 HiveQL On Spark详解200
7.5.1 Hive On Spark环境搭建206
7.5.2 编译支持Hadoop 2.x的Spark 211
7.5.3 运行Hive On Spark测试用例213
第8章GraphX 215
8.1 GraphX简介215
8.1.1 主要特点216
8.1.2 版本演化216
8.1.3 应用场景217
8.2 分布式图计算处理技术介绍218
8.2.1 属性图218
8.2.2 图数据的存储与分割219
8.3 Pregel计算模型220
8.3.1 BSP 220
8.3.2 像顶点一样思考220
8.4 GraphX图计算框架实现分析223
8.4.1 基本概念223
8.4.2 图的加载与构建226
8.4.3 图数据存储与分割227
8.4.4 操作接口228
8.4.5 Pregel在GraphX中的源码实现230
8.5 PageRank 235
8.5.1 什么是PageRank 235
8.5.2 PageRank核心思想235
第9章MLLib 239
9.1 线性回归239
9.1.1 数据和估计240
9.1.2 线性回归参数求解方法240
9.1.3 正则化245
9.2 线性回归的代码实现246
9.2.1 简单示例246
9.2.2 入口函数train 247
9.2.3 最优化算法optimizer 249
9.2.4 权重更新update 256
9.2.5 结果预测predict 257
9.3 分类算法257
9.3.1 逻辑回归258
9.3.2 支持向量机260
9.4 拟牛顿法261
9.4.1 数学原理261
9.4.2 代码实现265
9.5 MLLib与其他应用模块间的整合268
第四部分附录271
附录A Spark源码调试 273
附录B 源码阅读技巧 283
作者介绍:
作者简介
作者简介许鹏长期致力于电信领域和互联网的软件研发,在数据处理方面积累了大量经验,对系统的可扩展性、可靠性方面进行过深入学习和研究。因此,累积了大量的源码阅读和分析的技巧与方法。目前在杭州同盾科技担任大数据平台架构师一职。对于Linu×内核,作者也曾进行过深入的分析。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
编辑推荐
Spark Contributor,Databricks工程师连城,华为大数据平台开发部部长陈亮,网易杭州研究院副院长汪源,TalkingData首席数据科学家张夏天联袂力荐
1.本书全面、系统地介绍了Spark源码,深入浅出,细致入微
2.提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序
3.始终抓住资源分配、消息传递、容错处理等基本问题,抽丝拨茧
4.一步步寻找答案,所有问题迎刃而解,使读者知其然更知其所以然
书籍介绍
《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。
《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。
《Apache Spark源码剖析》对于Spark应用开发人员及Spark集群管理人员都有极好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。
网站评分
书籍多样性:6分
书籍信息完全性:8分
网站更新速度:5分
使用便利性:5分
书籍清晰度:4分
书籍格式兼容性:4分
是否包含广告:8分
加载速度:7分
安全性:8分
稳定性:9分
搜索功能:6分
下载便捷性:6分
下载点评
- 小说多(554+)
- 差评少(512+)
- 体验满分(406+)
- 体验好(337+)
- 书籍多(79+)
- 简单(599+)
- 好评多(141+)
下载评价
- 网友 焦***山:
不错。。。。。
- 网友 石***烟:
还可以吧,毕竟也是要成本的,付费应该的,更何况下载速度还挺快的
- 网友 后***之:
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
- 网友 宫***凡:
一般般,只能说收费的比免费的强不少。
- 网友 濮***彤:
好棒啊!图书很全
- 网友 曾***文:
五星好评哦
- 网友 利***巧:
差评。这个是收费的
- 网友 芮***枫:
有点意思的网站,赞一个真心好好好 哈哈
- 网友 田***珊:
可以就是有些书搜不到
- 网友 瞿***香:
非常好就是加载有点儿慢。
- 网友 谭***然:
如果不要钱就好了
- 网友 石***致:
挺实用的,给个赞!希望越来越好,一直支持。
- 网友 寿***芳:
可以在线转化哦
- 网友 游***钰:
用了才知道好用,推荐!太好用了
喜欢"Apache Spark源码剖析( 货号:712125420)"的人也看了
中公版·2017社区工作者公开招聘考试专用教材:一本通 下载 网盘 kindle mobi 115盘 pdf pdb rtf
二十四节气 彩图注音版 一年级阅读课外书阅读二年级课外阅读书籍带拼音读物岁以上儿童书就是二十四节气全套绘本故事 下载 网盘 kindle mobi 115盘 pdf pdb rtf
我在MINECRAFT建城市 下载 网盘 kindle mobi 115盘 pdf pdb rtf
直击难点:施工合同全过程法律实务解析 下载 网盘 kindle mobi 115盘 pdf pdb rtf
现拍现发地理信息系统概论第3版随机发【放心购买 无忧售后】 下载 网盘 kindle mobi 115盘 pdf pdb rtf
山西行知书(修订版) 下载 网盘 kindle mobi 115盘 pdf pdb rtf
星空 下载 网盘 kindle mobi 115盘 pdf pdb rtf
【预订】The Many Mice of Mr. Brice 下载 网盘 kindle mobi 115盘 pdf pdb rtf
全国计算机等级考试 下载 网盘 kindle mobi 115盘 pdf pdb rtf
死屋手记 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 意林 感动卷·花朝月夕(朝读意林美文,生活花香四溢; 夕赏名家妙笔,篇篇感动月光。)一则故事 改 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 森林鱼童书·宝宝情绪引导绘本:奇奇的颜色游戏 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 地下工程热湿理论与应用 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- AutoCAD2018中文版从入门到精通(附光盘适用于AutoCAD201820172016-2014版本移动学习 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 湿疹·神经性皮炎·荨麻疹——名医门诊丛书 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 奇妙的汽车故事书全10册 3-6岁巡逻的警车挖掘机消防车工程车汽车图书 幼儿园宝宝车车认知大画书 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 经济法(第二版) 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 幕墙制作工 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 墨点字帖 楷书入门基本笔画 楷体正楷荆霄鹏硬笔书法教程临摹蒙练字帖成人公务员中小学生考试速成楷书钢笔新华书店正版书籍 下载 网盘 kindle mobi 115盘 pdf pdb rtf
- 员工之过与银行之责:银行从业人员必须远离的50个法律禁区 下载 网盘 kindle mobi 115盘 pdf pdb rtf
书籍真实打分
故事情节:4分
人物塑造:7分
主题深度:7分
文字风格:4分
语言运用:3分
文笔流畅:7分
思想传递:3分
知识深度:6分
知识广度:7分
实用性:3分
章节划分:5分
结构布局:6分
新颖与独特:4分
情感共鸣:6分
引人入胜:3分
现实相关:8分
沉浸感:9分
事实准确性:4分
文化贡献:4分