【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效

【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效 下载 mobi epub pdf 电子书 2024


简体网页||繁体网页

下载链接在页面底部
点击这里下载
    


想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

发表于2024-11-24

图书介绍


店铺: 学贯中西图书专营店
ISBN:9787111463115
商品编码:26870147407
丛书名: Spark快速数据处理
出版时间:2014-04-01


类似图书 点击查看全场最低价

相关图书





图书描述

机工 spark快数数据处理
            定价 29.00
出版社 机械工业出版社
版次 1版1次印刷
出版时间 2014年05月
开本 大32开
作者 (美)凯洛 著,余璜 张磊 译
装帧 平装
页数 114
字数 ---
ISBN编码 9787111463115

Spark是个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。

本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置个Spark集群,如何在交互模式下运行个Spark作业,如何在Spark集群上构建个生产级的脱机/独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。

译者序
作者简介
前言
1章 安装Spark以及构建Spark集群
1.1 单机运行Spark
1.2 在EC2上运行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通过SSH部署集群
1.8 链接和参考
1.9 小结
2章 Sparkshell的使用
2.1 加载个简单的text文件
2.2 用Sparkshell运行逻辑回归
2.3 交互式地从S3加载数据
2.4 小结
3章 构建并运行Spark应用
3.1 用sbt构建Spark作业
3.2 用Maven构建Spark作业
3.3 用其他工具构建Spark作业
3.4 小结
4章 创建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 链接和参考
4.6 小结
5章 加载与保存数据
5.1 RDD
5.2 加载数据到RDD中
5.3 保存数据
5.4 连接和参考
5.5 小结
6章 操作RDD
6.1 用Scala和Java操作RDD
【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效 下载 mobi epub pdf txt 电子书 格式


【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效 mobi 下载 pdf 下载 pub 下载 txt 电子书 下载 2024

【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效 下载 mobi pdf epub txt 电子书 格式 2024

【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效 下载 mobi epub pdf 电子书
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

用户评价

评分

评分

评分

评分

评分

评分

评分

评分

评分

类似图书 点击查看全场最低价

【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效 mobi epub pdf txt 电子书 格式下载 2024


分享链接




相关图书


本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

友情链接

© 2024 book.cndgn.com All Rights Reserved. 新城书站 版权所有