ODPS权威指南:阿里大数据平台应用开发实践(异步图书出品)

售价 降价通知
市场价 ¥93.41
会员等级价格
  • 上架时间
    2022-04-17
  • 累积评价0人评价

  • 累计销量

  • 赠送积分66

  • 数量
    减少数量 增加数量   有货
平台自营
商家名称:
标准查询网
客服邮件:
2591325828@qq.com
客服电话:
010-62993931
在线客服:
QQ

扫一扫,手机访问微商城

推荐精品

同类品牌

最近上新

  • 商品名称:ODPS权威指南:阿里大数据平台应用开发实践(异步图书出品)
  • 商品编号:11589255
  • 品牌:
  • 上架时间:2022-04-17
作者简介:
  李妹芳,阿里数据平台事业部工程师,曾译有《Linux系统编程》、《数据之美》、《数据可视化之美》等书
内容简介:
  ODPS(Open Data Processing Service)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场。
  本书是学习和掌握ODPS的专业指南,作者来自阿里ODPS团队。全书共13章,主要内容包括:ODPS入门、整体架构、数据通道、MapReduce编程、SQL查询分析、安全,以及基于真实数据的各种场景分析实战。本书基于很多范例解析,通过在各种应用场景下的示例来说明如何通过ODPS完成各种需求,以期引导读者从零开始轻松掌握和使用ODPS。同时,本书不局限于示例分析,也致力于提供更多关于大数据处理的编程思想和经验分享。书中所有示例代码都可以在作者提供的网站上免费下载。
  本书适合想要了解和使用ODPS的读者阅读学习,对于从事大数据存储和应用以及分布式计算的专业人士来说,也是很好的参考资料。

目录:
前言
第1章 ODPS概述
1.1 引言
1.2 初识ODPS
1.2.1 背景和挑战
1.2.2 为什么做ODPS
1.2.3 ODPS是什么
1.2.4 ODPS做什么
1.3 基本概念
1.3.1 账号(Account)
1.3.2 项目空间(Project)
1.3.3 表(Table)
1.3.4 分区(Partition)
1.3.5 任务(Task)、作业(Job)和作业实例(Instance)
1.3.6 资源(Resource)
1.4 应用开发模式
1.4.1 RESTful API
1.4.2 ODPS SDK
1.4.3 ODPS CLT
1.4.4 管理控制台
1.4.5 IDE
1.5 一些典型场景
1.5.1 阿里金融数据仓库
1.5.2 CNZZ数据仓库
1.5.3 支付宝账号影响力圈
1.5.4 阿里金融水文衍生算法
1.5.5 阿里妈妈广告CTR预估
1.6 现状和前景
1.7 小结
第2章 ODPS入门
2.1 准备工作
2.1.1 创建云账号
2.1.2 开通ODPS服务
2.2 使用管理控制台
2.3 配置ODPS客户端
2.3.1 下载和配置CLT
2.3.2 准备dual表
2.3.3 CLT运行模式
2.3.4 下载和配置dship
2.3.5 通过dship上传下载数据
2.4 网站日志分析实例
2.4.1 场景和数据说明
2.4.2 需求分析
2.4.3 数据准备
2.4.4 创建表并添加分区
2.4.5 数据解析和导入
2.4.6 数据加工
2.4.7 数据分析
2.4.8 自动化运行
2.4.9 应用数据集市
2.4.10 结果导出
2.4.11 结果展现
2.4.12 删除数据
2.5 小结
第3章 收集海量数据
3.1 DSHIP工具
3.2 收集WEB日志
3.2.1 场景和需求说明
3.2.2 问题分析和设计
3.2.3 实现说明
3.2.4 进一步探讨
3.2.5 为什么这么难
3.3 MYSQL数据同步到ODPS
3.3.1 场景和需求说明
3.3.2 问题分析和实现
3.3.3 进一步探讨
3.4 下载结果表
3.5 小结
第4章 使用SQL处理海量数据
4.1 ODPS SQL是什么
4.2 入门示例
4.2.1 场景说明
4.2.2 简单的DDL操作
4.2.3 生成数据
4.2.4 单表查询
4.2.5 多表连接JOIN
4.2.6 高级查询
4.2.7 多表关联UNION ALL
4.2.8 多路输出(MULTI-INSERT)
4.3 网站日志分析
4.3.1 准备数据和表
4.3.2 维度表
4.3.3 访问路径分析
4.3.4 TopK查询
4.3.5 IP黑名单
4.4 天猫品牌预测
4.4.1 主题说明和前期准备
4.4.2 理解数据
4.4.3 两个简单的实践
4.4.4 问题分析和算法设计
4.4.5 生成特征
4.4.6 抽取正负样本
4.4.7 生成模型
4.4.8 验证模型
4.4.9 预测结果
4.4.10 进一步探讨
4.5 小结
第5章 SQL进阶
5.1 UDF是什么
5.2 入门示例
5.3 实际应用案例
5.3.1 URL解码
5.3.2 简单的LBS应用
5.3.3 网站访问日志UserAgent解析
5.4 SQL实现原理
5.4.1 词法分析
5.4.2 语法分析
5.4.3 逻辑分析
5.4.4 物理分析
5.5 SQL调优
5.5.1 数据倾斜
5.5.2 一些优化建议
5.5.3 一些注意事项
5.6 小结
第6章 通过TUNNEL迁移数据
6.1 ODPS TUNNEL 是什么
6.2 入门示例
6.2.1 下载和配置
6.2.2 准备数据
6.2.3 上传数据
6.2.4 下载数据
6.3 TUNNEL原理
6.3.1 数据如何传输
6.3.2 客户端和服务端如何交互
6.3.3 如何实现高并发
6.4 从HADOOP迁移到ODPS
6.4.1 问题分析
6.4.2 客户端实现和分析
6.4.3 Mapper实现和分析
6.4.4 编译和运行
6.4.5 进一步探讨
6.5 一些注意点
6.6 小结
第7章 使用MAPREDUCE处理数据
7.1 MAPREDUCE编程模型
7.2 MAPREDUCE应用场景
7.3 初识ODPS MAPREDUCE
7.4 入门示例
7.4.1 准备工作
7.4.2 问题分析
7.4.3 代码实现和分析
7.4.4 运行和输出分析
7.4.5 扩展:使用Combiner?
7.5 TOPK查询
7.5.1 场景和数据说明
7.5.2 问题分析
7.5.3 具体实现分析
7.5.4 运行和结果输出
7.5.5 扩展:忽略Stop Words
7.5.6 扩展:数据和任务统计
7.5.7 扩展: MR2模型
7.6 SQL和MAPREDUCE,用哪个?
7.7 小结
第8章 MAPREDUCE进阶
8.1 再谈SHUFFLE & SORT
8.2 好友推荐
8.2.1 场景和数据说明
8.2.2 问题定义和分析
8.2.3 代码实现
8.3 LBS应用探讨:周边定位
8.3.1 场景和数据说明
8.3.2 问题定义和分析
8.3.3 代码实现和分析
8.3.4 运行和测试
8.4 MAPREDUCE调试
8.4.1 带bug的代码
8.4.2 通过本地模式调试
8.4.3 通过Counter调试
8.4.4 通过log调试
8.5 一些注意点
8.6 小结
第9章 机器学习算法
9.1 初识ODPS算法
9.2 入门示例
9.2.1 通过CLT统计分析
9.2.2 通过XLab统计分析
9.3 几个经典的算法
9.3.1 逻辑回归
9.3.2 随机森林
9.4 天猫品牌预测
9.4.1 逻辑回归
9.4.2 随机森林
9.4.3 脚本实现和自动化
9.4.4 进一步探讨
9.5 小结
第10章 使用SDK访问ODPS服务
10.1 主要的PACKAGE和接口
10.1.1 主要的Package
10.1.2 核心接口
10.2 入门示例
10.3 基于ECLIPSE插件开发
10.4 小结
第11章 ODPS账号、资源和数据管理
11.1 权限管理
11.1.1 账号授权
11.1.2 角色(Role)授权
11.1.3 ACL授权特点
11.1.4 简单的Policy授权
11.1.5 Role Policy
11.1.6 ACL授权和Policy授权小结
11.2 资源管理
11.2.1 Project内的资源管理
11.2.2 跨Project的资源共享
11.3 数据管理
11.3.1 表生命周期
11.3.2 数据归并(Merge)
11.3.3 数据保护(Project Protection)
11.4 小结
第12章 深入了解ODPS
12.1 体系架构
12.1.1 客户端
12.1.2 接入层
12.1.3 逻辑层
12.1.4 存储/计算层
12.2 执行流程
12.2.1 提交作业
12.2.2 运行作业
12.2.3 查询作业状态
12.2.4 执行逻辑图
12.3 底层数据存储
12.3.1 CFILE是什么
12.3.2 CFILE逻辑结构
12.4 内聚式框架
12.4.1 元数据
12.4.2 运维管理
12.4.3 多控制集群和多计算集群
12.5 跨集群复制
12.5.1 数据迁移
12.5.2 跨集群同步
12.6 小结
第13章 探索ODPS之美
13.1 R语言数据探索
13.1.1 安装和配置
13.1.2 一些基本操作
13.1.3 分析建模
13.2 实时流计算
13.3 图计算模型
13.4 准实时SQL
13.5 机器学习平台
附录一 ODPS消息认证机制
后记

商品评价
  • 0%

    好评度

  • 好评(0%)
    中评(0%)
    差评(0%)
  • 全部评价(0)
  • 好评(0)
  • 中评(0)
  • 差评(0)
  • 用户晒单(0)
售后保障
售前服务电话:010-62993931
售后服务电话:010-62993931
本商城向您保证所售商品均为正品行货。本商城还为您提供具有竞争力的商品价格和运费政策,请您放心购买!

注:因厂家会在没有任何提前通知的情况下更改产品包装、产地或者一些附件,本司不能确保客户收到的货物与商城图片、产地、附件说明完全一致。只能确保为原厂正货!若本商城没有及时更新,请大家谅解!
权利声明:
本商城上的所有商品信息、客户评价、商品咨询、网友讨论等内容,是标准查询网重要的经营资源,未经许可,禁止非法转载使用。

注:本站商品信息均来自于厂商,其真实性、准确性和合法性由信息拥有者(厂商)负责。本站不提供任何保证,并不承担任何法律责任。

常见问题
下单后可以修改订单吗?

由本网站发货的订单,在订单发货之前可以修改,打开“订单详情”页面,若已经出现物流信息,则表示订单无法修改。

无货商品几天可以到货?

您可以通过以下方法获取商品的到货时间:若商品页面中,显示“无货”时:商品具体的到货时间是无法确定的,您可以通过商品页面的“到货通知”功能获得商品到货提醒。

订单如何取消?

如订单处于暂停状态,进入“我的订单"页面,找到要取消的订单,点击“取消订单”按钮,若已经有物流信息,则不能取消订单。

可以开发票吗?

本网站所售商品都是正品行货,均开具正规发票(图书商品用户自由选择是否开发票),发票金额含配送费金额,另有说明的除外。

如何联系商家?

在商品页面右则,您可以看到卖家信息,点击“联系客服”按钮,咨询卖家的在线客服人员,您也可以直接致电。

收到的商品少了/发错了怎么办?

同个订单购买多个商品可能会分为一个以上包裹发出,可能不会同时送达,建议您耐心等待1-2天,如未收到,本网站自营商品可直接联系标准查询网在线客服。

如何申请退货/换货?

登陆网站,进入“我的订单”,点击客户服务下的返修/退换货或商品右则的申请返修/退换货,出现返修及退换货首页,点击“申请”即可操作退换货及返修,提交成功后请耐心等待,由专业的售后工作人员受理您的申请。

退/换货需要多长时间?

一般情况下,退货处理周期(不包含检测时间):自接收到问题商品之日起 7 日之内为您处理完成,各支付方式退款时间请点击查阅退款多久可以到账;
换货处理周期:自接收到问题商品之日起 15 日之内为您处理完成。

温馨提示

确定取消
温馨提示

关闭
您尚未登录

用户登陆

立即注册
忘记密码?