Microsoft Azure机器学习和预测分析

Microsoft Azure机器学习和预测分析 pdf epub mobi txt 电子书 下载 2025

[[美] ]Roger,Barga,巴尔加,[美] Valentine,Fontama ... 著,李永伦 译
图书标签:
  • Azure机器学习
  • 机器学习
  • 预测分析
  • 数据科学
  • Python
  • R
  • 云计算
  • 人工智能
  • 数据挖掘
  • 模型构建
想要找书就要到 新城书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 人民邮电出版社
ISBN:9787115458483
版次:01
商品编码:12232996
包装:平装
开本:16开
出版时间:2017-08-01
页数:190
正文语种:中文

具体描述

编辑推荐

本书是数据科学和机器学习领域的实用教程,专注于构建和部署预测模型,力图帮助你学习如何使用新的微软Azure Machine Learning快速构建和部署复杂的预测模型。

本书全面介绍2015年发布的微软Azure Machine Learning服务,包含构建推荐器、倾向模型以及流失和预见性维护模型的实用指南。本书使用面向任务的描述和具体的端到端示例,确保读者能够快速上手。本书讲述了Azure Machine Learning的各个方面,从数据入口到应用机器学习、评估模型以及把它们部署成Web服务。

书中新增以下精彩内容
● Cortana分析套件;
● Python整合;
● 数据准备和特征选择;
● 使用Power BI的数据可视化;
● 推荐引擎;
● 在Azure市场上销售你的模型。

通过阅读本书,你将能够
● 系统地了解数据科学及其zui佳实践;
● 了解新的微软Azure Machine Learning服务,掌握高效构建和部署预测模型的实用技能,例如,
如何解决倾向建模、流失分析、产品推荐和使用Power BI进行可视化等典型预测分析问题;
● 在Azure市场上销售你的预测模型的实用指南。

内容简介

近年来,机器学习领域受到越来越多的关注,相关的机器学习算法开始成为热点。
本书专门介绍了有关机器学习的内容,全书共分3部分:第1部分是数据科学和Microsoft Azure Machine Learning导论,介绍了数据科学和Microsoft Azure Machine Learning的基本知识以及需要用到的语言的基本知识;第二部分是统计学和机器学习算法,系统地讲解了统计学和机器学习的相关算法;第三部分是实用应用程序,这一部分介绍了新的微软Azure机器学习服务,讲解如何高效构建和部署预测模型,还讲解了如何解决倾向建模、产品推荐等实用技能。
本书可供数据科学、商业分析和商业智能领域的开发人员,对机器学习感兴趣的开发者阅读。

作者简介

Roger Barga是***Web服务的总经理和开发总监。在加入***之前,Roger是微软的云与企业部门的云机器学习组的产品组程序经理,他的团队负责Azure机器学习服务的产品管理。Roger于1997年加入微软,在微软研究院的数据库产品组里担任研究员,他领导数据库、工作流和流处理系统的系统研究和产品开发。他提出了从基础研究,通过原型验证概念,到产品组孵化的设想。在加入微软之前,Roger是Pacific Northwest National Laboratory的机器学习组的研究科学家,他构建和部署基于机器学习的解决方案。Roger还是华盛顿大学的助理教授,他是数据科学和机器学习课程的讲师。
Roger拥有计算机科学的博士学位(PhD),专攻机器学习。从1991年到2013年,他发表了超过90份同行评审的技术论文和专书论文,和214个合著者共事,有1084个作者超过700个引述。
Valentine Fontama是微软Cloud & Enterprise Analytics and Insights产品组的数据科学家经理。Val在数据科学和业务上有着超过18年的经验。在获得人工神经网络的博士学位之后,他把数据挖掘应用到环境科学和信用行业。在加入微软之前,Val是伦敦Equifax的新技术咨询师,他zui先提倡把数据挖掘应用到消费信用行业的风险评估和市场营销。他目前是华盛顿大学的数据科学助理教授。
他之前在微软的职位是Data and Decision Sciences Group(DDSG)的主要数据科学家,为微软客户(包括ThyssenKrupp和Dell)提供外部咨询。在那之前,他是一个资-深产品营销经理,负责云的大数据和预测分析以及企业营销。在这个角色里,他负责微软Azure机器学习的产品管理;HDInsight,微软的首-个Hadoop服务;Parallel Data Warehouse,微软的首-个数据仓库工具;Fast Track Data Warehouse的3个版本发布。
Val拥有沃顿商学院的战略管理和市场营销的MBA学位,拥有神经网络的博士学位,拥有计算方面的硕士学位,拥有数学和电子的学士学位(获得一等荣誉)。他合著了《Introducing Microsoft Azure HDInsight》一书,发表过11份学术论文,有超过227个作者152个引述。

Wee-Hyong Tok是微软公司云与企业组的信息管理和机器学习(IMML)团队的资-深程序经理。Wee-Hyong带来了数十年跨行业和学术的数据库系统经验。
在获得博士学位之前,Wee-Hyong是新加坡一个大型电信公司的系统分析师。Wee-Hyong是SQL Server方向的zui有价值专家(MVP),专注于商业智能和数据挖掘领域。他率先在东南亚开展数据挖掘训练营,为IT专家带来知识和技术,使他们可以在他们的组织里使用分析工具把原始数据转成洞察。
他加入微软并在SQL Server团队里工作,负责塑造SSIS Server,并在SQL Server 2012里把它从概念变成实现。
Wee-Hyong拥有新加坡国立大学的计算机科学的博士学位和计算方面的硕士学位(获得一等荣誉)。他发表过21篇同行评审的学术论文和期刊文章。他是以下书籍的合著者:《Predictive Analytics with Microsoft Azure Machine Learning》《Introducing Microsoft Azure HDInsight》和《Microsoft SQL Server 2012 Integration Services》。

目录

目 录





第1部分 数据科学和Microsoft Azure Machine Learning导论
第1章 数据科学导论 3
1.1 数据科学是什么 3
1.2 分析频谱 4
1.2.1 描述性分析 4
1.2.2 诊断性分析 5
1.2.3 预测性分析 5
1.2.4 规定性分析 5
1.3 为何重要,为何现在 6
1.3.1 把数据看作竞争资产 6
1.3.2 客户需求的增长 6
1.3.3 对数据挖掘技术认识的提高 7
1.3.4 访问更多数据 7
1.3.5 更快、更廉价的处理能力 7
1.3.6 数据科学流程 8
1.4 常见数据科学技术 10
1.4.1 分类算法 10
1.4.2 聚类算法 11
1.4.3 回归算法 12
1.4.4 模拟 12
1.4.5 内容分析 12
1.4.6 推荐引擎 13
1.5 数据科学的前沿 13
1.6 小结 14
第2章 Microsoft Azure Machine
Learning导论 15
2.1 你好,Machine Learning Studio 15
2.2 实验的组件 16
2.3 Gallery简介 17
2.4 创建训练实验的5个简单步骤 18
2.4.1 第1步:获取数据 19
2.4.2 第2步:预处理数据 20
2.4.3 第3步:定义特征 22
2.4.4 第4步:选择和应用学习
算法 23
2.4.5 第5步:在新数据之上做
预测 24
2.5 在生产环境里部署你的模型 26
2.5.1 创建预测实验 26
2.5.2 把你的实验发布成Web
服务 28
2.5.3 访问Azure Machine Learning的
Web服务 28
2.6 小结 30
第3章 数据准备 31
3.1 数据清理和处理 31
3.1.1 了解你的数据 32
3.1.2 缺失值和空值 37
3.1.3 处理重复记录 38
3.1.4 识别并移除离群值 39
3.1.5 特征归一化 40
3.1.6 处理类别不均 41
3.2 特征选择 43
3.3 特征工程 46
3.3.1 分装数据 48
3.3.2 维度灾难 50
3.4 小结 53
第4章 整合R 54
4.1 R概览 54
4.2 构建和部署你的首个R脚本 56
4.3 使用R进行数据预处理 59
4.4 使用脚本包(ZIP) 61
4.5 使用R构建和部署决策树 64
4.6 小结 68
第5章 整合Python 69
5.1 概览 69
5.2 Python快速上手 70
5.3 在Azure ML实验里使用Python 71
5.4 使用Python进行数据预处理 76
5.4.1 使用Python合并数据 76
5.4.2 使用Python处理缺失值 79
5.4.3 使用Python进行特征选择 80
5.4.4 在Azure ML实验里运行
Python代码 82
5.5 小结 86
第2部分 统计学和机器学习算法
第6章 统计学和机器学习算法概览 89
6.1 回归算法 89
6.1.1 线性回归 89
6.1.2 神经网络 90
6.1.3 决策树 92
6.1.4 提升决策树 93
6.2 分类算法 94
6.2.1 支持向量机 95
6.2.2 贝叶斯点机 96
6.3 聚类算法 97
6.4 小结 99
第3部分 实用应用程序
第7章 构建客户倾向模型 103
7.1 业务问题 103
7.2 数据获取和准备 104
7.3 训练模型 109
7.4 模型测试和验证 111
7.5 模型的性能 112
7.6 确定评估指标的优先级 115
7.7 小结 116
第8章 使用Power BI可视化你的
模型 117
8.1 概览 117
8.2 Power BI简介 117
8.3 使用Power BI可视化的三种
方案 119
8.4 在Azure Machine Learning里给你的
数据评分,并在Excel里可视化 120
8.5 在Excel里评分并可视化你的
数据 123
8.6 在Azure Machine Learning里给你的
数据评分,并在powerbi.com里
可视化 124
8.6.1 加载数据 125
8.6.2 构建你的仪表板 125
8.7 小结 127
第9章 构建流失模型 128
9.1 流失模型概览 128
9.2 构建和部署客户流失模型 129
9.2.1 准备和了解数据 129
9.2.2 数据预处理和特征选择 132
9.2.3 用于预测流失的分类模型 135
9.2.4 评估客户流失模型的性能 137
9.3 小结 138
第10章 客户细分模型 139
10.1 客户细分模型概览 139
10.2 构建和部署你的第一个K均值聚
类模型 140
10.2.1 特征散列 142
10.2.2 找出合适的特征 142
10.2.3 K均值聚类算法的属性 144
10.3 批发客户的客户细分 145
10.3.1 从UCI机器学习库加载
数据 145
10.3.2 使用K均值聚类算法进行批发
客户细分 146
10.3.3 新数据的聚类分配 147
10.4 小结 148
第11章 构建预见性维护模型 149
11.1 概览 149
11.2 预见性维护场景 150
11.3 业务问题 150
11.4 数据获取和准备 151
11.4.1 数据集 151
11.4.2 数据加载 151
11.4.3 数据分析 151
11.5 训练模型 154
11.6 模型测试和验证 155
11.7 模型性能 156
11.8 改善模型的技术 158
11.9 模型部署 161
11.9.1 创建预测实验 161
11.9.2 把你的实验部署成Web
服务 162
11.10 小结 163
第12章 推荐系统 164
12.1 概览 164
12.2 推荐系统的方案和场景 164

12.3 业务问题 165
12.4 数据获取和准备 166
12.5 训练模型 170
12.6 模型测试和验证 171
12.7 小结 175
第13章 使用和发布Azure Marketplace
上的模型 176
13.1 什么是机器学习API 176
13.2 如何使用Azure Marketplace的
API 178
13.3 在Azure Marketplace里发布你
自己的模型 182
13.4 为你的机器学习模型创建和
发布Web服务 182
13.4.1 创建评分实验 183
13.4.2 把你的实验发布成Web
服务 183
13.5 获取API密钥和OData端点
信息 184
13.6 把你的模型发布为Azure
Marketplace里的API 184
13.7 小结 186
第14章 Cortana分析 187
14.1 Cortana分析套件是什么 187
14.2 Cortana分析套件的功能 187
14.3 示例场景 189
14.4 小结 190
《数据驱动的洞察:解锁业务潜能的智能之路》 在当今信息爆炸的时代,数据已成为企业最宝贵的资产之一。然而,仅仅拥有海量数据远远不够,如何从中提炼出有价值的洞察,并将其转化为切实可行的业务策略,才是决定企业能否在激烈竞争中脱颖而出的关键。本书《数据驱动的洞察:解锁业务潜能的智能之路》将带您踏上一段探索数据奥秘、掌握智能决策的旅程。 本书并非一本技术手册,也非一本枯燥的理论著作。它是一本面向所有渴望利用数据提升业务表现的管理者、决策者、产品经理、市场分析师乃至对数据科学感兴趣的初学者的实践指南。我们深知,在信息技术日新月异的今天,许多专业工具和平台层出不穷,但归根结底,驱动业务增长的核心是清晰的思维、敏锐的洞察以及将洞察转化为行动的能力。本书的目标正是帮助您构建这种能力,让数据成为您最得力的助手。 核心理念:从数据到决策,再到行动 本书的核心理念围绕着一个清晰而强大的流程展开:从数据中发现价值,将价值转化为洞察,再依据洞察做出明智的决策,最终将决策转化为成功的业务行动。 我们将逐步剖析这个流程的每一个环节,并提供具体的方法和思路。 数据发现: 我们将首先探讨如何有效地识别、收集和整理与您的业务目标相关的数据。这不仅仅是技术层面的数据收集,更是策略层面的数据规划。您将学习如何从不同的数据源(如交易记录、用户行为、市场调研、社交媒体反馈等)中挖掘出潜在的信息宝藏。我们会强调数据质量的重要性,以及如何通过数据清洗和预处理来确保后续分析的准确性。 价值提炼: 这一环节将聚焦于如何从原始数据中“提炼”出有意义的“价值”。这需要我们摆脱海量数据的迷惑,找到那些真正能够反映业务状况、揭示用户需求、预测市场趋势的关键指标和模式。我们将介绍各种数据分析的思维模式,例如趋势分析、关联分析、用户画像构建等,帮助您理解不同类型的数据可以揭示哪些不同的价值。 洞察形成: 价值的提炼最终是为了形成具有可操作性的“洞察”。洞察是比数据更有深度的理解,它能够解释“为什么”会发生,并预示“接下来”可能发生什么。本书将引导您学习如何从数据中解读出背后的故事,识别出隐藏的机遇和风险。我们不会仅仅停留在“看到了什么”,而是深入探讨“看到了什么意味着什么”,以及“我们应该怎么做”。 决策制定: 拥有了清晰的洞察,接下来就是如何基于这些洞察做出最佳的业务决策。我们将讨论如何将数据洞察与您的业务目标、资源限制以及风险承受能力相结合,做出科学、理性且具有前瞻性的决策。这包括如何评估不同决策方案的可能性和潜在影响,以及如何建立一个支持数据驱动决策的组织文化。 行动落地: 最重要的一步是将决策转化为切实的行动。本书将强调如何将数据驱动的洞察和决策有效地传达给执行团队,并建立有效的执行和监控机制。您将学习如何设定可衡量的目标,跟踪行动的进展,并根据反馈不断优化策略。 内容亮点:实用、可操作、启发性 本书的内容设计将注重以下几个方面: 案例驱动: 我们相信,最有效的学习方式是通过真实的案例。本书将穿插大量来自不同行业的真实商业案例,涵盖从零售、电商、金融到医疗、制造业等多个领域。通过对这些案例的深入剖析,您将看到数据驱动的洞察是如何在实践中解决实际业务问题的,从而获得生动的启发。 方法论与框架: 为了让您掌握系统性的思考方式,本书将为您提供一系列实用的分析方法论和决策框架。这些工具将帮助您系统地梳理问题、分析数据、得出结论,并指导您做出更优的决策。我们不会提供过多的技术细节,而是侧重于您可以理解和应用的逻辑框架。 思维模式的培养: 相比于具体的工具,本书更侧重于培养您的“数据思维”和“商业洞察力”。您将学习如何以数据为起点,跳出固有的思维定势,用更广阔的视角审视业务挑战,并从中发现新的增长点。我们将引导您学会提问、质疑和探索,不断挑战和优化您的理解。 跨职能沟通: 在许多企业中,数据分析师、业务部门和高层管理者之间的沟通往往存在壁垒。本书将为您提供有效的沟通策略,帮助您将复杂的数据分析结果转化为业务部门和决策者易于理解和接受的语言,促进跨职能团队的协作,实现数据价值的最大化。 未来趋势展望: 随着人工智能、机器学习等技术的不断发展,数据驱动的决策将变得更加强大和普及。本书也将为您展望未来的发展趋势,帮助您了解新的技术如何能够进一步赋能您的业务,以及如何为未来的挑战做好准备。 适用人群: 企业管理者和高层决策者: 希望了解如何利用数据提升企业整体竞争力,做出更明智的战略决策。 产品经理和市场营销人员: 渴望通过数据洞察了解用户需求,优化产品策略,制定更有效的营销方案。 业务分析师和数据分析初学者: 希望系统学习数据分析的思维模式和方法,将其应用于实际业务场景。 创业者和小型企业主: 想要在有限的资源下,最大化地利用数据来指导业务发展,实现增长。 任何对数据驱动的业务增长感兴趣的读者: 无论您是否具备技术背景,只要您对如何用数据解决实际问题充满好奇,本书都将为您打开一扇新的大门。 本书带来的改变: 阅读本书,您将不仅仅是获取知识,更是获得一种新的工作方式和思维模式。您将学会: 更敏锐地发现业务机会: 从海量数据中识别出潜在的增长点和未被满足的用户需求。 更精准地预测业务趋势: 预判市场变化,提前布局,规避风险。 更有效地优化业务流程: 通过数据分析找到瓶颈,提升运营效率。 更具说服力地支持您的决策: 用数据说话,让您的决策更具科学性和可信度。 更深入地理解您的客户: 构建精细化的用户画像,提供个性化的产品和服务。 《数据驱动的洞察:解锁业务潜能的智能之路》是一本致力于为您赋能的书籍。我们相信,通过掌握数据背后的力量,您可以更自信、更高效地引领您的业务走向成功。让我们一起,用数据点亮前行的道路,解锁无限的业务潜能。

用户评价

评分

深入Azure机器学习:从理论到实践的实战指南 这本书的精髓在于其对Azure机器学习和预测分析的深度剖析,每一章都仿佛是一次精心的技术揭秘。作者并没有止步于概念的讲解,而是将理论知识与Azure平台上的实际操作紧密结合。我惊叹于其对各种算法和模型的详细阐述,从基础的线性回归到复杂的深度学习网络,书中都提供了清晰易懂的解释,并配以Azure机器学习工作室中的具体操作步骤。这使得我能够跟随书中的指导,一步步地构建自己的模型,并在真实的数据集上进行训练和评估。书中大量的代码示例和截图,更是让学习过程变得生动且具有可操作性。我能够清晰地看到每一个参数的含义,每一个函数的用途,以及模型输出的解读。这种“手把手”的教学方式,极大地降低了学习门槛,让我在实践中不断加深对理论知识的理解。更重要的是,作者并没有回避实际开发中可能遇到的挑战,而是提供了解决这些问题的策略和建议。例如,在数据预处理章节,书中详细讨论了如何处理缺失值、异常值以及如何进行特征工程,这些都是构建高质量模型的关键步骤。读完这一部分,我感觉自己仿佛获得了一套完整的工具箱,能够自信地应对各种数据分析和建模的难题。

评分

从入门到精通:Azure机器学习的全面进阶之路 当我合上这本书,心中充满了对Microsoft Azure机器学习和预测分析的深刻理解和无限的信心。它不仅仅是一本技术手册,更像是一次精心设计的学习之旅,从最基础的概念一直延伸到最前沿的应用。我尤其赞赏作者循序渐进的教学方法,它能够引导初学者从零开始,逐步掌握复杂的机器学习技术,同时也能帮助有经验的从业者发现新的视角和更优的解决方案。书中对Azure平台各个服务的介绍,既深入又实用,让我能够清晰地理解如何在实际项目中应用这些工具。我被书中关于模型评估、性能优化以及如何处理现实世界数据中的挑战的详细讲解所启发。它让我明白,构建一个成功的机器学习模型,不仅需要扎实的理论基础,还需要丰富的实践经验和对细节的关注。这本书的结尾部分,更着眼于机器学习的未来趋势和最佳实践,为我指明了继续学习和探索的方向。它鼓励我不断尝试新的技术,不断挑战自己的极限,并在实际工作中不断磨练自己的技能。我感觉自己已经准备好,能够自信地利用Azure的力量,去解决更复杂的数据问题,去创造更具创新性的解决方案。这本书,无疑是我在Azure机器学习领域学习道路上的一个重要里程碑。

评分

预测分析的艺术:洞察数据的未来趋势 当我深入到书中关于预测分析的部分,我意识到这本书不仅仅是关于技术,更是关于如何从数据中提炼出有价值的洞察,并预测未来的走向。作者将预测分析的艺术性与科学性完美结合,引导读者理解如何构建能够准确预测未来事件的模型。书中关于时间序列分析的章节尤为精彩,它不仅解释了ARIMA、LSTM等经典模型,还详细介绍了如何在Azure Databricks等平台上实现这些模型。我被书中对不同预测场景的分析所吸引,例如如何预测销售额、股票价格,甚至客户流失。作者通过具体的案例分析,展示了如何选择合适的模型,如何调整参数以优化预测精度,以及如何评估预测结果的可靠性。我尤其喜欢书中关于“模型解释性”的讨论,它强调了理解模型为何做出某个预测的重要性,这对于建立信任和进行有效的决策至关重要。书中对于如何利用Azure的强大计算能力和丰富的数据服务来支持大规模预测分析的介绍,也让我大开眼界。这不再是单打独斗的分析,而是能够利用云端强大的基础设施来实现更复杂的预测任务。读完这部分,我感觉自己拥有了“预知未来”的能力,能够更加积极主动地应对商业挑战。

评分

Azure机器学习的生态系统:整合与优化 这本书的价值不仅仅体现在对机器学习和预测分析算法本身的讲解,更在于它全面展示了Microsoft Azure在构建和部署机器学习解决方案方面的强大生态系统。作者以一种宏观的视角,描绘了Azure如何将数据存储、数据处理、模型训练、模型部署以及模型监控等各个环节 seamlessly 地整合在一起。我被Azure ML Studio、Azure Databricks、Azure Functions以及Azure Kubernetes Service等一系列服务所提供的强大能力所震撼。书中详细介绍了如何利用这些服务来构建端到端的机器学习管道,自动化模型的训练和部署过程,并确保模型的持续优化。尤其令人印象深刻的是,作者强调了在生产环境中部署和管理机器学习模型的重要性,并提供了关于模型版本控制、A/B测试以及实时监控的实用建议。这让我意识到,机器学习不仅仅是停留在实验阶段,而是能够真正落地并为业务创造价值。这本书的价值在于它提供了一个完整的蓝图,让我能够理解如何在Azure平台上构建一个健壮、可扩展且易于管理的机器学习解决方案。这对于任何希望在云端进行机器学习实践的开发者和数据科学家来说,都是一份宝贵的财富。

评分

初窥Azure机器学习的迷人世界 当我翻开这本书,就被其宏大的叙事和深邃的洞察力所吸引。作者似乎是一位经验丰富的向导,带领读者踏上一段探索Microsoft Azure机器学习和预测分析的非凡旅程。从第一页开始,我就被带入了一个充满可能性的世界,一个数据不再是冰冷的数字,而是蕴含着无限智慧和驱动决策的强大引擎的领域。书中的开篇并没有直接跳入枯燥的技术细节,而是巧妙地铺陈了机器学习和预测分析在当今商业和社会中所扮演的关键角色。它深入浅出地阐述了这些技术如何改变着我们与世界的互动方式,从个性化推荐到疾病预测,从金融欺诈检测到气候变化模拟,无处不显现出它们强大的力量。这种宏观的视角让我对接下来的学习充满了期待,仿佛提前瞥见了科技发展的前沿。我尤其欣赏作者对于“为什么”的深入探讨,而非仅仅停留在“如何做”的层面。理解了这些技术背后的逻辑和价值,学习的过程才会更加主动和有意义。书中对Azure平台的介绍也恰到好处,并没有让人感到晦涩难懂,而是以一种开放和友好的姿态,为初学者勾勒出了一个易于接近的学习路径。这种循序渐进的引导,让我这个对Azure尚不甚了解的读者,也能感受到学习的乐趣和成就感。

评分

工作需要,给了我很多帮助。

评分

好!

评分

内容太简单了

评分

工作需要,给了我很多帮助。

评分

内容太简单了

评分

很薄的一本册子,初略的翻了下没有什么内容就是相关的介绍,内容比较粗略,讲的不多,不详细

评分

挺好,给公司买的

评分

内容太简单了

评分

好!

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.cndgn.com All Rights Reserved. 新城书站 版权所有