内容简介
《Python数据分析基础》通过真实案例,全面介绍python编程基础和数据分析工具的应用,并培养读者通过数据分析问题、解决问题以及对结果评价的能力。《Python数据分析基础》内容包括:python基本配置和编程基础、数据预处理、数据描述与可视化、统计推断、相关分析、关联分析、回归分析、主成分和因子分析、聚类、判别与分类、列联分析、对应分析、定性数据分析、时间序列分析等,将读者关注的数据分析与数据挖掘技术进行剖析。
作者简介
阮敬(1979—),博士,现任首都经济贸易大学研究生院副院长,统计学院教授,北京市丰台区政协委员。兼任北京大数据协会副秘书长、中国统计教育学会常务理事兼高等教育分会副秘书长、中国商业统计学会常务理事、全国工业统计学教学研究会理事等职。近年来主持国家社科基金、教育部人文社科基金、北京市自然科学基金、北京市社科基金、留学人员科技活动择优资助项目等10余项;主持世界500强企业及大型国企、国家部委及北京市政府部门等的大数据分析相关横向课题20余项。在国内外公开发表论文50余篇,出版专著教材5部,先后11次荣获国务院学位办全国应用统计专业学位研究生教育指导委员会优秀教学成果奖、全国统计科学研究优秀成果奖、北京市哲学社会科学优秀成果奖、北京市统计科学研究优秀成果奖等科研和教学奖励。
内页插图
目录
第1章 Python编程基础
1.1 Python系统配置
1.2 Python基础知识
1.2.1 帮助
1.2.2 标识符
1.2.3 行与缩进
1.2.4 变量与对象
1.2.5 数字与表达式
1.2.6 运算符
1.2.7 字符串
1.2.7.1 转义字符
1.2.7.2 字符串格式化
1.2.7.3 字符串的内置方法
1.2.8 日期和时间
1.3 数据结构与序列
1.3.1 列表
1.3.1.1 列表索引和切片
1.3.1.2 列表操作
1.3.1.3 内置列表函数
1.3.1.4 列表方法
1.3.2 元组
1.3.3 字典
1.3.4 集合
1.3.5 推导式
1.4 语句与控制流
1.4.1 条件语句
1.4.2 循环语句
1.4.2.1 while循环
1.4.2.2 for循环
1.4.2.3 循环控制
1.5 函数
1.5.1 函数的参数
1.5.2 全局变量与局部变量
1.5.3 匿名函数
1.5.4 递归和闭包
1.5.5 柯里化与反柯里化
1.5.6 常用的内置函数
1.5.6.1 filter函数
1.5.6.2 map函数
1.5.6.3 reduce函数
1.6 迭代器、生成器和装饰器
1.6.1 迭代器
1.6.2 生成器
1.6.3 装饰器
1.7 类
1.7.1 声明类
1.7.2 方法
1.7.2.1 实例方法
1.7.2.2 类方法
1.7.2.3 静态方法
1.7.3 属性
1.7.3.1 实例属性和类属性
1.7.3.2 私有属性和公有属性
1.7.4 继承
1.7.4.1 隐式继承
1.7.4.2 显式覆盖
1.7.4.3 super继承
1.7.4.4 多态
1.7.4.5 多重继承
1.8 模块
1.9 包
1.1 0文件I/O
第2章 数据预处理
2.1 numpy基础
2.1.1 向量
2.1.2 数组
2.1.2.1 数据类型与结构数组
2.1.2.2 索引与切片
2.1.2.3 数组的属性
2.1.2.4 数组排序
2.1.2.5 数组维度
2.1.2.6 数组组合
2.1.2.7 数组分拆
……
第3章 数据描述
第4章 统计图形与可视化
第5章 简单统计推断
第6章 方差分析
第7章 非参数检验
第8章 相关分析与关联分析
第9章 回归分析
第10章 离散因变量模型
第11章 主成分与因子分析
第12章 列联分析与对应分析
第13章 聚类
第14章 判别和分类
第15章 时间序列分析
附录:各章图形
前言/序言
数据分析是科学研究中的重要环节,随着大数据时代的迅猛发展,其越来越受社会和市场的重视,是科学研究、经营管理、预测与决策等过程中必不可少的基础工作。python是当今大数据时代下最为流行的编程工具之一,在大数据领域有着十分广泛的应用,可以实现从数据收集和数据管理到数据分析和挖掘的完整过程,其高效的编程和程序执行过程,能够完全胜任日常数据分析工作的需求。
随着数据分析作用的日益凸显,如何对现有数据进行整理、加工、处理和分析,以期得到结论,作为人们进行决策的依据进而实现数据的价值?如何利用现有数据对将来可能出现的数据结果或结论进行判断或预测?不管是针对企事业单位的管理者或决策者还是从事具体数据分析的工作人员而言,都需要进行合理数据分析流程的规划,区分数据类型,利用适合的数据分析方法,使用方便、快捷、可靠的统计软件作为工具,对特定数据进行分析与预测,从而洞察市场动向,观测人心所在,把握商机,提升竞争力。
而具有深厚数学背景的统计分析和数据分析方法往往会成为相关人员继续深入学习的门槛,甚至成为枯燥乏味的代名词,无法体验到数据分析成果带来的成效。本书就是要力求降低学习难度,通过编者积累的大量真实案例和数据,主要以文字阐述替代复杂公式推导,深入浅出剖析数据分析方法的基本原理和步骤,重点在于厘清数据分析的基本思路,合理得到恰当的分析结果。在分析过程中,本书基于python 2.7,从基础编程入手,主要通过调用python基本库和常用工具库的方式,用大量的实例来展示数据分析每一步骤的细节,带领读者走入数据分析的奇妙世界。
本书的第1章和第2章主要介绍python的基本环境、编程基础和数据预处理方面的内容,具体内容包括python数据类型及数据结构、语句与控制流、基本库、函数和面向对象编程的基础,以及数据分析最为常用的基本分析工具库numpy和pandas基础等;
第3章和第4章主要介绍利用python进行描述分析的基本过程和方法,涵盖了各种常用数据分析图形的绘制和解读以及统计量和统计表等具体内容;
第5、6、7章主要介绍利用python如何进行总体推断。在大数据时代即使数据量再大,但也离不开利用统计思想对总体特征进行推测和判断,这些具体内容包括参数估计、假设检验和非参数分析;
第8章主要介绍如何用python来分析数据之间的关系,具体涵盖了简单相关分析、非参数相关分析、偏相关分析、点二列相关分析以及数据挖掘中常用的关联分析等内容;
第9章和第10章主要介绍如何利用python来进行回归分析。回归模型可以说是大部分统计分析和数据挖掘方法的基础,本书介绍的具体内容有线性回归、非线性回归、多项式回归、分位数回归、自变量含有定性变量的回归以及因变量含有定性变量的广义线性回归分析;
Python数据分析基础 下载 mobi epub pdf txt 电子书 格式