内容介绍
本书注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了使用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。新版做了大量更新和修正,新增了近200页内容,介绍数据挖掘、预测性分析和高级编程。
本书适合数据分析人员及R用户学习参考。
作者介绍
Robert I. Kabacoff,R语言社区学习网站Quick-R的维护者,现为全球化开发与咨询公司Management研究集团研发副总裁。此前,Kabacoff博士是佛罗里达诺瓦东南大学的教授,讲授定量方法和统计编程的研究生课程。Kabacoff还是临床心理学博士、统计顾问,擅长数据分析,在健康、金融服务、制造业、行为科学、政府和学术界有20余年的研究和统计咨询经验。
目录
第一部分 入门
第1章 R语言介绍
1.1 为何要使用R
1.2 R的获取和安装
1.3 R的使用
1.3.1 新手上路
1.3.2 获取帮助
1.3.3 工作空间
1.3.4 输入和输出
1.4 包
1.4.1 什么是包
1.4.2 包的安装
1.4.3 包的载入
1.4.4 包的使用方法
1.5 批处理
1.6 将输出用为输入:结果的重用
1.7 处理大数据集
1.8 示例实践
1.9 小结
第2章 创建数据集
2.1 数据集的概念
2.2 数据结构
2.2.1 向量
2.2.2 矩阵
2.2.3 数组
2.2.4 数据框
2.2.5 因子
2.2.6 列表
2.3 数据的输入
2.3.1 使用键盘输入数据
2.3.2 从带分隔符的文本文件导入数据
2.3.3 导入Excel数据
2.3.4 导入XML数据
2.3.5 从网页抓取数据
2.3.6 导入SPSS数据
2.3.7 导入SAS数据
2.3.8 导入Stata数据
2.3.9 导入NetCDF数据
2.3.10 导入HDF5数据
2.3.11 访问数据库管理系统
2.3.12 通过Stat/Transfer导入数据
2.4 数据集的标注
2.4.1 变量标签
2.4.2 值标签
2.5 处理数据对象的实用函数
2.6 小结
第3章 图形初阶
3.1 使用图形
3.2 一个简单的例子
3.3 图形参数
3.3.1 符号和线条
3.3.2 颜色
3.3.3 文本属性
3.3.4 图形尺寸与边界尺寸
3.4 添加文本、自定义坐标轴和图例
3.4.1 标题
3.4.2 坐标轴
3.4.3 参考线
3.4.4 图例
3.4.5 文本标注
3.4.6 数学标注
3.5 图形的组合
3.6 小结
第4章 基本数据管理
4.1 一个示例
4.2 创建新变量
4.3 变量的重编码
4.4 变量的重命名
4.5 缺失值
4.5.1 重编码某些值为缺失值
4.5.2 在分析中排除缺失值
4.6 日期值
4.6.1 将日期转换为字符型变量
4.6.2 更进一步
4.7 类型转换
4.8 数据排序
4.9 数据集的合并
4.9.1 向数据框添加列
4.9.2 向数据框添加行
4.10 数据集取子集
4.10.1 选入(保留)变量
4.10.2 剔除(丢弃)变量
4.10.3 选入观测
4.10.4 subset()函数
4.10.5 随机抽样
4.11 使用SQL语句操作数据框
4.12 小结
第5章 高级数据管理
5.1 一个数据处理难题
5.2 数值和字符处理函数
5.2.1 数学函数
5.2.2 统计函数
5.2.3 概率函数
5.2.4 字符处理函数
5.2.5 其他实用函数
5.2.6 将函数应用于矩阵和数据框
5.3 数据处理难题的一套解决方案
5.4 控制流
5.4.1 重复和循环
5.4.2 条件执行
5.5 用户自编函数
5.6 整合与重构
5.6.1 转置
5.6.2 整合数据
5.6.3 reshape2包
5.7 小结
第二部分 基本方法
第6章 基本图形
第7章 基本统计分析
第三部分 中级方法
第8章 回归
第9章 方差分析
第10章 功效分析
第11章 中级绘图
第12章 重抽样与自助法
第四部分 高级方法
第13章 广义线性模型
第14章 主成分分析和因子分析
第15章 时间序列
第16章 聚类分析
第17章 分类
第18章 处理缺失数据的高级方法
第五部分 技能拓展
第19章 使用ggplot2进行高级绘图
第20章 高级编程
第21章 创建包
第22章 创建动态报告
第23章 使用lattice进行高级绘图
附录A 图形用户界面
附录B 自定义启动环境
附录C 从R中导出数据
附录D R中的矩阵运算
附录E 本书中用到的扩展包
附录F 处理大数据集
附录G 更新R
后记:探索R的世界
参考文献