注重体验与质量的电子书资源下载网站
分类于: 云计算&大数据 职场办公
简介
白话统计 豆 8.0分
资源最后更新于 2020-09-05 22:00:44
作者:冯国双
出版社:电子工业出版社
出版日期:2018-01
ISBN:9787121335181
文件格式: pdf
标签: 统计学 统计 数据分析 研究方法 白话统计 数学 工具书 计算科学
简介· · · · · ·
一本书如果没有作者自己的观点,而只是知识的堆叠,那么这类书是没有太大价值的。尤其在当前网络发达的时代,几乎任何概念和知识点都可以从网络上查到。但是有一点你很难查到,那就是统计分析的思路和观点。比如,你可以很容易地在网上查到什么是线性回归,但你却查不到怎么“做”线性回归分析,在你遇到实际数据时仍然不知道如何分析。在《白话统计》中,你可以获得这些思路和观点。尽管这些观点未必是所有人都认可的,但根据笔者多年的分析经验,它们在实践中通常是奏效的。
《白话统计》凝结了作者十多年来对统计分析的理解,对各种方法的介绍采用全新的理念和思路,不再是介绍方法本身,而是试图将各种方法之间的联系阐述清楚;不再是介绍方法如何计算出结果,而是尽量说明方法背后的思想。当然,《白话统计》同时提供了如何实现结果的软件(涵盖SAS、R、JMP、SPSS 等)操作。
目录
第 1 篇 基础篇
第1 章 为什么要学统计 2
1.1 统计学有什么用 3
1.2 生活世事皆统计 4
1.3 如何学统计 4
第 2 章 变异——统计学存在的基础 6
2.1 随机与变异 6
2.2 特朗普与罗斯福的胜出——抽样调查到底可不可靠 8
2.3 什么是抽样误差 9
第 3 章 郭靖的内力能支撑多久——谈概率分布 11
3.1 累积分布与概率密度的通俗理解 12
3.2 是生存还是死亡?这是一个问题——用Weibull 分布寻找生存规律 16
3.3 2003 年的那场SARS——用Logistic 分布探索疾病流行规律 20
3.4 “普通”的正态分布 23
3.5 几个常用分布——t 分布、χ2 分布、F 分布 28
第 4 章 关于统计资料类型的思考 35
4.1 计数资料等于分类资料吗 36
4.2 计数资料可否采用连续资料的方法进行分析 37
4.3 分类资料中的无序和有序是如何确定的 38
4.4 连续资料什么时候需要转换为分类资料 39
4.5 连续资料如何分组——寻找cut-off 值的多种方法 41
4.6 什么是虚拟变量/哑变量 47
第 5 章 如何正确展示你的数据 52
5.1 均数和中位数——你被平均了吗 53
5.2 方差与标准差——变异的度量 54
5.3 自由度——你有多少自由活动的范围 56
5.4 百分位数——利用百分数度量相对位置 57
5.5 如何比较苹果和橘子——利用Z 值度量相对位置 59
5.6 某百岁老人调查报告说:少运动才能活得久——谈一下比例和率 61
5.7 在文章中如何正确展示百分比 63
第 6 章 寻找失踪的运动员——中心极限定理 64
6.1 中心极限定理针对的是样本统计量而非原始数据 65
6.2 样本量大于30 就可以认为是正态分布了吗 67
第 7 章 从“女士品茶”中领会假设检验的思想 70
7.1 女士品茶的故事 70
7.2 零假设和备择假设 . 72
7.3 假设检验中的两类错误 73
7.4 P 值的含义 76
7.5 为什么P 值小于0.05(而不是0.02)才算有统计学意义 78
7.6 为什么零假设要设定两组相等而不是两组不等 79
第 8 章 参数估计——一叶落而知秋 81
8.1 点估计 .81
8.2 最小二乘估计 82
8.3 最大似然估计 84
8.4 贝叶斯估计 86
第 9 章 置信区间估计——给估计留点余地 88
9.1 置信区间的理论与实际含义 88
9.2 置信区间与P 值的关系 90
9.3 利用标准误计算置信区间 91
9.4 利用Bootstrap 法估计置信区间 . 92
第 2 篇 实用篇
第10 章 常用统计方法大串讲 98
10.1 一般线性模型——方差分析与线性回归的统一 99
10.2 广义线性模型——线性回归与Logistic 回归的统一 103
10.3 广义可加模型——脱离“线性”束缚 107
10.4 多水平模型——打破“独立”条件 112
10.5 结构方程模型——从单因单果到多因多果 119
第 11 章 正态性与方差齐性 .127
11.1 用统计检验方法判断正态性 127
11.2 用描述的方法判断正态性 130
11.3 方差分析中的方差齐性判断 .133
11.4 理解线性回归中的方差齐性 135
第 12 章 t 检验——不仅是两组比较 .138
12.1 从另一个角度来理解t 检验 138
12.2 如何正确应用t 检验 140
12.3 t 检验用于回归系数的检验 141
12.4 t 检验的替代——Wilcoxon 秩和检验 142
第 13 章 方差分析与变异分解 145
13.1 方差分析中变异分解的思想 145
13.2 为什么回归分析中也有方差分析 147
13.3 铁打的方差分析,流水的实验设计 148
13.4 方差分析后为什么要进行两两比较 152
13.5 多重比较方法的选择建议 154
13.6 所有的多组都需要做两两比较吗——兼谈固定效应和随机效应 164
13.7 重复测量方差分析详解 166
13.8 方差分析的替代——Kruskal-Wallis 秩和检验 176
13.9 多组秩和检验后的两两比较方法 178
第 14 章 卡方检验——有“卡”未必走遍天下 181
14.1 卡方检验用于分类资料组间比较的思想 181
14.2 卡方用于拟合优度评价——从Hardy-Weinberg 定律谈起 184
14.3 似然比χ2、M-H χ2、校正χ2 与Fisher 精确检验 186
14.4 等级资料到底可不可以用卡方检验 191
14.5 卡方检验的两两比较 193
14.6 Cochran-Armitage 趋势检验 194
14.7 分类变量的赋值是如何影响分析结果的 196
第 15 章 相关分析与一致性检验 200
15.1 从协方差到线性相关系数 200
15.2 线性相关系数及其置信区间 203
15.3 如何比较两个线性相关系数有无差异 206
15.4 分类资料的相关系数 207
15.5 基于秩次的相关系数 210
15.6 相关分析中的几个陷阱 213
15.7 用ICC 和CCC 指标判断一致性 215
15.8 用Bland-Altman 图判断一致性 218
15.9 Kappa 检验在一致性分析中的应用 219
第 16 章 线性回归及其分析思路 .222
16.1 残差——识别回归模型好坏的关键 223
16.2 回归系数的正确理解 226
16.3 回归系数检验VS 模型检验 227
16.4 均值的置信区间VS 个体的预测区间 228
16.5 逐步回归筛选变量到底可不可靠——谈变量筛选策略 230
16.6 如何评价模型是好还是坏——交叉验证思路 237
16.7 线性回归的应用条件——你的数据能用线性回归吗 240
16.8 如何处理非正态——Box-Cox 变换 247
16.9 如何处理非线性——Box-Tidwell 变换 248
16.10 方差不齐怎么办——加权最小二乘法 250
16.11 当共线性导致结果异常时怎么办——岭回归、Lasso 回归 .254
16.12 发现异常值应该删除吗——谈几种处理异常值的方法 .260
16.13 如何处理缺失值——是删除还是填补 268
16.14 一个非教材的非典型案例——线性回归的综合分析 276
第1 章 为什么要学统计 2
1.1 统计学有什么用 3
1.2 生活世事皆统计 4
1.3 如何学统计 4
第 2 章 变异——统计学存在的基础 6
2.1 随机与变异 6
2.2 特朗普与罗斯福的胜出——抽样调查到底可不可靠 8
2.3 什么是抽样误差 9
第 3 章 郭靖的内力能支撑多久——谈概率分布 11
3.1 累积分布与概率密度的通俗理解 12
3.2 是生存还是死亡?这是一个问题——用Weibull 分布寻找生存规律 16
3.3 2003 年的那场SARS——用Logistic 分布探索疾病流行规律 20
3.4 “普通”的正态分布 23
3.5 几个常用分布——t 分布、χ2 分布、F 分布 28
第 4 章 关于统计资料类型的思考 35
4.1 计数资料等于分类资料吗 36
4.2 计数资料可否采用连续资料的方法进行分析 37
4.3 分类资料中的无序和有序是如何确定的 38
4.4 连续资料什么时候需要转换为分类资料 39
4.5 连续资料如何分组——寻找cut-off 值的多种方法 41
4.6 什么是虚拟变量/哑变量 47
第 5 章 如何正确展示你的数据 52
5.1 均数和中位数——你被平均了吗 53
5.2 方差与标准差——变异的度量 54
5.3 自由度——你有多少自由活动的范围 56
5.4 百分位数——利用百分数度量相对位置 57
5.5 如何比较苹果和橘子——利用Z 值度量相对位置 59
5.6 某百岁老人调查报告说:少运动才能活得久——谈一下比例和率 61
5.7 在文章中如何正确展示百分比 63
第 6 章 寻找失踪的运动员——中心极限定理 64
6.1 中心极限定理针对的是样本统计量而非原始数据 65
6.2 样本量大于30 就可以认为是正态分布了吗 67
第 7 章 从“女士品茶”中领会假设检验的思想 70
7.1 女士品茶的故事 70
7.2 零假设和备择假设 . 72
7.3 假设检验中的两类错误 73
7.4 P 值的含义 76
7.5 为什么P 值小于0.05(而不是0.02)才算有统计学意义 78
7.6 为什么零假设要设定两组相等而不是两组不等 79
第 8 章 参数估计——一叶落而知秋 81
8.1 点估计 .81
8.2 最小二乘估计 82
8.3 最大似然估计 84
8.4 贝叶斯估计 86
第 9 章 置信区间估计——给估计留点余地 88
9.1 置信区间的理论与实际含义 88
9.2 置信区间与P 值的关系 90
9.3 利用标准误计算置信区间 91
9.4 利用Bootstrap 法估计置信区间 . 92
第 2 篇 实用篇
第10 章 常用统计方法大串讲 98
10.1 一般线性模型——方差分析与线性回归的统一 99
10.2 广义线性模型——线性回归与Logistic 回归的统一 103
10.3 广义可加模型——脱离“线性”束缚 107
10.4 多水平模型——打破“独立”条件 112
10.5 结构方程模型——从单因单果到多因多果 119
第 11 章 正态性与方差齐性 .127
11.1 用统计检验方法判断正态性 127
11.2 用描述的方法判断正态性 130
11.3 方差分析中的方差齐性判断 .133
11.4 理解线性回归中的方差齐性 135
第 12 章 t 检验——不仅是两组比较 .138
12.1 从另一个角度来理解t 检验 138
12.2 如何正确应用t 检验 140
12.3 t 检验用于回归系数的检验 141
12.4 t 检验的替代——Wilcoxon 秩和检验 142
第 13 章 方差分析与变异分解 145
13.1 方差分析中变异分解的思想 145
13.2 为什么回归分析中也有方差分析 147
13.3 铁打的方差分析,流水的实验设计 148
13.4 方差分析后为什么要进行两两比较 152
13.5 多重比较方法的选择建议 154
13.6 所有的多组都需要做两两比较吗——兼谈固定效应和随机效应 164
13.7 重复测量方差分析详解 166
13.8 方差分析的替代——Kruskal-Wallis 秩和检验 176
13.9 多组秩和检验后的两两比较方法 178
第 14 章 卡方检验——有“卡”未必走遍天下 181
14.1 卡方检验用于分类资料组间比较的思想 181
14.2 卡方用于拟合优度评价——从Hardy-Weinberg 定律谈起 184
14.3 似然比χ2、M-H χ2、校正χ2 与Fisher 精确检验 186
14.4 等级资料到底可不可以用卡方检验 191
14.5 卡方检验的两两比较 193
14.6 Cochran-Armitage 趋势检验 194
14.7 分类变量的赋值是如何影响分析结果的 196
第 15 章 相关分析与一致性检验 200
15.1 从协方差到线性相关系数 200
15.2 线性相关系数及其置信区间 203
15.3 如何比较两个线性相关系数有无差异 206
15.4 分类资料的相关系数 207
15.5 基于秩次的相关系数 210
15.6 相关分析中的几个陷阱 213
15.7 用ICC 和CCC 指标判断一致性 215
15.8 用Bland-Altman 图判断一致性 218
15.9 Kappa 检验在一致性分析中的应用 219
第 16 章 线性回归及其分析思路 .222
16.1 残差——识别回归模型好坏的关键 223
16.2 回归系数的正确理解 226
16.3 回归系数检验VS 模型检验 227
16.4 均值的置信区间VS 个体的预测区间 228
16.5 逐步回归筛选变量到底可不可靠——谈变量筛选策略 230
16.6 如何评价模型是好还是坏——交叉验证思路 237
16.7 线性回归的应用条件——你的数据能用线性回归吗 240
16.8 如何处理非正态——Box-Cox 变换 247
16.9 如何处理非线性——Box-Tidwell 变换 248
16.10 方差不齐怎么办——加权最小二乘法 250
16.11 当共线性导致结果异常时怎么办——岭回归、Lasso 回归 .254
16.12 发现异常值应该删除吗——谈几种处理异常值的方法 .260
16.13 如何处理缺失值——是删除还是填补 268
16.14 一个非教材的非典型案例——线性回归的综合分析 276