当前: 首页 - 图书专区 - 例解回归分析(原书第5版)
例解回归分析(原书第5版)


  教辅下载
  在线购买
(美)Samprit Chatterjee Ali S.Hadi 著
978-7-111-43156-5
69.00
306
2013年07月31日
郑忠国 许静 译
数学 > 统计 > 统计学
John Wiley & Sons(USA)
2497
简体中文
16
Regression Analysis by Example
教材
统计学精品译丛








这本书全面介绍了回归分析的理论,侧重于数据分析,几乎是手把手地教读者如何去分析数据、检验结论、改进分析。不是从数学角度来写的,不是介绍方法和公式的详细推导,而是用精选出来的例子来描述方法,解释理论结果的实际意义。同时强调图形工具的运用,强调探索性数据研究的原则,把回归分析视为一整套数据分析的技术来讲解和使用。
“我们乐于向读者推荐本书,并建议大学教师将本书作为‘回归分析’课程的教材,尝试一种新的教学方法。”
——郑忠国(北京大学)
“总之,这本优秀的教材价值非凡,不断更新。书中通过大量精心设计的例子,向读者全面展示持久不衰的回归分析处理数据的技巧。毫无疑问,在统计教学中,这本书将一如既往地被经常采用。”
——国际统计评论

本书已在世界范围内畅销三十多年,被美国斯坦福大学、哥伦比亚大学、康奈尔大学、纽约大学以及加拿大麦克马斯特大学等众多名校采用为教材,曾被译成德语、日语等版本。内容涉及简单线性回归、多元线性回归、岭回归、逻辑斯谛回归、泊松回归、稳健回归、变量变换和变量选择等,既有传统的统计分析,也有一些不那么传统的统计分析,目标是挖掘数据内在的结构。本书强调的是数据分析的技巧,而不是统计理论的发展,采用丰富的实例,形象生动而又系统详尽地阐述了回归分析的基本理论和具体的应用技术。
作者几乎是手把手地指导读者做探索性数据分析,读者在学完后,会系统地掌握回归分析的各种技巧,并且能够融会贯通地处理自己所遇到的数据分析问题。因此,对于从事数据挖掘或数据分析的工作者来说,这本经典的教材也是指导他解决实际问题的案头佳作。
网站http://www.aucegypt.edu/faculty/hadi/RABE5提供了本教材中所有的数据以及配套的教师解答手册等资料。

Samprit Chatterjee 纽约大学Stern商学院荣休教授,国际数理统计学会、英国皇家统计学会、美国统计学会会士,1967年获哈佛大学博士学位。
Ali S. Hadi 康奈尔大学荣休教授,开罗美国大学特聘教授,国际统计学会会员,美国统计学会会士,多次荣获康奈尔大学的杰出教师奖项,还于2000年荣登美国教师名人录。
我们很高兴在此把《例解回归分析》第5 版介绍给大家,本书初版于1977年.统计界一直对此书十分关心和支持,我们也从他们对本书的诸多改进意见中获益良多.
  对于分析多因素数据资料,回归分析已经成为应用最为广泛的统计分析工具之一.它之所以广受欢迎,是因为它对分析变量之间的函数关系提供了概念上简单明了的方法.回归分析的标准方法是:对数据拟合一个模型,然后利用诸如t,F和R2等统计量对拟合的方程进行评估.本书的方法比这些传统的方法更加广泛.我们将回归分析看成考察各个变量之间关系的一种数据分析的工具.本书并不强调形式化的统计检验和概率计算.我们的目标是挖掘数据内在的结构.
  我们在这些数据直观表现的基础上,进行大量传统的和一些不那么传统的统计分析.我们主要依靠这些数据的图形表示,经常利用许多种类的回归残差图进行分析.我们不强调精确的概率计算利用残差图的图形方法可以展现模型的缺陷,找出某些病态的观测值.进一步追溯这些病态观测值,通常会发现它们有时候比正常的观测值更具信息价值.我们发现,快速一瞥残差图比形式化地进行某个限定的原假设的显著性检验能获取更多的信息.可以这么说,本书是在探索性数据分析的思想和原则指导下写成的.
  我们通过精心设计的例子来解释和展现回归分析的各种基本概念和方法.每个例子中,我们总是集中介绍一两种回归分析技术.因此在选择数据的时候,我们仔细琢磨,精心挑选,以便突出我们所介绍的技术.在实际工作中,对于一个数据集合,通常要涉及许多不同的分析技术.但是本书例子的安排,使得分析数据时各种分析技巧有序出场,不需要在不同的例子中重复地介绍和解释同一个分析技巧.我们希望读者在学完本书以后,能够系统地掌握回归分析的各种技巧,并且能够融会贯通地处理所遇到的数据分析问题.
  本书强调的是分析数据的技术,而不是统计公式、假设检验和置信区间.因此,我们的重点不在于这些分析技术的推导.当然,我们在分析数据时会介绍这些分析工具,并且给出它们的使用条件,最后,在具体的例子中给出使用效果的评价.虽然我们没有给出这些分析技术的推导,但是我们会给出这些技术的来源,有兴趣的读者可以参考并进一步钻研其理论.
  我们假定读者能够接触到计算机和统计软件.现在,线性模型分析领域有了质的飞跃,从模型拟合到建模、从一般的检验到临床数据的检测、从宏观分析到微观分析,所有这些都需要计算机,因此我们假定大家手头具备这一工具.几乎所有我们用的分析工具,现有软件包里都能找到.特别是,在互联网上可以找到软件包R,这个软件包具有很强的计算能力和图形功能.同时,它是免费的!
  本书的读者对象是涉及分析数据的各层次人员.这本书对于具有统计基本知识的人员是颇有帮助的.在大学中,它可以作为“回归分析”课程的教材,课程的授课对象是非统计专业的学生,但是这些学生在他们的专业领域内又特别需要回归分析这个数据处理工具.对于统计专业的学生,如果他们修过“回归分析”这门课程,而课程的水平如Rao(1973)、Seber(1977)或Sen and Srivastava(1990)那样,那么本书的内容是他们所学的理论回归分析的补充,从实际应用的角度去深化他们对回归分析的认识.在大学以外,对于那些应用标准统计方法(如t、F、R2、标准误等)进行回归分析解决实际问题的人员,如果他们要对多因素数据进行更加深入的分析,那么这本书是非常有用的.
  本书的配套网站是:http://www.aucegypt.edu/faculty/hadi/RABE5. 该网站包含本书的所有数据,当然还有一些其他数据和内容.
  本书的第5版语言更加流畅,去掉一些模棱两可的说法,纠正了一些错误,这些错误是由读者指出的或由作者自己纠正的.在第1章中加入了新的数据集的例子.将第4版第9章中关于数据的中心化和规范化的材料移到3.6节.第9章和第10章的材料经过重新组织,使得概念上循序渐进,学习起来更加通俗易懂.第10章的附录简单描述了代理岭回归,这是近年提出的新的研究内容.第5版中还增加了新的参考文献.在每一章的最后,我们增加了习题,对某些习题还加以改写.我们认为,做习题能够巩固和加强对前面所学内容的理解.
  我们努力让更多人获益,因此本书的读者对象是来自各种不同领域的数据处理的工作者.本书强调的重点是数据分析的技巧,而不是统计理论的发展.
  我们很幸运地得到多位朋友、同事及合作者的鼓励和帮助.在纽约大学和康奈尔大学的几个同行将本书的部分材料作为他们课程的教材,并且将他们的评论以及学生的意见提供给我们.特别要提到的是我们的朋友兼前同事Jeffrey Simonoff (纽约大学), 他给出很好的审稿意见,提出建议并给予很多其他帮助.我们的“回归分析”课程上,许多学生也对本书做出了贡献,他们提出了许多深刻的问题,还要求有意义且可以理解的答案.我们也要特别感谢Nedret Billor(Cukurova 大学,Turkey)和Sahar El-Sheneity(康奈尔大学),他们仔细阅读了本书的早期版本.同样,Amy Hendrickson为本书准备了Latex 文件并回答了有关Latex的问题,Dean Gonzalez 协助制作某些图形,在此一并表示感谢.

Samprit Chatterjee
Ali S.Hadi
Brooksville,Maine
Cairo,Egypt
中文版序
译者序
前言
第1章 概述1
 1.1 什么是回归分析1
 1.2 公用数据集1
 1.3 回归分析应用实例选讲2
  1.3.1 农业科学2
  1.3.2 劳资关系3
  1.3.3 政府5
  1.3.4 历史8
  1.3.5 环境科学8
  1.3.6 工业生产9
  1.3.7 挑战者号航天飞机11
  1.3.8 医疗费用12
 1.4 回归分析的步骤14
  1.4.1 问题陈述14
  1.4.2 选择相关变量15
  1.4.3 收集数据15
  1.4.4 模型设定16
  1.4.5 拟合方法17
  1.4.6 模型拟合18
  1.4.7 模型评价和选择18
  1.4.8 回归分析的目标19
 1.5 本书的内容和结构20
 习题21
第2章 简单线性回归22
 2.1 引言22
 2.2 协方差与相关系数22
 2.3 实例:计算机维修数据26
 2.4 简单线性回归模型27
 2.5 参数估计28
 2.6 假设检验30
 2.7 置信区间34
 2.8 预测34
 2.9 拟合效果度量35
 2.10 过原点的回归直线38
 2.11 平凡的回归模型39
 2.12 文献40
 习题40
第3章 多元线性回归45
 3.1 引言45
 3.2 数据和模型的描述45
 3.3 实例:主管人员业绩数据46
 3.4 参数估计47
 3.5 回归系数的解释48
 3.6 中心化和规范化50
  3.6.1 含截距模型的中心化和规范化50
  3.6.2 无截距模型的规范化51
 3.7 最小二乘估计的性质52
 3.8 复相关系数53
 3.9 单个回归系数的推断54
 3.10 线性模型中的假设检验55
  3.10.1 检验所有预测变量的回归系数为056
  3.10.2 检验某些回归系数为058
  3.10.3 检验某些回归系数相等60
  3.10.4 带约束的回归参数的估计和检验61
 3.11 预测62
 3.12 小结63
 习题63
 附录 多元回归的矩阵表示69
第4章 回归诊断:违背模型假定的检测71
 4.1 引言71
 4.2 标准回归假定71
 4.3 各种残差72
 4.4 图形方法74
 4.5 拟合模型前的图形76
  4.5.1 一维图76
  4.5.2 二维图77
  4.5.3 旋转图78
  4.5.4 动态图78
 4.6 拟合模型后的图形79
 4.7 检查线性和正态性假定的图形79
 4.8 杠杆、强影响点和异常值80
  4.8.1 响应变量的异常值81
  4.8.2 预测变量中的异常值81
  4.8.3 伪装和淹没问题82
 4.9 观测影响的度量83
  4.9.1 Cook距离84
  4.9.2 Welsch-Kuh度量84
  4.9.3 Hadi影响度量85
 4.10 位势残差图86
 4.11 如何处理异常点87
 4.12 回归方程中变量的作用88
  4.12.1 添加变量图88
  4.12.2 残差加分量图88
 4.13 添加一个预测变量的效应92
 4.14 稳健回归92
 习题93
第5章 定性预测变量97
 5.1 引言97
 5.2 薪水调查数据97
 5.3 交互变量100
 5.4 回归方程组:两个组的比较102
  5.4.1 斜率和截距都不同的模型103
  5.4.2 斜率相同但截距不同的模型107
  5.4.3 截距相同但斜率不同的模型108
 5.5 示性变量的其他应用109
 5.6 季节性109
 5.7 回归参数随时间的稳定性111
 习题115
第6章 变量变换121
 6.1 引言121
 6.2 线性化变换122
 6.3 X射线灭菌124
  6.3.1 线性模型的不适用性125
  6.3.2 对数变换实现线性化125
 6.4 稳定方差的变换126
 6.5 异方差误差的检测130
 6.6 消除异方差性131
 6.7 加权最小二乘132
 6.8 数据的对数变换132
 6.9 幂变换134
 6.10 总结137
 习题137
第7章 加权最小二乘法141
 7.1 引言141
 7.2 异方差模型142
  7.2.1 主管人员数据142
  7.2.2 大学教育花费数据143
 7.3 两阶段估计144
 7.4 教育费用数据145
 7.5 拟合剂量反应关系曲线151
 习题152
第8章 相关误差问题153
 8.1 引言:自相关153
 8.2 消费支出和货币存量153
 8.3 Durbin-Watson统计量155
 8.4 利用变换消除自相关性157
 8.5 当回归模型具有自相关误差时的迭代估计法158
 8.6 变量的缺失和模型的自相关性159
 8.7 住房开工规模的分析160
 8.8 Durbin-Watson统计量的局限性162
 8.9 用示性变量消除季节效应164
 8.10 两个时间序列之间的回归166
 习题167
第9章 共线性数据分析171
 9.1 引言171
 9.2 共线性对推断的影响172
 9.3 共线性对预测的影响176
 9.4 共线性的检测178
  9.4.1 共线性的简单征兆179
  9.4.2 方差膨胀因子182
  9.4.3 条件指数184
 习题186
第10章 共线性数据的处理189
 10.1 引言189
 10.2 主成分189
 10.3 利用主成分的计算192
 10.4 施加约束条件194
 10.5 搜索模型中回归系数的线性函数195
 10.6 回归系数的有偏估计198
 10.7 主成分回归199
 10.8 消除数据中的共线性200
 10.9 回归系数的约束条件202
 10.10 主成分回归中的注意事项203
 10.11 岭回归205
 10.12 岭估计法206
 10.13 岭回归:几点注解209
 10.14 小结210
 10.15 文献210
 习题211
 附录10.A 主成分214
 附录10.B 岭回归216
 附录10.C 代理岭回归218
第11章 变量选择219
 11.1 引言219
 11.2 问题的陈述219
 11.3 删除变量的后果220
 11.4 回归方程的用途221
  11.4.1 描述和建模221
  11.4.2 估计和预测221
  11.4.3 控制221
 11.5 评价回归方程的准则222
  11.5.1 残差均方222
  11.5.2 Mallows的Cp准则223
  11.5.3 信息准则223
 11.6 共线性和变量选择224
 11.7 评价所有可能的回归模型225
 11.8 变量选择方法225
  11.8.1 前向选择方法226
  11.8.2 后向剔除方法226
  11.8.3 逐步回归法226
 11.9 变量选择的一般注意事项227
 11.10 对主管人员业绩的研究227
 11.11 共线性数据的变量选择231
 11.12 凶杀数据231
 11.13 利用岭回归进行变量选择234
 11.14 空气污染研究中的变量选择234
 11.15 拟合回归模型的可能策略243
 11.16 文献244
 习题244
 附录 误设模型的影响247
第12章 逻辑斯谛回归249
 12.1 引言249
 12.2 定性数据的建模249
 12.3 Logit模型250
 12.4 例子:破产概率的估计251
 12.5 逻辑斯谛回归模型诊断254
 12.6 决定变量的去留255
 12.7 逻辑斯谛回归的拟合度257
 12.8 多项Logit模型258
  12.8.1 多项逻辑斯谛回归259
  12.8.2 例子:确定化学糖尿病259
  12.8.3 顺序值逻辑斯谛回归263
  12.8.4 例子:重新考察化学糖尿病的确定问题264
 12.9 分类问题:另一种方法264
 习题266
第13章 进一步的论题268
 13.1 引言268
 13.2 广义线性模型268
 13.3 泊松回归模型269
 13.4 引进新药269
 13.5 稳健回归270
 13.6 拟合一个二次式模型271
 13.7 美国海湾中PCB的分布272
 习题275
附录A 统计表276
参考文献283
索引291
回归分析是统计学的一个重大分支学科.无论从理论研究方面还是统计应用领域来说,回归分析都是国人熟悉的课题.国内已经有不少介绍回归分析的书籍和教材,但是,本书有它的独特之处.
  1.它没有把系统叙述回归分析的定义、模型和理论作为起始点和主要目的,也不强调读者的数学基础和逻辑推断能力.这就使得本书具有广泛的读者范围,即无论是具有较深理论基础的专业统计工作者还是需要利用回归分析作为数据分析工具的实际工作者,阅读本书都不会产生困难,也不会由于过多数据或逻辑推理而心里烦躁,而是会受到探索数据内在规律的启发.
  2.作者以数据实例分析贯穿始终,读者往往被数据中隐藏的关于事物本质的谜底所吸引而不感觉枯燥.推理往往是启发式的,有时候用直观的图形方法,这反映了探索性数据分析的特点.它不是对假设模型的理论进行推断,而是不设前提地对隐藏在事物背后的规律进行探索.这种方法与传统上用例子说明理论结果的目的是不同的.
  3.本书不将读者的计算机能力作为阅读本书的必备条件,但是具备这个条件将如虎添翼.对于现代的学者特别是年轻学生来说,具备计算机能力不是一个苛刻的要求.
  4.本书作者精心安排数据例子,使得读者在读完本书以后就可以系统地掌握回归分析的技巧和方法.对于那些热衷于回归分析方法的理论根源的读者,作者也提供了相关的参考文献,以便深化对回归分析的认识.此外,在某些章节还增加了附录,扩展介绍了一些方法,例如第10章介绍代理岭回归的概念,这是近年研究的内容.当然,作为教材,和大部分教科书一样,本书也提供了丰富的习题以供巩固所学.
  基于以上特点,我们乐于向读者推荐本书,并建议大学教师将本书作为“回归分析”课程的教材,尝试一种新的教学方法.我们翻译本书的过程也是一个学习的过程、享受的过程.在翻译的过程中我们得到了作者的帮助,受益匪浅,在此特向作者表示感谢.

译者
2013年5月4日
数学\统计学
读者书评
发表评论



高级搜索
统计学及其应用(原书第2版)
应用预测建模
线性回归分析导论(原书第5版)


版权所有© 2017  北京华章图文信息有限公司 京ICP备08102525号 京公网安备110102004606号
通信地址:北京市百万庄南街1号 邮编:100037
电话:(010)68318309, 88378998 传真:(010)68311602, 68995260
高校教师服务
华章教育微信
诚聘英才
诚聘英才