当前: 首页 - 图书专区 - 线性回归分析导论(原书第5版)
线性回归分析导论(原书第5版)


  在线购买
[美]道格拉斯 C.蒙哥马利(Douglas C.Montgomery),伊丽莎白 A.派克(Elizabeth A.Peck),G.杰弗里·瓦伊宁(G.Geoffrey Vining) 著
978-7-111-53282-8
99.00
494
2016年04月12日
王辰勇 译
数学 > 统计 > 统计学
John Wiley & Sons(USA)
599
简体中文
16
Introduction to Linear Regression Analysis,Fifth Edition
教材
统计学精品译丛







本书是世界公认的《回归分析》标准教材(a leading textbook on regression)。不仅从理论上介绍了当今统计学中用到的传统回归方法,还补充介绍了尖端科学研究中不太常见的回归方法。难能可贵的是,作者有丰富的教学经验和实际应用经验,使得本书理论和应用并重,还给出实际应用中应该注意的问题。新版除利用Minitab, SAS,S-PLUS软件外,还融入了最新流行的 JMP 软件和 R 软件,来阐释相关技术方法。配套资源很丰富,数据、教学PPT等可免费下载。
本书全面介绍了线性回归分析在当今尖端的科学研究中的传统内容以及不太常见的应用。作者把理论和实践相结合,为读者在各领域(包括工程、管理和健康科学)的研究中应用回归建模技术提供了所需的基本原则。
除了对回归建模的概述,本书还涉及典型的应用和一些技术工具,包括基本的推理过程、模型的适用性检验以及对多项式回归模型的进一步介绍。之后,讨论了如何运用转换和加权最小二乘解决模型的不适用性和观测值的强影响。
第5版新增了众多主题,包括:
时间序列数据的回归分析,介绍了杜宾-沃森检验和其他技术来探测模型的自相关以及参数估计。
带有随机效应的回归模型以及重抽样和混合模型的重要性。
对各个回归系统和系数子集的测试。
举例说明简单线性回归模型和多元回归模型的应用,以理解病人满意度的数据。
除了统计软件Minitab、SAS和S-PLUS,作者还结合JMP和免费R软件来讨论新版本中的技术和程序。本书添加了大量的练习,帮助读者测试对材料的理解。
道格拉斯 C.蒙哥马利(Douglas C.Montgomery) 世界著名的统计学家,亚利桑那州立大学工业与管理系统工程教授,美国统计学会、工业工程学会、质量控制学会会士。他不仅在统计学许多研究领域都做出了突出的贡献,还受IBM、可口可乐、波音、摩托罗拉等著名公司之邀,将统计方法应用于半导体、医疗设备、生物技术等领域的众多实际项目。除本书外,他还著有11本畅销统计教材。
伊丽莎白 A.派克(Elizabeth A.Peck) 可口可乐公司的物流建模专家。
G.杰弗里·瓦伊宁(G.Geoffrey Vining) 弗吉尼亚理工大学的统计系教授。他的研究兴趣广泛,包括实验设计和质量改进的分析、响应面方法以及统计过程控制。他是美国统计学会和质量控制学会会士,也是《Generalized Linear Models: With Applications in Engineering and the Sciences》的作者之一。
回归分析是广泛用于分析多因子数据的方法之一.回归分析使用方程来表达所感兴趣的变量(响应变量)与一系列相关预测变量之间的关系,其中所产生的概念逻辑过程使本书具有广泛的吸引力与实用性.因为回归分析隐含着优雅的数学,同时也有完善的统计学理论,所以回归分析在理论上也是非常有趣的.成功地使用回归分析,就要从理论与常见的实际问题两个方面,将其应用于实际数据.
本书适合作为回归分析的入门教材,包含了回归分析中的标准论题,也涉及许多新的论题.本书理论与应用实例并重,使读者不仅理解必要的基本原理,还能将各种回归建模方法应用于具体环境中.本书最初成书于回归分析课程的笔记,该课程面向高年级本科生与一年级研究生,学生来自不同的专业:工程学、化学与物理科学、统计学、数学,以及管理学.本书也曾用于面向专业人士的入门培训.本书假定读者学过统计学的入门课程,并熟悉假设检验、置信区间以及正态分布、t分布、卡方分布与F分布,矩阵代数的某些知识也是必要的.
在回归分析的现代应用中,计算机扮演了重要的角色.今天,即便是电子表格软件,也可以使用最小二乘法来拟合回归方程.因此,本书整合了许多软件的使用方法,给出数据表格与图形输出,并总体上讨论了某些计算机软件包的功能.本书使用了Minitab、JMP、SAS与R来处理各种问题与例子.之所以选择这些软件包,是因为它们广泛用于实践和教学.许多作业习题都要使用统计软件包来求解.本书的所有数据都可以通过出版商以电子形式获得.ftp地址为:ftp://ftp.wiley.com/public/sci_tech_med/introduciton_linear_regression,其中汇总了数据、习题解答、PowerPoint文件,以及与本书相关的其他材料.
第5版的改进
本书第5版有很多改进,包括:重新组合了课文材料,新的例子,新的习题,关于时间序列回归分析的新的一章,以及关于回归模型试验设计的新材料.进行修订的目的是使本书更好地用作教材与参考书,并更新对某些论题的讨论.
第1章从整体上介绍了回归建模,并描述了回归分析的某些典型应用.第2章与第3章提供了简单回归与多元回归中最小二乘模型拟合的标准结果,以及基本的推断程序(假设检验、置信区间与预测区间).第4章讨论了模型适用性检验的基本方法,包括残差分析,其中强调了残差图、离群点的探测与处理、PRESS统计量,以及失拟检验.第5章讨论了如何将数据变换与加权最小二乘法用于解决模型不适用这一问题,如何处理违背基本回归假设的情形.本章也介绍了Box-Cox(博克斯考克斯)方法与Box-Tidwell方法,从分析的角度设定数据变换的形式.第6章展示了诊断统计量,并简单讨论了如何处理强影响观测值.第7章讨论了多项式回归模型及其各种变形.本章的论题包括多项式拟合与推断的基本程序,以多项式、分层多项式与分段多项式为中心的讨论,同时拥有多项式与三角函数项的模型,正交多项式,响应曲面方法概述,以及非参数回归方法与光滑回归方法的介绍.第8章介绍了指示变量,同时将回归模型与方差分析模型进行了联系.第9章关注多重共线性问题,包括对多重共线性来源的讨论,多重共线性的危害、诊断量与各种诊断性度量.本章介绍了有偏估计,包括岭回归及其某些变种,以及主成分回归.第10章研究了变量选择与模型构建方法,包括逐步回归程序与所有可能回归.本章也讨论与解释了评估子集模型的某些准则.第11章展示了用于回归模型验证的一系列方法.
前11章是本书的核心,这11章贯穿着许多概念与例子.其余四章讨论回归实践中比较重要的各种论题,可以独立阅读.第12章介绍了非线性回归,而第13章简单讨论了广义线性模型.虽然这两章可能不是线性回归教材的标准论题,但是不介绍这两章,对工程学与自然科学的学生与教授将是非常不负责任的.第14章讨论时间序列数据的回归模型.第15章概述了几个重要论题,包括稳健回归、回归变量中测量误差的影响、逆估计即校准问题、自助回归估计值、分类回归树、神经网络,以及回归试验设计.
除了正文的内容外,附录C简短地给出了理论性更强的某些其他论题.回归分析的专家与利用本书讲授高级课程的教师会对其中某些论题更感兴趣.计算在许多回归课程中都扮演着重要角色,这些课程广泛使用Minitab、JMP、SAS与R.本教材提供了这些统计软件包的输出.附录D介绍了使用SAS处理回归问题.附录E介绍了R.
本书作为教材如何使用
本书覆盖了广泛的论题,有很大的灵活性.对于回归分析的入门课程,推荐详细讲授第1至10章,然后选出学生特别感兴趣的论题.举例来说,作者之一(D.C.M.)定期讲授一门面向工程学学生的回归课程,论题包括非线性回归(因为工程学中经常出现的机械模型几乎永远是非线性模型)、神经网络以及回归模型验证,其他的推荐论题有多重共线性(因为学生经常会遇到多重共线性问题)、广义线性模型导论——主要关注逻辑斯蒂回归.G.G.V.讲授过一门面向统计学研究生的回归分析课程,大量使用了附录C中的材料.
我们认为,应当将计算机直接整合进课程中.近年来,在大多数课堂上都采用笔记本电脑与计算机投影设备,像在讲座中那样解释回归方法.我们发现,这样可以极大地促进学生对回归方法的理解.我们也要求学生使用回归软件来解题.在大多数情况下,习题都使用了实际数据,或是来自现实世界的议题,以表示回归分析的一般性应用.
教师手册包含了所有习题的答案、所有电子版数据集,以及可能适合于考试的习题.
致谢
感谢在准备本书的过程中提供了反馈与帮助的人.Scott M.Kowalski、Ronald G.Askin、Mary Sue Younger、Russell G.Heikes、John A.Cornell、André I.Khuti、George C.Runger、Marie Gaudard、James W.Wisnowski、Ray Hill与James R.Simpson博士给出了许多建议,他们的建议极大地改良了本书的前几版与第5版.我们特别感激为本书提供反馈的许多研究生与实践专家,他们洞察出问题所在,丰富或拓展了本书的材料.我们也要感谢约翰威利父子公司、美国统计学会以及生物统计学委员会,他们大度地允许我们使用其版权材料.

Douglas C.Montgomery
Elizabeth A.Peck
G.Geoffrey Vining
译者序
前言
第1章 导引1
 1.1 回归与建模1
 1.2 数据收集4
 1.3 回归的用途7
 1.4 计算机的角色7
第2章 简单线性回归9
 2.1 简单线性回归模型9
 2.2 回归参数的最小二乘估计9
  2.2.1 β0与β1的估计9
  2.2.2 最小二乘估计量的性质与回归模型拟合13
  2.2.3 σ2的估计14
  2.2.4 简单线性回归模型的另一种形式15
 2.3 斜率与截距的假设检验15
  2.3.1 使用t检验16
  2.3.2 回归显著性检验16
  2.3.3 方差分析18
 2.4 简单线性回归的区间估计20
  2.4.1 β0、β1与σ2的置信区间20
  2.4.2 响应变量均值的区间估计21
 2.5 新观测值的预测23
 2.6 决定系数24
 2.7 回归在服务业中的应用25
 2.8 使用SAS和R做回归分析27
 2.9 对回归用途的若干思考29
 2.10 过原点回归31
 2.11 极大似然估计35
 2.12 回归变量x为随机变量的情形36
  2.12.1 x与y的联合分布36
  2.12.2 x与y的正态联合分布:相关模型37
 习题40
第3章 多元线性回归47
 3.1 多元回归模型47
 3.2 模型参数的估计49
  3.2.1 回归系数的最小二乘估计49
  3.2.2 最小二乘法的几何解释55
  3.2.3 最小二乘估计量的性质55
  3.2.4 σ2的估计56
  3.2.5 多元回归中散点图的不适用性57
  3.2.6 极大似然估计58
 3.3 多元回归中的假设检验59
  3.3.1 回归显著性检验59
  3.3.2 单个回归系数的检验与回归系数子集的检验61
  3.3.3 X中列为正交列的特例65
  3.3.4 一般线性假设的检验66
 3.4 多元回归中的置信区间68
  3.4.1 回归系数的置信区间68
  3.4.2 响应变量均值的置信区间估计69
  3.4.3 回归系数的联合置信区间70
 3.5 新观测值的预测72
 3.6 病人满意度数据的多元回归模型73
 3.7 对基本多元线性回归使用SAS与R74
 3.8 多元回归中所隐含的外推法77
 3.9 标准化回归系数79
 3.10 多重共线性82
 3.11 回归系数为什么有错误的正负号84
 习题85
第4章 模型适用性检验91
 4.1 导引91
 4.2 残差分析91
  4.2.1 残差的定义91
  4.2.2 残差尺度化方法92
  4.2.3 残差图97
  4.2.4 偏回归图与偏残差图100
  4.2.5 使用Minitab、SAS与R做残差分析102
  4.2.6 残差的其他作图与分析方法104
 4.3 PRESS统计量105
 4.4 离群点的探测与处理106
 4.5 回归模型的失拟108
  4.5.1 失拟的正规检验109
  4.5.2 通过近邻点估计纯误差112
 习题116
第5章 修正模型不适用性的变换与加权120
 5.1 导引120
 5.2 方差稳定化变换120
 5.3 模型线性化变换123
 5.4 选择变换的分析方法127
  5.4.1 对y进行变换:博克斯考克斯方法127
  5.4.2 对回归变量进行变换129
 5.5 广义最小二乘与加权最小二乘131
  5.5.1 广义最小二乘131
  5.5.2 加权最小二乘133
  5.5.3 若干实用问题133
 5.6 带有随机效应的回归模型135
  5.6.1 子抽样135
  5.6.2 含有单一随机效应的回归模型的一般情形140
  5.6.3 混合模型在回归中的重要性142
 习题142
第6章 杠杆与强影响的诊断149
 6.1 探测强影响观测值的重要性149
 6.2 杠杆150
 6.3 强影响的度量:库克D距离152
 6.4 强影响的度量:DFFITS与DFBETAS153
 6.5 模型性能的度量155
 6.6 探测强影响观测值的群体156
 6.7 强影响观测值的处理156
 习题157
第7章 多项式回归模型158
 7.1 导引158
 7.2 单变量的多项式模型158
  7.2.1 基本原理158
  7.2.2 分段多项式拟合(样条)162
  7.2.3 多项式与三角式166
 7.3 非参数回归167
  7.3.1 核回归167
  7.3.2 局部加权回归168
  7.3.3 最后的警告171
 7.4 两个或更多变量的多项式模型171
 7.5 正交多项式177
 习题180
第8章 指示变量185
 8.1 指示变量的一般概念185
 8.2 关于指示变量用途的评注194
  8.2.1 指示变量与指定代码回归194
  8.2.2 用指示变量代替定量回归变量195
 8.3 方差分析的回归方法195
 习题199
第9章 多重共线性203
 9.1 导引203
 9.2 多重共线性的来源203
 9.3 多重共线性的影响205
 9.4 多重共线性的诊断209
  9.4.1 考察协方差矩阵209
  9.4.2 方差膨胀因子212
  9.4.3 X′X的特征系统分析213
  9.4.4 其他诊断量216
  9.4.5 生成多重共线性诊断量的SAS代码与R代码217
 9.5 处理多重共线性的方法217
  9.5.1 收集额外数据217
  9.5.2 模型重设218
  9.5.3 岭回归218
  9.5.4 主成分回归225
  9.5.5 有偏估计量的比较与评估230
 9.6 使用SAS做岭回归与主成分回归231
 习题233
第10章 变量选择与模型构建236
 10.1 导引236
  10.1.1 模型构建问题236
  10.1.2 模型误设的后果237
  10.1.3 评估子集回归模型的准则239
 10.2 变量选择的计算方法243
  10.2.1 所有可能的回归243
  10.2.2 逐步回归方法248
 10.3 变量选择与模型构建的策略252
 10.4 案例研究:使用SAS研究Gorman和Toman沥青数据254
 习题266
第11章 回归模型的验证269
 11.1 导引269
 11.2 模型验证的方法269
  11.2.1 模型系数与预测值的分析270
  11.2.2 收集新数据——确认性试验271
  11.2.3 数据分割272
 11.3 来自试验设计的数据279
 习题280
第12章 非线性回归导引282
 12.1 线性回归模型与非线性回归模型282
  12.1.1 线性回归模型282
  12.1.2 非线性回归模型282
 12.2 非线性模型的起源283
 12.3 非线性最小二乘285
 12.4 将非线性模型变换为线性模型287
 12.5 非线性系统中的参数估计289
  12.5.1 线性化289
  12.5.2 参数估计的其他方法294
  12.5.3 初始值295
 12.6 非线性回归中的统计推断296
 12.7 非线性模型的实例297
 12.8 使用SAS与R298
 习题301
第13章 广义线性模型305
 13.1 导引305
 13.2 逻辑斯蒂回归模型305
  13.2.1 有二值响应变量的模型305
  13.2.2 逻辑斯蒂回归模型中的参数估计307
  13.2.3 解释逻辑斯蒂回归模型中的参数310
  13.2.4 模型参数的统计推断311
  13.2.5 逻辑斯蒂回归中的诊断检验318
  13.2.6 二值响应数据的其他模型319
  13.2.7 分类回归变量的结果多于两个320
 13.3 泊松回归321
 13.4 广义线性模型326
  13.4.1 连接函数与线性预测项326
  13.4.2 GLM的参数估计与推断327
  13.4.3 使用GLM进行预测与估计330
  13.4.4 GLM中的残差分析331
  13.4.5 使用R做GLM分析333
  13.4.6 超散布性335
 习题335
第14章 时间序列数据的回归分析344
 14.1 时间序列数据的回归模型导引344
 14.2 自相关的探测:杜宾沃森检验344
 14.3 时间序列回归模型中的参数估计348
 习题361
第15章 使用回归分析时的其他论题364
 15.1 稳健回归364
  15.1.1 为什么需要稳健回归364
  15.1.2 M-估计量366
  15.1.3 稳健估计量的性质372
 15.2 测量误差对回归的影响373
  15.2.1 简单线性回归373
  15.2.2 博克森模型374
 15.3 逆估计——校准问题374
 15.4 回归自助法377
  15.4.1 回归中的自助抽样378
  15.4.2 自助置信区间378
 15.5 分类回归树(CART)382
 15.6 神经网络384
 15.7 回归试验设计386
 习题393
附录A 统计用表395
附录B 习题数据集406
附录C 统计方法的补充内容425
附录D SAS导论453
附录E R导论并用R做线性回归461
参考文献464
索引479
历经十个月,我终于翻译完成了这本600余页的著作.这是我第一本译著,也是我第一次从事系统的翻译工作.今天,我诚惶诚恐地将这本译著献给大家.
本书是一本权威的回归分析著作,被许多美国大学用作教材.本书的第一作者蒙哥马利先生是一位著名的工程统计学家,著有十几本著作,其中包括《试验设计与分析》《统计质量控制》《响应曲面方法》《工程统计学》等权威教材.本书秉承了蒙哥马利先生在工程统计领域的写作风格,旁征博引,大量使用各个领域的实际数据(尤其是工程数据)作为例子,这极大地增加了读者的兴趣与对回归分析方法的理解,但也为本书的翻译工作带来了不小的难度.
一本译著的完成,离不开身边支持我的人.首先要感谢华章公司对我的信任,将这本权威的名著交给了我,并给予了我一些帮助.还要感谢已经陪我走过了十年的小伙伴们,尤其是傅泽伟、韩旭、王尉、王潇、张旭斌;翻译本书期间恰逢我一次重大的人生转折,是他们在我最困窘与彷徨的时候,给予了我巨大的帮助与启迪.最后,要感谢我年迈的父母,没有他们的督促与激励,这本译著的完成时间恐怕还要延后,谨将这本译著献给他们.
原书出版商没有提供本书的电子版,所以我直接将原文笔译在纸上,然后再使用LaTeX录入.虽然翻译本书花费了我大量的精力,但是翻译的过程也是我个人提高的过程,令我收获颇丰.由于经验与时间所限,译文难以做到尽善尽美,其中的不当与错误之处,请读者不吝指正.

王辰勇
2015年10月
数学\统计学
读者书评
发表评论



高级搜索
统计学及其应用(原书第2版)
应用预测建模
统计学习导论——基于R应用


版权所有© 2017  北京华章图文信息有限公司 京ICP备08102525号 京公网安备110102004606号
通信地址:北京市百万庄南街1号 邮编:100037
电话:(010)68318309, 88378998 传真:(010)68311602, 68995260
高校教师服务
华章教育微信
诚聘英才
诚聘英才