【内容简介】
《林木遗传模型统计分析及R语言实现》系统地阐述了多种林木遗传育种统计模型参数估计和假设检验的基本方法与应用。共分8章。第1章介绍固定效应模型和*效应模型概念。第2章至第6章分别论述半同胞子代测定、巢式设计、因子交配设计、双列杂交设计和多地点多年份家系试验遗传模型分析方法。最后两章介绍方差分量约束极大似然估计和育种值的*线性无偏预测的混合模型方程方法。各章配有模拟试验数据和R语言计算程序。
【目录】
目录前言
1 固定效应模型和随机效应模型 1
1.1 固定效应模型 1
1.1.1 模型表达式 1
1.1.2 无约束模型的参数估计 4
1.1.3 约束模型的参数估计 7
1.2 随机效应模型 9
1.2.1 方差分量估计 9
1.2.2 方差分量的假设检验 14
1.3 R语言程序 18
1.3.1 无约束固定效应模型计算程序 18
1.3.2 约束固定效应模型计算程序 19
1.3.3 随机效应模型计算程序 21
思考与练习 23
2 半同胞子代测定遗传模型 24
2.1 单点多株小区试验统计模型 24
2.1.1 一般配合力 24
2.1.2 遗传方差估计与假设检验 25
2.1.3 遗传力 27
2.1.4 遗传相关系数 29
2.2 多点多株小区试验统计模型 30
2.2.1 一般配合力 31
2.2.2 遗传方差估计与假设检验 31
2.2.3 遗传力 35
2.2.4 遗传相关系数 36
2.3 实例分析及其R语言计算程序 38
2.3.1 单点多株小区试验实例 38
2.3.2 多点多株小区试验实例 46
思考与练习 58
3 巢式设计遗传模型 59
3.1 包含区组和重复的巢式设计统计模型 59
3.1.1 固定效应模型 59
3.1.2 随机效应模型 60
3.1.3 遗传力 63
3.1.4 遗传相关系数 64
3.2 包含区组但不含重复的巢式设计统计模型 66
3.2.1 固定效应模型 66
3.2.2 随机效应模型 66
3.2.3 遗传力 69
3.2.4 遗传相关系数 70
3.3 不包含区组和重复的巢式设计统计模型 71
3.4 实例及R语言计算程序 73
3.4.1 包含区组和重复的巢式设计实例 73
3.4.2 包含区组但不包含重复的巢式设计实例 84
思考与练习 92
4 因子交配设计遗传模型 93
4.1 多地点多区组因子交配设计统计模型 93
4.1.1 固定效应模型 94
4.1.2 随机效应模型 95
4.1.3 遗传力 102
4.1.4 遗传相关系数 106
4.2 单地点多区组因子交配设计统计模型 108
4.2.1 固定效应模型 108
4.2.2 随机效应模型 109
4.2.3 遗传力 110
4.2.4 遗传相关系数 112
4.3 单地点不含区组因子交配设计统计模型 114
4.4 实例及R语言计算程序 115
4.4.1 多地点多区组因子交配设计实例 115
4.4.2 单地点多区组因子交配设计实例 129
思考与练习 140
5 双列杂交设计遗传模型 141
5.1 半双列杂交遗传模型 142
5.1.1 固定效应模型 142
5.1.2 随机效应模型 143
5.1.3 遗传力 145
5.1.4 遗传相关系数 146
5.2 全双列杂交遗传模型 147
5.2.1 固定效应模型 148
5.2.2 随机效应模型 148
5.2.3 遗传力 150
5.2.4 遗传相关系数 151
5.3 多地点半双列杂交遗传模型 153
5.3.1 固定效应模型 153
5.3.2 随机效应模型 154
5.3.3 遗传力 155
5.3.4 遗传相关系数 157
5.4 多地点全双列杂交遗传模型 158
5.4.1 固定效应模型 158
5.4.2 随机效应模型 159
5.4.3 遗传力 162
5.4.4 遗传相关系数 163
5.5 实例及R语言计算程序 165
5.5.1 半双列杂交设计实例 165
5.5.2 全双列杂交设计实例 173
5.5.3 多地点全双列杂交设计实例 181
思考与练习 193
6 多地点多年份家系试验遗传模型 194
6.1 多地点家系试验统计模型 194
6.1.1 固定效应模型 194
6.1.2 随机效应模型 195
6.1.3 遗传相关系数 197
6.2 多年份家系试验统计模型 198
6.2.1 固定效应模型 199
6.2.2 随机效应模型 200
6.2.3 遗传相关系数 202
6.3 多地点多年份家系试验统计模型 204
6.3.1 固定效应模型 204
6.3.2 随机效应模型 206
6.3.3 遗传相关系数 209
6.4 实例及R语言计算程序 211
6.4.1 多地点家系试验实例 211
6.4.2 多年份家系试验实例 219
6.4.3 多地点多年份家系试验实例 229
思考与练习 242
7 方差分量约束极大似然估计 243
7.1 ML估计 243
7.2 REML估计 245
7.3 实例及R语言计算程序 248
思考与练习 255
8 育种值的最佳线性无偏预测 256
8.1 混合模型方程 256
8.2 动物模型 260
8.3 多地点半同胞子代测定试验育种值计算 265
思考与练习 275
参考文献 276
附录A 矩阵基本概念和运算 278
A1 矩阵的定义 278
A2 矩阵的运算 280
A3 矩阵的分块运算 284
A4 特征值和特征向量 288
A5 正定矩阵和半正定矩阵 293
思考与练习 295
附录B 林木遗传模型统计分析软件 297
B1 半同胞子代测定遗传模型分析软件HalfsibSS 297
B2 巢氏设计遗传模型分析软件WinNC1 297
B3 因子交配设计遗传模型分析软件WinNC2 298
B4 双列杂交设计配合力分析软件GSCA 298
附录C R语言简介 300
C1 R语言软件下载与安装 300
C2 R语言工作窗口 300
C3 R语言矩阵运算符和控制语句 301
【免费在线读】
1 固定效应模型和随机效应模型
林木育种试验的主要目的在于获取相关试验材料的遗传参数,为后续进一步开展育种试验或生产实践提供理论依据。为了估计遗传参数,需要建立适当的线性统计分析模型。这些统计模型可分为固定效应模型和随机效应模型,甚至同一个模型由于估计不同遗传参数的需要,一方面可作为固定效应模型来分析,另一方面可作为随机效应模型来分析。一般来说,估算亲本的配合力或育种值要用固定效应模型,而估计遗传方差分量进而计算遗传力则要用随机效应模型。
本章以一个简单的例子来说明固定效应模型和随机效应模型统计分析原理,给出参数估计公式和假设检验统计量,并给出有关计算的R语言程序。
1.1 固定效应模型
1.1.1 模型表达式
设在杉木杂交试验中,有3个父本分别与3个母本交配,子代按随机区组造林,每个组合抽取若干个单株,以3年生苗高数据估算亲本的一般配合力和特殊配合力,数据列于表1.1。为了估计亲本配合力并进行相关的统计假设检验,首先建立如下线性统计模型:
(1.1)
其中, 为第 个父本与第 个母本杂交后代的第 个个体性状(苗高)的表型值; 为总平均; 为第 个父本的效应或一般配合力; 为第 个母本的效应或一般配合力; 为第 个父本第 个母本的交互效应或特殊配合力; 为随机误差效应,假定 并且相互独立。这里 、 和 均为固定效应,而且满足以下约束条件:
(1.2)
表1.1 杉木苗高试验数据 (单位:cm)
父本 母本 苗高 父本 母本 苗高
1 1 167 2 2 162
1 1 162 2 2 188
1 1 160 2 3 172
1 2 172 2 3 176
1 2 171 3 1 158
1 3 206 3 1 174
1 3 181 3 1 153
1 3 185 3 2 169
2 1 173 3 2 175
2 1 158 3 2 153
2 1 176 3 3 148
2 2 178 3 3 176

根据表1.1中杉木苗高数据,模型(1.1)的具体形式为
(1.3)
而相应的约束条件可表示为
(1.4)
模型(1.3)及其约束条件可以用向量和矩阵来表示:
(1.5)
其中,
, , , ,

1.1.2 无约束模型的参数估计
由约束条件式(1.4)可知,参数向量 的16个变量中有7个不是独立的,选取其中的7个变量,它们可由其他参数表示如下:
(1.6)
将上述关系式代入模型(1.5)得到无约束的线性模型:
(1.7)
其中, 为未知参数向量; 为列满秩的设计阵,且



使用最小二乘法估计参数向量 ,就是求 而使模型(1.7)的误差平方和
(1.8)
达到最小。为此,在式(1.8)中对参数向量 求导数:
(1.9)
令导数等于零,得到 的最小二乘估计为
(1.10)
在正态性的假定下,可以验证 也是极大似然估计, 的无偏估计可表示为
(1.11)
其中, 为残差平方和, 为设计阵 的秩。此外, 的协方差矩阵为
(1.12)
式(1.12)可以给出参数估计的标准误差。
下面考虑参数的假设检验问题。例如,要检验 是否显著为零,首先提出零假设 。在此假设成立的条件下,将 的第二列删除变为 ,当然 中的参数 也随之删除变为 ,由式(1.10)可以得到零假设下参数的最小二乘估计 ,以及残差平方和 。考虑到设计阵 是列满秩的,根据线性模型中假设检验理论(王松桂,1987),该检验的统计量为
(1.13)
这里由于 分布的第一个自由度为1,所以可以等价地使用 检验。对于零假设 的检验问题, 检验的统计量的表达式为(何晓群,2001)
(1.14)
其中, 为矩阵 对角线的第 个元素。
类似地可以检验其他变量,还可以检验两个变量是否相等,甚至可以检验整个父本效应是否有显著差异。所有这些检验都可以表示为
(1.15)
例如,对于零假设 ,则 ;对于零假设 ,则

在零假设式(1.15)成立的情况下,参数向量 的最小二乘估计为
(1.16)
相应的残差平方和为 ,因此检验统计量为
(1.17)
这里 。
根据式(1.10)、式(1.12)和式(1.14)计算得到无约束条件下杉木各数据的参数估计及其标准误、假设检验 统计量和 值(表1.2)。对于零假设 ,根据式(1.17)可以计算出检验父本效应是否有显著差异的统计量为

再根据 分布计算出相应的 值为 。类似地可以分别得到母本效应差异是否显著和父本与母本交互效应的差异是否显著的检验统计量及其 值(表1.3)。根据零假设 和式(1.17)计算得到检验第一个父本和第二个父本的效应是否有显著差异的统计量 或 ,对应的 值为 ,说明第一个父本的效应和第二个父本的效应差异不显著。
表1.2 两种固定效应模型下的参数估计及其标准误
参数 无约束模型 约束模型
估计 标准误 值

估计 标准误 值



170.389 2.2875 74.4865 0.0000 170.389 2.2875 74.4865 0.0000

4.6667 3.2350 1.4425 0.1697 4.6667 3.2350 1.4425 0.1697

2.6111 3.2350 0.8071 0.4322 2.6111 3.2350 0.8071 0.4322

— — — — ?7.2778 3.2350 ?2.2497 0.0399

?5.8333 3.1174 ?1.8712 0.0809 ?5.8333 3.1174 ?1.8712 0.0809

0.6667 3.2350 0.2061 0.8395 0.6667 3.2350 0.2061 0.8395

— — — — 5.1667 3.3486 1.5429 0.1437

?6.2222 4.4086 ?1.4114 0.1785 ?6.2222 4.4086 ?1.4114 0.1785

?4.2222 4.7356 ?0.8916 0.3867 ?4.2222 4.7356 ?0.8916 0.3867

— — — — 10.4444 4.5750 2.2829 0.0374

1.8333 4.4086 0.4159 0.6834 1.8333 4.4086 0.4159 0.6834
返回顶部