题目
再次使用Compute命令,调出Compute variable对话框,在对话框中输入等式:根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。6.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。解:用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:表6.7 特征根和方差贡献率表表6.8 因子载荷阵表6.6 特征向量矩阵 z1z2x10.29 0.47 x20.28 0.48 x30.14 -0.29 x40.31 -0.37 x50.40 -0.20 x60.40 -0.27 x70.31 0.39 x80.39 0.12 x90.39 -0.24 根据表6.6得主成分的表达式:分别计算出以上三项后,利用公式得到综合得分并排序如下表:地区y1y2y深圳170038.89 254204.05 197055.90 上海70185.88 34213.02 58.38.59 厦门50894.53 69593.93 56897.04 广州55849.21 32174.58 48249.65 杭州42167.71 29244.98 38019.51 宁波40552.85 28367.34 36641.30 北京45747.38 115.5.73 34771.86 南宁45747.38 115.5.73 34771.86 天津39597.90 21080.52 3.653.82 海口39597.90 21080.52 3.653.82 南京36680.75 25804.65 33189.52 青岛35237.27 14552.46 28597.44 大连31830.56 17629.53 2.272.03 济南25149.73 1649..39 2.372.97 福州22734.16 16.26.97 20677.45 乌鲁木齐22284.54 15284.68 20037.59 沈阳23184.99 12310.22 19694.19 武汉23909.27 9770.56 19370.75 长春21524.95 14179.21 1916..96 成都338.8.79 -17638.73 17294.14 太原19445.42 9.09.99 16352.45 郑州1.561.81 982..90 15756.62 兰州16568.97 13769.80 15670.44 海口17666.70 11325.77 15631.26 昆明184.4.34 8579.72 15311.75 呼和浩特16128.60 13359.10 15239.59 长沙18845.23 6252.54 14802.98 石家庄18229.33 7399.62 14752.99 西安16764.15 4871.97 12946.76 南昌14598.40 928..20 12893.83 哈尔滨15782.07 6297.20 12737.43 合肥14319.85 8659.41 12502.85 银川12865.97 10.60.08 12254.18 贵阳15339.90 4138.48 1174..24 重庆27859.53 -22407.66 11723.76 西宁10.50.62 614..51 9068.36 南宁11526.86 267..29 8686.15 最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。根据表7.3易得:表7.3 因子得分系数矩阵将每个学生的六门成绩分别代入F1、F2,比较两者的大小,F1大的适合学文,F2大的适合学理。计算结果为学号是1、16、24的学生适合学文,其余均适合学理。7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。品牌价格发动机功率轴距宽长轴距燃料容量燃料效率A21501.81401.1.267.3172.42.63913.228A28403.2225108.170.3192.93.51717.225A420003.5210114.671.4196.63.85018.022B239901.8150102.668.2178.02.99816.427B339502.820108.776.1192.3.56118.522B620004.2310113.074.0198.23.90223.721C26992.5170107.368.4176.03.17916.626C334002.8193107.368.5176.03.19716.624C389002.819311..470.918..03.47218.525D219753.1175109.072.7194.63.36817.525D25303.824019.072.7196.23.54317.523D319653.825113.874.7206.83.77818.524D278853.8205112.273.5200.03.59117.525E398954.6275115.374.5207.23.97818.522E396654.6275108.75.520..63.84319.022E310103.020107.470.3194.83.77018.22E462255.7255117.57..0201.25.57230.015F132602.2115104.167.9180.92.67614.327F165353.117107.069.4190.43.05115.25F188903.1175107.572.5200.93.33016.625F193903.4180110.572.7197.93.3417.027F243403.820101.174.1193.23.50016.825F457055.7345104.573.6179.73.2119.122F139601.812097.166.7174.32.39813.233F92351.05593.162.6149.41.89510.345F188903.4180110.573.20..03.38917.027G198402.5163103.769.7190.92.96715.924G244952.5168106.069.2193.03.33216.024G222452.7200113.074.4209.13.45217.026G16482.0132108.071.0186.02.91116.027G283403.5253113.074.4207.73.56417.23G291853.5253113.074.4197.83.56717.023解:令价格为X1,发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X7.燃料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7。此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个成分贡献了90.9%,因此重复因子分析过程,并在第三步Extraction子对话框中的Number of factors后的矩形框中输入3,即为要提取的公因子的数目。因子分析结果如下:表7.4 旋转后的因子得分系数矩阵其简化了指标体系为、、,从旋转后的因子得分系数矩阵得:设个总体相应的维样本空间为 。在规则下,将属于的样品错判为的概率为 则这种判别规则下样品错判后所造成的平均损失为 则用规则来进行判别所造成的总平均损失为贝叶斯判别法则,就是要选择一种划分,使总平均损失达到极小。基本方法:令,则 若有另一划分,则在两种划分下的总平均损失之差为因为在上对一切成立,故上式小于或等于零,是贝叶斯判别的解。从而得到的划分为 4.5 简述费希尔判别法的基本思想和方法。答:基本思想:从个总体中抽取具有个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答: 费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 当k=2时,若则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。③ 当时,费希尔判别用作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是 X ,W(X)X ,W(X)<lnd距离判别的判别规则是X ,W(X)X ,W( )
再次使用Compute命令,调出Compute variable对话框,在对话框中输入等式:根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。
6.10 根据习题
5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。解:用SPSS进行主成分分析的具体方法参见
6.8,分析结果如下:表
6.7 特征根和方差贡献率表表
6.8 因子载荷阵表
6.6 特征向量矩阵 z1z2x1
0.29
0.47 x20.28
0.48 x30.14 -
0.29 x4
0.31 -
0.37 x5
0.40 -
0.20 x6
0.40 -
0.27 x7
0.31
0.39 x8
0.39
0.12 x90.39 -
0.24 根据表
6.6得主成分的表达式:分别计算出以上三项后,利用公式得到综合得分并排序如下表:地区y1y2y深圳17003
8.89 25420
4.05 19705
5.90 上海70185.88 34213.02 5
8.38.59 厦门5089
4.53 6959
3.93 56897.04 广州5584
9.21 3217
4.58 48249.65 杭州4216
7.71 29244.98 3801
9.51 宁波4055
2.85 2836
7.34 3664
1.30 北京4574
7.38 11
5.5.73 3477
1.86 南宁4574
7.38 11
5.5.73 3477
1.86 天津3959
7.90 2108
0.52
3.653.82 海口3959
7.90 21080.52
3.653.82 南京3668
0.75 2580
4.65 3318
9.52 青岛3523
7.27 1455
2.46 28597.44 大连31830.56 1762
9.53
2.272.03 济南2514
9.73 164
9..39
2.372.97 福州2273
4.16 1
6.26.97 2067
7.45 乌鲁木齐2228
4.54 1528
4.68 2003
7.59 沈阳2318
4.99 1231
0.22 1969
4.19 武汉2390
9.27 977
0.56 1937
0.75 长春2152
4.95 1417
9.21 191
6..96 成都33
8.8.79 -1763
8.73 1729
4.14 太原1944
5.42
9.09.99 1635
2.45 郑州
1.561.81 98
2..90 15756.62 兰州1656
8.97 1376
9.80 1567
0.44 海口1766
6.70 1132
5.77 1563
1.26 昆明18
4.4.34 8579.72 1531
1.75 呼和浩特16128.60 1335
9.10 1523
9.59 长沙1884
5.23 6252.54 1480
2.98 石家庄18229.33 7399.62 1475
2.99 西安16764.15 4871.97 1294
6.76 南昌1459
8.40 92
8..20 1289
3.83 哈尔滨15782.07 6297.20 1273
7.43 合肥14319.85 8659.41 12502.85 银川12865.97 1
0.60.08 1225
4.18 贵阳1533
9.90 4138.48 117
4..24 重庆2785
9.53 -2240
7.66 1172
3.76 西宁1
0.50.62 61
4..51 906
8.36 南宁1152
6.86 26
7..29 8686.15 最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。根据表
7.3易得:表
7.3 因子得分系数矩阵将每个学生的六门成绩分别代入F1、F2,比较两者的大小,F1大的适合学文,F2大的适合学理。计算结果为学号是1、16、24的学生适合学文,其余均适合学理。
7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。品牌价格发动机功率轴距宽长轴距燃料容量燃料效率A21501.8140
1.1.267.317
2.4
2.6391
3.228A2840
3.2225108.17
0.319
2.93.51717.225A42000
3.521011
4.67
1.419
6.63.8501
8.022B239901.815010
2.66
8.217
8.0
2.9981
6.427B33950
2.820108.77
6.1192.
3.56118.522B62000
4.231011
3.07
4.019
8.23.9022
3.721C2699
2.517010
7.368.417
6.0
3.1791
6.626C33400
2.819310
7.36
8.517
6.03.19716.624C38900
2.81931
1..47
0.91
8..0
3.4721
8.525D21975
3.117510
9.07
2.719
4.6
3.36817.525D25303.824019.07
2.719
6.2
3.5431
7.523D31965
3.825113.87
4.720
6.83.7781
8.524D278853.8205112.27
3.520
0.0
3.59117.525E398954.6275115.374.5207.2
3.9781
8.522E39665
4.627510
8.7
5.52
0..6
3.84319.022E31010
3.020107.47
0.319
4.83.7701
8.22E46225
5.725511
7.5
7..0201.2
5.5723
0.015F13260
2.2115104.167.918
0.9
2.6761
4.327F16535
3.11710
7.06
9.419
0.4
3.0511
5.25F18890
3.117510
7.57
2.520
0.93.3301
6.625F19390
3.4180110.57
2.719
7.9
3.341
7.027F24340
3.82010
1.17
4.119
3.23.5001
6.825F45705
5.734510
4.573.617
9.7
3.2119.122F13960
1.81209
7.16
6.7174.3
2.3981
3.233F9235
1.0559
3.162.614
9.41.8951
0.345F18890
3.418011
0.57
3.2
0..0
3.3891
7.027G19840
2.5163103.76
9.719
0.9
2.9671
5.924G24495
2.516810
6.06
9.219
3.0
3.3321
6.024G22245
2.7200113.07
4.420
9.13.4521
7.026G1648
2.013210
8.07
1.0186.0
2.9111
6.027G28340
3.525311
3.07
4.420
7.7
3.56417.23G291853.525311
3.07
4.419
7.83.5671
7.023解:令价格为X1,发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X
7.燃料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7。此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个成分贡献了9
0.9%,因此重复因子分析过程,并在第三步Extraction子对话框中的Number of factors后的矩形框中输入3,即为要提取的公因子的数目。因子分析结果如下:表
7.4 旋转后的因子得分系数矩阵其简化了指标体系为、、,从旋转后的因子得分系数矩阵得:设个总体相应的维样本空间为 。在规则下,将属于的样品错判为的概率为 则这种判别规则下样品错判后所造成的平均损失为 则用规则来进行判别所造成的总平均损失为贝叶斯判别法则,就是要选择一种划分,使总平均损失达到极小。基本方法:令,则 若有另一划分,则在两种划分下的总平均损失之差为因为在上对一切成立,故上式小于或等于零,是贝叶斯判别的解。从而得到的划分为
4.5 简述费希尔判别法的基本思想和方法。答:基本思想:从个总体中抽取具有个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答: 费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 当k=2时,若则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。③ 当时,费希尔判别用作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是 X ,W(X)X ,W(X)<lnd距离判别的判别规则是X ,W(X)X ,W( )
6.10 根据习题
5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。解:用SPSS进行主成分分析的具体方法参见
6.8,分析结果如下:表
6.7 特征根和方差贡献率表表
6.8 因子载荷阵表
6.6 特征向量矩阵 z1z2x1
0.29
0.47 x20.28
0.48 x30.14 -
0.29 x4
0.31 -
0.37 x5
0.40 -
0.20 x6
0.40 -
0.27 x7
0.31
0.39 x8
0.39
0.12 x90.39 -
0.24 根据表
6.6得主成分的表达式:分别计算出以上三项后,利用公式得到综合得分并排序如下表:地区y1y2y深圳17003
8.89 25420
4.05 19705
5.90 上海70185.88 34213.02 5
8.38.59 厦门5089
4.53 6959
3.93 56897.04 广州5584
9.21 3217
4.58 48249.65 杭州4216
7.71 29244.98 3801
9.51 宁波4055
2.85 2836
7.34 3664
1.30 北京4574
7.38 11
5.5.73 3477
1.86 南宁4574
7.38 11
5.5.73 3477
1.86 天津3959
7.90 2108
0.52
3.653.82 海口3959
7.90 21080.52
3.653.82 南京3668
0.75 2580
4.65 3318
9.52 青岛3523
7.27 1455
2.46 28597.44 大连31830.56 1762
9.53
2.272.03 济南2514
9.73 164
9..39
2.372.97 福州2273
4.16 1
6.26.97 2067
7.45 乌鲁木齐2228
4.54 1528
4.68 2003
7.59 沈阳2318
4.99 1231
0.22 1969
4.19 武汉2390
9.27 977
0.56 1937
0.75 长春2152
4.95 1417
9.21 191
6..96 成都33
8.8.79 -1763
8.73 1729
4.14 太原1944
5.42
9.09.99 1635
2.45 郑州
1.561.81 98
2..90 15756.62 兰州1656
8.97 1376
9.80 1567
0.44 海口1766
6.70 1132
5.77 1563
1.26 昆明18
4.4.34 8579.72 1531
1.75 呼和浩特16128.60 1335
9.10 1523
9.59 长沙1884
5.23 6252.54 1480
2.98 石家庄18229.33 7399.62 1475
2.99 西安16764.15 4871.97 1294
6.76 南昌1459
8.40 92
8..20 1289
3.83 哈尔滨15782.07 6297.20 1273
7.43 合肥14319.85 8659.41 12502.85 银川12865.97 1
0.60.08 1225
4.18 贵阳1533
9.90 4138.48 117
4..24 重庆2785
9.53 -2240
7.66 1172
3.76 西宁1
0.50.62 61
4..51 906
8.36 南宁1152
6.86 26
7..29 8686.15 最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。根据表
7.3易得:表
7.3 因子得分系数矩阵将每个学生的六门成绩分别代入F1、F2,比较两者的大小,F1大的适合学文,F2大的适合学理。计算结果为学号是1、16、24的学生适合学文,其余均适合学理。
7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。品牌价格发动机功率轴距宽长轴距燃料容量燃料效率A21501.8140
1.1.267.317
2.4
2.6391
3.228A2840
3.2225108.17
0.319
2.93.51717.225A42000
3.521011
4.67
1.419
6.63.8501
8.022B239901.815010
2.66
8.217
8.0
2.9981
6.427B33950
2.820108.77
6.1192.
3.56118.522B62000
4.231011
3.07
4.019
8.23.9022
3.721C2699
2.517010
7.368.417
6.0
3.1791
6.626C33400
2.819310
7.36
8.517
6.03.19716.624C38900
2.81931
1..47
0.91
8..0
3.4721
8.525D21975
3.117510
9.07
2.719
4.6
3.36817.525D25303.824019.07
2.719
6.2
3.5431
7.523D31965
3.825113.87
4.720
6.83.7781
8.524D278853.8205112.27
3.520
0.0
3.59117.525E398954.6275115.374.5207.2
3.9781
8.522E39665
4.627510
8.7
5.52
0..6
3.84319.022E31010
3.020107.47
0.319
4.83.7701
8.22E46225
5.725511
7.5
7..0201.2
5.5723
0.015F13260
2.2115104.167.918
0.9
2.6761
4.327F16535
3.11710
7.06
9.419
0.4
3.0511
5.25F18890
3.117510
7.57
2.520
0.93.3301
6.625F19390
3.4180110.57
2.719
7.9
3.341
7.027F24340
3.82010
1.17
4.119
3.23.5001
6.825F45705
5.734510
4.573.617
9.7
3.2119.122F13960
1.81209
7.16
6.7174.3
2.3981
3.233F9235
1.0559
3.162.614
9.41.8951
0.345F18890
3.418011
0.57
3.2
0..0
3.3891
7.027G19840
2.5163103.76
9.719
0.9
2.9671
5.924G24495
2.516810
6.06
9.219
3.0
3.3321
6.024G22245
2.7200113.07
4.420
9.13.4521
7.026G1648
2.013210
8.07
1.0186.0
2.9111
6.027G28340
3.525311
3.07
4.420
7.7
3.56417.23G291853.525311
3.07
4.419
7.83.5671
7.023解:令价格为X1,发动机为X2,功率为X3,轴距为X4,宽为X5,长为X6,轴距为X
7.燃料容量为X8,燃料效率为X9,用SPSS找简化的指标系统的具体步骤同7.7。此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个成分贡献了9
0.9%,因此重复因子分析过程,并在第三步Extraction子对话框中的Number of factors后的矩形框中输入3,即为要提取的公因子的数目。因子分析结果如下:表
7.4 旋转后的因子得分系数矩阵其简化了指标体系为、、,从旋转后的因子得分系数矩阵得:设个总体相应的维样本空间为 。在规则下,将属于的样品错判为的概率为 则这种判别规则下样品错判后所造成的平均损失为 则用规则来进行判别所造成的总平均损失为贝叶斯判别法则,就是要选择一种划分,使总平均损失达到极小。基本方法:令,则 若有另一划分,则在两种划分下的总平均损失之差为因为在上对一切成立,故上式小于或等于零,是贝叶斯判别的解。从而得到的划分为
4.5 简述费希尔判别法的基本思想和方法。答:基本思想:从个总体中抽取具有个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数可使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。答: 费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 当k=2时,若则费希尔判别与距离判别等价。当判别变量服从正态分布时,二者与贝叶斯判别也等价。③ 当时,费希尔判别用作为共同协差阵,实际看成等协差阵,此与距离判别、贝叶斯判别不同。 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是 X ,W(X)X ,W(X)<lnd距离判别的判别规则是X ,W(X)X ,W( )
题目解答
答案
错误