logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

聚类分析以及因子分析100个学生数学、物理、化学、语文、历史、英语成绩如下表(部分),请你用科学的方法解释为什么我们会将数学、物理、化学归并为理科,其他的归并为文科。数学物理化学语文历史英语100100100597367991009953636087841007481769185100706576879887687864859195637666799583898979这是一个有趣(yǒuqù)的案例,你可以客观的观测到每一科目(kēmù)的成绩,但你如何可以直接看到理科、文科的情况呢?答:SPSS操作步骤:1)在定义变量(biànliàng)窗口,定义变量数学、物理、化学、语文、历史、英语几个变量2)在录入数据窗口(chuāngkǒu),对数据进行录入。3)依次(yīcì)点击Analyze-----Classify-----Hierarchical Cluster Analysis4)在对话框中,将变量依次放进变量中,然后点击对变量做聚类。结果如下:Case Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance used从上图聚类的结果(jiē guǒ),我们可以看出数学、物理、化学为一类。历史、英语、语文为一类。因子分析的结果(jiē guǒ):Case Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance usedCase Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance used6个科目的成绩是我们观测到的外在表现,隐藏在其中的公共因子(yīnzǐ)是什么?SPSS分析(fēnxī)过程因子分析:6科目(kēmù)成绩作为6个原始变量,利用SPSS进行(jìnxíng)因子分析。Case Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance used经过SPSS降维,由公因子(yīnzǐ)方差表看出,默认提取两个公因子,能够解释差异的81%,似乎暗合文科和理科。Case Processing Summary^3-|||-Cases-|||-Valid Missing Total-|||-N Percent N Percent N Percent-|||-7 16.7% 35 83.3% 42 100.0%-|||-a.Squared Euclidean Distance used通过旋转后进行因子的命名与解释,由旋转矩阵可以看出,因子1与语文、历史、英语三科最相关,均在0.8相关度以上,因子2与数学、物理、化学相关,也基本达到0.8以上,这正好与我们经常说的文科和理科不谋而合,因此,将语文、历史、英语三科命名为文科因子;将数学、物理、化学三科命名为理科因子。因子得分排序:综合评价为公共因子合理命名之后,因子分析并没有结束,一般可以(kěyǐ)将因子得分作为变量,用于后续分析步骤。 本例100名学生按照文科和理科因子得分进行排序,可以(kěyǐ)用(语文+历时+英语)及(数学+物理+化学)平均值验证因子得分排序是否合理,同时,也可以观测因子得分为负值时是否影响排序。2.。。。。。聚类分析:下表给出对该产品(chǎnpǐn)8种需求情况,根据该表,请运用聚类分析法,找出哪些地区在该产品需求上有共同特征。(题没看懂) x1 x2 x3 x4 x5 x6 x7 x8 辽宁 7.9 39.77 8.49 12.94 19.27 11.05 2.04 13.29 浙江(zhè jiānɡ) 7.68 50.37 11.35 13.3 19.25 14.59 2.75 14.87 河南(hé nán) 9.42 27.93 8.2 8.14 16.17 9.42 1.55 9.76 甘肃 9.16 27.98 9.01 9.32 15.99 9.1 1.82 11.35 青海 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.82

聚类分析以及因子分析
100个学生数学、物理、化学、语文、历史、英语成绩如下表(部分),请你用科学的方法解释为什么我们会将数学、物理、化学归并为理科,其他的归并为文科。
数学
物理
化学
语文
历史
英语
100
100
100
59
73
67
99
100
99
53
63
60
87
84
100
74
81
76
91
85
100
70
65
76
87
98
87
68
78
64
85
91
95
63
76
66
79
95
83
89
89
79
这是一个有趣(yǒuqù)的案例,你可以客观的观测到每一科目(kēmù)的成绩,但你如何可以直接看到理科、文科的情况呢?
答:
SPSS操作步骤:
1)在定义变量(biànliàng)窗口,定义变量数学、物理、化学、语文、历史、英语几个变量
2)在录入数据窗口(chuāngkǒu),对数据进行录入。
3)依次(yīcì)点击Analyze-----Classify-----Hierarchical Cluster Analysis
4)在对话框中,将变量依次放进变量中,然后点击对变量做聚类。结果如下:
从上图聚类的结果(jiē guǒ),我们可以看出数学、物理、化学为一类。历史、英语、语文为一类。
因子分析的结果(jiē guǒ):
6个科目的成绩是我们观测到的外在表现,隐藏在其中的公共因子(yīnzǐ)是什么?SPSS分析(fēnxī)过程
因子分析:6科目(kēmù)成绩作为6个原始变量,利用SPSS进行(jìnxíng)因子分析。
经过SPSS降维,由公因子(yīnzǐ)方差表看出,默认提取两个公因子,能够解释差异的81%,似乎暗合文科和理科。
通过旋转后进行因子的命名与解释,由旋转矩阵可以看出,因子1与语文、历史、英语三科最相关,均在0.8相关度以上,因子2与数学、物理、化学相关,也基本达到0.8以上,这正好与我们经常说的文科和理科不谋而合,因此,将语文、历史、英语三科命名为文科因子;将数学、物理、化学三科命名为理科因子。
因子得分排序:综合评价
为公共因子合理命名之后,因子分析并没有结束,一般可以(kěyǐ)将因子得分作为变量,用于后续分析步骤。 本例100名学生按照文科和理科因子得分进行排序,可以(kěyǐ)用(语文+历时+英语)及(数学+物理+化学)平均值验证因子得分排序是否合理,同时,也可以观测因子得分为负值时是否影响排序。
2.。。。。。聚类分析:下表给出对该产品(chǎnpǐn)8种需求情况,根据该表,请运用聚类分析法,找出哪些地区在该产品需求上有共同特征。(题没看懂) x1 x2 x3 x4 x5 x6 x7 x8 辽宁 7.9 39.77 8.49 12.94 19.27 11.05 2.04 13.29 浙江(zhè jiānɡ) 7.68 50.37 11.35 13.3 19.25 14.59 2.75 14.87 河南(hé nán) 9.42 27.93 8.2 8.14 16.17 9.42 1.55 9.76 甘肃 9.16 27.98 9.01 9.32 15.99 9.1 1.82 11.35 青海 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.82

题目解答

答案

答案:辽宁 x1 x6 浙江 x8河南 x5 x2 甘肃 x3 x4 青海 x7
3.。。。。。相关分析:对某地的12个乡镇的饮水氟含量及中老年人群的骨关节炎患病情况作了调查,数据如下表10-12,初步发现不同乡镇的骨关节炎的患病率高低与本地区饮水的氟含量有关。于是把氟含量视为变量X,把骨关节炎患病率视为Y,计算出Pearson积矩相关系数,得r=0.827,经检验P<0.01,据此认为骨关节炎的患病率与饮水的氟含量之间有正相关关系。(R=0.827,显著相关P=0.001)
表10-12 某地12个乡镇饮水氟含量与骨关节炎患病率
序号
氟含量(mg/L)
患病率(%)
1
1.2
7.5
2
0.35
8.9
3
2.5
9.0
4
3.18
12.6
5
0.75
8.2
6
5.92
15.4
7
7.97
20.3
8
2.06
10.1
9
7.05
30.3
10
5.3
24.2
11
3.52
7.5
12
1.5
10.3
讨论:
(1)作者以上结论是否正确?原因是什么?正确
(2)线性相关分析的适用条件是什么?如何验证其适用条件?相关分析的使用条件是符合线性关系,也就是所谓的在一条直线上。利用散点图,能够在一条直线上。
(3)应如何进行分析?本分析方法的适用条件是什么?
内容总结
(1)1.时间序列---劳动生产率
各个月的劳动生产率
(2)这是一个有趣的案例,你可以客观的观测到每一科目的成绩,但你如何可以直接看到理科、文科的情况呢
(3)相关分析:对某地的12个乡镇的饮水氟含量及中老年人群的骨关节炎患病情况作了调查,数据如下表10-12,初步发现不同乡镇的骨关节炎的患病率高低与本地区饮水的氟含量有关

相关问题

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • 假设某地正常男性体重服从正态分布,随机抽取某地正常男性100测量其体重,结果=60.0Kg,S=6.0Kg。请计算:(1)该地正常男子体重95%总体均数的可信区间。(2)该地男子95%的体重范围为多少?

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 下列关于变量的说法,错误的是(1.5) A. 常见的变量主要有自变量、因变量和混杂变量B. 混杂变量不会干扰研究结果C. 自变量不受结果的影响D. 自变量是因,因变量是果E. 因变量随自变量改变的影响而变化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 下列关于回归分析的描述不正确的是()A. 回归分析研究单个变量的变化情况B. 刻画不同变量之间关系的模型统称为线性回归模型C. 回归分析研究不同变量之间存在的关系D. 回归分析模型可分为线性回归模型和非线性回归模型

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号