简述统计调查方案包括的内容。
在大数据分析中,常用的维度约简方法有:()A. 线性回归B. 主成分分析(PCA)C. 奇异值分解(SVD)D. 特征选择
某公司为提高员工的专业能力,定期对员工进行技能测试.考虑多种因素影响,需将测试的原始成绩x(分)换算为报告成绩y(分).已知原始成绩满分150分,报告成绩满分100分、换算规则如下:当0≤x<p时,y=(80x)/(p);当p≤x≤150时,y=(20(x-p))/(150-p)+80.(其中p是小于150的常数,是原始成绩的合格分数线,80是报告成绩的合格分数线)公司规定报告成绩为80分及80分以上(即原始成绩为p及p以上)为合格.(1)甲、乙的原始成绩分别为95分和130分,若p=100,求甲、乙的报告成绩;(2)丙、丁的报告成绩分别为92分和64分,若丙的原始成绩比丁的原始成绩高40分,请推算p的值;(3)下表是该公司100名员工某次测试的原始成绩统计表: 原始成绩(分) 95 100 105 110 115 120 125 130 135 140 145 150 人数 1 2 2 5 8 10 7 16 20 15 9 5 ①直接写出这100名员工原始成绩的中位数;②若①中的中位数换算成报告成绩为90分,直接写出该公司此次测试的合格率.
调查对象确定的主要依据A. 调查目的B. 调查范围C. 划清总体同质范围D. 调查方法E. 调查时间
新能源汽车相比较传统汽车具有节能环保、乘坐舒适、操控性好、使用成本低等优势,近几年在我国得到越来越多消费者的青睐.某品牌新能源汽车2023年上半年的销量如下表: 月份 1 2 3 4 5 6 销量(万辆) 11.7 12.4 13.8 13.2 14.6 15.3 针对上表数据,下列说法正确的有( )A. 销量的极差为3.6B. 销量的60%分位数是13.2C. 销量的平均数与中位数相等D. 若销量关于月份的回归方程为y=0.7x+b,则b=11.05新能源汽车相比较传统汽车具有节能环保、乘坐舒适、操控性好、使用成本低等优势,近几年在我国得到越来越多消费者的青睐.某品牌新能源汽车2023年上半年的销量如下表: 月份 1 2 3 4 5 6 销量(万辆) 11.7 12.4 13.8 13.2 14.6 15.3 针对上表数据,下列说法正确的有( )A. 销量的极差为3.6B. 销量的60%分位数是13.2C. 销量的平均数与中位数相等D. 若销量关于月份的回归方程为y=0.7x+b,则b=11.05
设(X_1,X_2,...,X_n)为来自总体Xsim N(0,1)的一个样本,统计量Y=(sqrt(n-1)X_1)/(sqrt(sum_(i=2)^n X_i^2)),则().A. Ysim chi^2(n-1)B. Ysim t(n-1)C. Ysim F(n-1,1)D. Ysim F(1,n-1)
时间序列分析中,时间序列预测是指通过对历史数据的分析和建模,预测未来数据的趋势和模式。()A. 正确B. 错误
现状研究类型叙述正确的是A. 普查结果绝对比抽样调查可靠B. 普查适用于发病率低的疾病C. 抽样调查比普查更容易设计D. 当样本量接近总体时宜用普查E. 抽样调查结果要比普查可靠
用两种测量肺活量的仪器,测量18名女生的肺活量,为对比两仪器的测量差异应该用的统计学方法是( )oA. q检验B. 配对,Z检验C. 配对,t检验D. 分组,Z检验E. 分组,t检验
多项式回归可以用来:()A. 对数据进行异常检测B. 进行特征选择C. 分析数据中的相关性D. 对非线性关系的数据进行建模
热门问题
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5.聚类分析可以看作是一种非监督的分类。()
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)