关于缺失数据的处理方法正确的是:- LOCF是一种常用的单一填补法- 多重填补法包括数据填补,数据分析和结果合并三个部分- MMRM是基于混合效应模型的缺失数据处理方法,它假设数据缺失是随机的- 缺失数据的处理没有普适的方法,在数据分析中需要采用不同的填补方法进行分析
BMI指数(身体质量指数,英文为BodyMassIndex,简称BMI)是衡量人体胖瘦程度的一个标准,BMI=体重(kg)/身高(m)的平方.根据中国肥胖问题工作组标准,当BMI≥28时为肥胖.某地区随机调查了1200名35岁以上成人的身体健康状况,其中有200名高血压患者,得到被调查者的频率分布直方图如图:频率-|||-组距-|||-0.100-|||-0.050-|||-0.025-|||-18 20 22 24 26 28 30 3234 BMI-|||-颗率-|||-组距-|||-0.080-|||-0.030-|||-0.005-|||-1820222426 28 30 32 34 BMI-|||-高血压-|||-非高血压(1)求被调查者中肥胖人群的BMI平均值μ;(2)根据频率分布直方图,完成下面的2×2列联表,并判断能有多大(百分数)的把握认为35岁以上成人高血压与肥胖有关? 肥胖 不肥胖 总计 高血压 非高血压 总计 参考公式:(K^2)=((n{{({ad-bc))}^2}})/((({a+b))({c+d))((a+c))((b+d))}},其中n=a+b+c+d.参考数据: P(K2≥k) 0.25 0.10 0.050 0.010 0.001 k 1.323 2.706 3.841 6.635 10.828
下列哪项对Log-rank检验的描述是错误的A. 对于整条曲线检验的Log-rank检验是基于参数方法的B. 可以拓展到检验多个(> 2)治疗组C. 可以拓展到给不同的时间点分配权重D. 可以拓展到分层log-rank检验,用以控制额外的基线影响因素
例1 某人要测量A,B两地之间的距离,限于测量工具,将其分成1200段进-|||-行测量,设每段测量误差(单位:km)相互独立,且服从 (-0.5,0.5) 上的均匀分布.试-|||-求总距离测量误差的绝对值不超过20 km的概率.
设 X_1, X_2, ..., X_n 是X的样本,X的期望为EX,且 overline(X) = (1)/(n) sum_(i=1)^n X_i ,则有().A. overline(X) = EXB. Eoverline(X) = EXC. overline(X) = (1)/(n) EXD. overline(X) approx EX
正态曲线下横轴上从μ -1.960到μ +1.960的面积占曲线下总面积的百分比 ()A. 47.5%B. 49.5%C. 95%D. 97%E. 99%
某地的中学生中有60%的同学爱好滑冰,50%的同学爱好滑雪,70%的同学爱好滑冰或爱好滑雪,在该地的中学生中随机调查一位同学,若该同学爱好滑雪,则该同学也爱好滑冰的概率为( )A. 0.8B. 0.4C. 0.2D. 0.1
(单选题)2017年1月 sim (2018)^circ 年4月全国钓鱼网站处理情况-|||-2017年1月 sim (2018)^circ 年4月全国钓鱼网站处理情况-|||-时间 CN域名 非CN域名 支付交易类 金融证券类-|||-处理数量(个) 处理数量占比(%)-|||-2017年1月 42 1870 64.9 34.4-|||-2017年2 91 860 52.6 45.8-|||-2017年3 76 2019 80.5 18.9-|||-2017年4 32 761 49.4 50.3-|||-2017年5 43 785 60.4 39.6-|||-2017年6 19 810 66.0 33.3-|||-2017年7月 33 1445 53.0 46.8-|||-2017年8 58 4675 87.3 12.4-|||-2017年9 52 2572 83.2 15.9-|||-2017年10月 87 2246 78.2 21.2-|||-2017年11月 40 2626 83.6 13.5-|||-2017年12月 302 2693 79.8 19.1-|||-2018年1月 204 2598 79.3 20.2-|||-2018年2月 58 641 46.6 51.9-|||-2018年3月 254 3230 77.4 22.3-|||-2018年4月 229 1749 73.2 25.82017年下半年,金融证券类和支付交易类钓鱼网站占当月处理钓鱼网站总数比重最低的月份是:A. 8月B. 9月C. 10月D. 11月
[1333](2012·新课标全国·15·j)-|||-某个部件由三个元件按下图方式连接而成,元-|||-件1或元件2正常工作,且元件3正常工作,-|||-则部件正常工作,设三个电子元件的使用寿命-|||-(单位:h)均服从正态分布N(1000,50^2),且各-|||-个部件能否正常相互独立,那么该部件的使用-|||-寿命超过1000h的概率为 __ 。-|||-元件1-|||-元件3-|||-元件2
二、填空题(每小题3分,共24分)-|||-11.要了解一批炮弹的杀伤力,适合采用 抽样调查;检查一枚-|||-即将发射的运载火箭的各零部件,适合采用 全面 调查.-|||-12.我市某校40名学生参加全国数学竞赛,把他们的成绩分为6-|||-组,第一组到第四组的频数分别为10,5,7,6,第五组的人数-|||-所占百分比是20%,则第六组人数所占百分比是 10%-|||-13.一家电脑生产厂家在某城市三个经销本厂产品的大商场调-|||-查,产品的销量占这三个大商场同类产品销量的40%.由此在-|||-告中宣传,他们的产品占国内同类产品销售量的40%.请你-|||-根据所学的统计知识,判断该广告宣传中的数据 不可靠-|||-填"可靠"或"不可靠"),理由是 __ .-|||-14. 月23日是世界读书日,这天某校为了解学生-|||-课外阅读情况,随机收集了30名学生每周课外阅读的时间,-|||-统计如下:-|||-读时间(x小时) leqslant 3.5 .5lt xleqslant 5 lt xleqslant 6.5 gt 6.5-|||-人数 12 8 6 4-|||-若该校共有1200名学生,试估计全校每周课外阅读时间在5-|||-小时以上的学生人数为 __ .-|||-400-|||-15.某学校"你最喜爱的球类运动"调查中,随机调查了若干名学-|||-生(每个学生分别选了一项球类运动),并根据调查结果绘制-|||-了如图所示的扇形统计图.已知其中最喜欢羽毛球的人数比-|||-最喜欢乒乓球的人数少6人,则该校被调查的学生总人数为-|||-60 名.-|||-数-|||-羽毛球 40-|||-30% 其他-|||-10%-|||-乒乓球 篮球-|||-40% 20% 0° 60 70 80 90100分数-|||-第15题图 第16题图-|||-16.为了了解我校七年级的数学教学情况,从中抽取了若干名学-|||-生参加测试,其得分情况如图,且四个小长方形的高之比为-|||-2:4:3:1,则参加测试的学生共有 __ 人.-|||-__-|||-17.为了了解某区初中学生的视力情况,随机抽取了该区500名-|||-初中学生进行调查.整理样本数据,得到下表:-|||-视力 4.7以下 4.7 4.8 4.9 4.9以上-|||-数 102 98 80 93 127-|||-根据抽样调查结果,估计该区12000名初中学生视力不低于-|||-4.8的人数是 __ .-|||-18.七(1)班同学为了解某小区家庭月均用水情况,随机调查了该-|||-小区部分家庭,并将调查数据整理如下表(部分):-|||-均用-|||-lt xleqslant 5 lt xleqslant 10 lt xleqslant 15|15lt xleqslant 20 gt 20-|||-水量 /(m)^3-|||-频数/户 12 20 3-|||-百分比 12% 7%-|||-若该小区有800户家庭,据此估计该小区月均用水量不超过-|||-10m^3的家庭约有 560 户.
热门问题
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
5.聚类分析可以看作是一种非监督的分类。()
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小