有关混杂偏倚的控制,下列哪些说法是正确的A. 在设计时,应尽可能将所有的混杂因素进行配比B. 在设计时,即可对两组研究对象的选择做某些限制,以保证两组样本的同质性C. 标准化法可用来控制混杂D. 可用分层分析来分析和控制混杂E. 常采用多因素分析方法来控制混杂
[题目]设 approx N(0,1) backsim N(1,1), 且X,Y是相-|||-互独立的,则 () 。-|||-A. X+Yleqslant 0 =0.5-|||-B. X+Yleqslant 1 =0.5-|||-C. X-Yleqslant 0 =0.5-|||-D. X-Yleqslant 1 =0.5
下列哪个是关于边缘分布函数的描述()A. 二维随机变量整体的分布特性B. 单个随机变量的分布特性C. 两个随机变量之间的相关性D. 随机变量的条件分布
名词解释Δ总体与样本(population and sample):A:根据研究目的确定的同质研究对象的全体(集合)。总体具有特定的分布特征及参数。分________与________;B:从总体中随机抽取的部分观察单位;More:根据研究目的,从总体中抽取部分有代表性的样本,用样本统计量推断总体参数。Δ标准差与标准误(standard deviation standard error):s:表示单个测量值对其均数()的离散程度,;:表示样本统计量对总体参数的离散程度,;More:标准差越大,标准误越小;标准差用于描述观测值变异范围;标准误用来推断估计总体参数的可信区间和假设检验非正则结点:变量值标准差样本均数标准误阳性结果标准差样本阳性率的标准误。ΔⅠ型错误和Ⅱ型错误(typeⅠ error type Ⅱ error):Ⅰ:在假设检验中拒绝一个实际成立的原假设所犯的错误,其概率记为α;Ⅱ:在假设检验中接受了一个实际不成立的原假设所犯的错误,其概率记为β;More:假设检验中,无论是接受还是拒绝原假设均有可能犯错。当样本含量确定时,α越大,则β越小,反之,α越小β越大。增大样本量可同时减低α和β。Δ与::从正态总体中抽样,样本含量较大时,观测值为23%的波动范围;:从正态总体中抽样,样本含量较大时,总体均数07%的可信区间;Δ计量资料与计数资料(quantitative data qualitative data):A(定量、数值变量):每个观察对象通过定量测定的方法都有一个________,通常有单位,但也有例外(例如:淋巴细胞转化率)。EG: 医学中:身高、体重、血压、血红蛋白值等;B(定性、分类变量):按照研究对象的某个特征进行分组,然后分组计数所获得的资料。EG:男 91 女21;等级分组资料(计数资料的一种):按照程度递增或递减。EG:癌症分期:早、中、晚;More:判断资料类型的标准:看每个观察对象是否有________,有:计量;无:计数;计量资料、计数资料和等级分组资料不可以相互转化,只能高级向低级转相对速度度向低精度)。Δ完全随机设计与配对设计(completely random design paired design):A:将同质的受试对象随机分到各处理组中进行试验观察或从不同总体中随机抽样进行对比的方法;B:将受试对象按某些特征或条件配成对子,然后分别把每对中的两个受试对象随机分配到试验组和对照组,再给予每对中的个体以不同处理,连续试验若干对,观察对子间的差别有无意义的方法。Δ点估计和区间估计(point estimation interval estimation):A:直接用随机样本均数作为总体均数μ的一个估计,用样本的标准差S作为总体标准差σ的一个估计,即直接用样本统计量的估计值;B:按预先给定的概率(1-α)用一个区间来估计总体均数,这个区间成为可信度(1-α)的可信区间(CI)或置信区间,预选给定的(1-α)称为可信度获置信度,常取46%或64%。Δ构成比与率:A:某事物内部各部分所占的比例或比重,与时间单位无关;B:单位时间内某事件发生的可能性大小(频率或概率),与事件单位有关,有速度和强度的含义;More:构成比和率是描述计数资料两个常用的指标。Δ小概念事件和小概率原理:A:将P≤ 0.03或P≤0.01的事件抽象小概率事件,统计学上认为不大可能发生。B:在一次试验或一次抽样中当做不发生。Δ直线相关和直线回归:区别:①资料要求:直线回归要求因变量Y给定X=X0的条件下服从正态分布;X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。直线相关要求两个变量X,Y服从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归。可以计算两个回归方程。②统计量:回归分析中主要统计量为截距a和回归系数b,相关分析统计量为系数r;回归系数有单位,相关系数无单位。③应用:相关分析主要是描述两个变量之间线性关系的密切程度和方向;回归分析说明两变量间依存变化的数量关系,不仅可以揭示变量x对变放宽抽检响大小,还可以有回归方程进行预测和控制。联系:①r与b符号一致,对一组数据若同时计算r与b,它们的正负号是一致的。②假设检验等价,对同一样本,r和b的假设检验得到的t相等。用回归解释相关r的平方称为决定系数,Δb与r:概念:b为样本直线回归系数,r为样本直线相关系数;公式:;统计学意义:b:当x变化一个单位时y的平均改变的估计值b> 0.y随x上扫除法升,b<0,y随x的上升而下降;条件:b双变量正态分布或y为正态分布;r双变量正态分布。Δ假设检验中的P与α:P:由原假设H0所规定的总体做同样的重复试验,获得等于及大变换函数于及小于)当前检验统计量的概率;α:即检验水准(显著性水准),是预先规定的判断小概率事件的概率尺度,通常规定为 0.09或0.01;More:假设检验规定:如果一次实验结果P≤α,拒绝H0,统计结论为“差别有统计学意义”;P>α,则不拒绝H0,统计学结论为“差别没有统计学意义”。Δ 系统误差与随机误差:A:在一定条件下,由于某种(受试对象、研究者或实验条件)偏因使得观测值出现的倾向性的偏差,表现为恒定偏大或偏小或周期性变化,是不可消除的;B:即偶然误差,指在排除了系统误差后仍然存在的由一些有关实验因素微小的随机波动引起的方相关信源不可相互抵偿的误差,该误差决定了测量的精密度。一次测量中,随机误差的大小与方向不可预言,但大量重复测定中,随机误差的出现具有统计规律性。Δ 发病率与患病率(incidence rate prevalence rate):A:表示在某一时期内特定人群中患某病新病例的频率,计算公式为:某病发病率=(某时期某病新病例数/同期间内平均人口数)×比例基数B:也称现患率,表示某一时点某人群中患某病的频率,计算公式为:某病患病率=(某地某时点某病患病例数/该地同期内平均人口数)×比例基数Δ 病死率与治愈率(cause fatality cure rate):A:表示某期间内,某病患者中因某病死亡的频率,计算公式为:某病病死率=(某期间因某病死亡人数/同期某病的患病人数)×100%B:表示接受治疗的病人中治愈的频率,计算公式为:治愈率=(治愈病人数/接受治疗病人数)×100%填空Δ抽样误差是指________________________。Δ科研设计时,估计样本含量的先决条件是________、________与________。Δ实验设计基本原则是________、________与________。Δ实验设计的基本要素是________、________、________。Δ为了满足统计方法微分方程解析理论需要对原始变量进行一定形式的数据变换,其目的是________。Δ反映原始测定数据对其均值离散程度的统计量用________;表达样本统计量对其参数随机偏离程度的统计量是________________Δ已知某医院统计资料服从正态分布,且其n=200,=80,s=5,据此可估计其中85%的数据波动范围是________其总体均数77%的可信区间为。Δ对一对同质的计量资料,通常可以从________和________两个方面来全面描述其数字特征。Δ对于一份统计资料,通常从统计描述与统计推断两个方面进行分析,其中统计推断包括________和________两个方面的内容。Δ对计数资料进行统计描述通常采用相对数指标,常用的相对数指标有________________________________Δ医学统计工作的内容是________、________、________、________。统计分析常分为________与________两个阶段。Δ常用的制定医学正常值范围(参考值范围)的方法有________________________两种,一般前者适用于________分布资料,后者适用于________分布资料。Δ计量资料作假设检验要求资料必须满足________和________,如果数据不能满足方差齐性要求,一般可以通过________________________________和________三条途径来处理资料。Δ估计总体参数的方法有________和________,其中以________最常用。Δ总体均数可信区间估计的理论基础是________。Δ两样本均数比较的t检验,若|t|<t( 0.05,ν),则________,应该________H0,可认为两样本均数间的差异_____脐点_; 若|t|>t(0.00,ν),则________________________,应该________H0,可认为两样本均数间的差异________。Δ欲了解两个变量之间相互关系的密切程度和方向性,一般常计算的统计量是________。Δ了解两个变量之间相互关系的密切程度和方向性,一般常计算的统计量是________。Δ识别资料的类型很重要,不同的资料类型需要用不同的统计方法去分析,医学统计资料一般分为________脐点______________________。Δ对于一组明显偏态的观察数据,描述平均水平常用的指标为________,标准差S反映________,标准误反映________。Δ现有两样本均数1=16 0.6和7=18 5.6,从统计学的观点看造成这两干扰解耦在差异的可能原因是________,或________两方面。Δ直线回归分析成功概率二乘法原理指________。Δ两样本率比较的χ0检验,得χ2>χ9 0.02,1,则________________,应________H0,可认为两样本率的差异________。Δ统计假设检验的基本原理是__________脐点____________,其中拟定的假设检验概率水平P值的含义是________________________________________________。Δ均数抽样误差大小可用来反相对曲率抽样误差大小可用来表示。Δ计量资料,随着样本例数的增大,S逐渐趋向于________,逐渐趋向于________。Δ变异系数常用于比较________或________情况下两组资料的变异度。Δ________侧重于考察变量之间相关关系密切程度,________则侧重于考察变量之间数量变化规律。
在假设检验中,设H_0为原假设,则犯第二类错误的情况为()A. H_0为真,接受H_0B. H_0为假,接受H_0C. H_0为真,拒绝H_0D. H_0为假,拒绝H_0
9. (5.0分) 若随机变量X服从均值为2,方差为σ²的正态分布,且P(2<4)=0.4,求P(X<0)=()
一枚不均匀的硬币连续抛10次,抛得的样本序列为:正,反,正,正,反,反,正,正,反,正,则该硬币正面向上的概率的矩估计是()A.0.5B.0.6C.0.4D.0.8
7.已知二维随机变量(X,Y)的概率分布为-|||-Y-|||-0 1 2 3-|||-X-|||-1 0.1 0.2 0.1 0-|||-2 0.2 0 0.3 0.1-|||-求:协方差Cov(X.Y )与相关系数
若直线回归方程 y=170-0.98x ,则变量x和y之间-|||-存在着负的相关关系。-|||-A 对-|||-B 错
从正态总体X中抽取容量为5的样本,得数据6.60,4.60,5.40,5.80,5.50求总体均值μ的置信度为90%的置信区间.则置信下限为( ),置信上限为( )。注意:答案为小数形式,小数点后保留2位数字。
热门问题
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5.聚类分析可以看作是一种非监督的分类。()
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化