55.一组数据的对数值呈正态分布,描述这组数据的集中趋势应先择用A、中位数B、算术均数C、标准差D、几何均数E、变异系数
数据是关于自然、社会现象和科学试验的定量或定性的记录,是科学研究最重要的基础。-|||-对-|||-错
【单选题】关于正态分布曲线的形状和位置,下列说法正确的是A. 正态分布曲线的形状和位置只与总体平均值有关 B. 正态分布曲线的形状和位置只与总体标准偏差有关 C. 总体平均值决定正态分布曲线的位置,总体标准偏差决定正态分布曲线的形状 D. 总体平均值决定正态分布曲线的形状,总体标准偏差决定正态分布曲线的位置
五简答题部分•1: 为什么说统计分组的关键在于分组标志的选择?答 案: 统计分组就是把总体按某一标志来分门别类,选择不同的标志就有不同的分组、不同的分组体系。(2 分) 分组标志是作为现象总体划分各个不同性质的组的标准或根据,选择得正确与否,关系到能否正确反映总体的性质特征、实现统计研究的目的任务。 (2 分)所以,统计分组的关键在于分组标志的选择和分组界限的确定。 (1 分)2: 简述变量分组的种类及应用条件。答 案:变量分组包括单项式分组和组距式分组。 (2 分)离散变量变动幅度小,分组可以选择单项式分组。(1 分) 如果离散变量的变动幅度较大,分组应该选择组距式分组。(1 分) 而对于连续变量只能用组距式分组。 (1 分)3: 单项式分组和组距式分组分别在什么情况下运用?
下列有关匹配的描述,不正确的是 A. 频数匹配要求匹配的因素在对照组的比例与病例组一致常用的匹配变量有年龄,性别,住址,B. 出生地区,经济水平等就统计效率而言,超过1:3统计效率不C. 再提高匹配的目的是进行比较时排除匹配因素D. 的干扰匹配有助于研究效率的提高
【多选题】统计表从内容上看由()组成。A. 总标题 B. 横行标题 C. 主词 D. 宾词
数值型数据可以是离散数据,或者是连续数据,A. 正确B. 错误
自身对照指对照组和实验组的数据来自同一样本。A. 对B. 错
数据聚合的数值就是按照字段进行统计,统计方法一般包含以下哪些?A. 计数B. 去重计数C. 求和D. 环比E. 同比F. 平均值G. 最大值
为了避免陷入虚拟变量陷阱,如果一个定性变量有m类,则要引入m个虚拟变量。( )A. 正确B. 错误
热门问题
下列哪项属于常见的池化方式。() A. 反向传播B. 方差池化C. 协方差池化D. 最大池化
下列说法正确的是() A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
下列关于回归分析的描述不正确的是()A. 回归分析研究单个变量的变化情况B. 刻画不同变量之间关系的模型统称为线性回归模型C. 回归分析研究不同变量之间存在的关系D. 回归分析模型可分为线性回归模型和非线性回归模型
关于样本中某一变量的综合描述叫( )A. 统计值B. 平均值C. 估计值D. 参数值
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
区群谬误是用个体调查(分析)单位做资料收集与分析,却用集群乃至总体调查(分析)单位做结论。()A. 正确B. 错误
聚类分析的常见应用领域不包括( )数据分析图像处理客户分割发现关联购买行为
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法不正确的是() A. 协方差数值上等于各个数据与样本方差之差的平方和B. 协方差和方差的计算完全一致C. 协方差描述了两个变量之间的相关程度D. 方差描述了样本数据的波动程度
5.聚类分析可以看作是一种非监督的分类。()
从总体中抽取的、对总体有一定代表性的一部分个体称为()A. 总体B. 部分C. 样本D. 取样
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的 A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
下列说法正确的是() A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
决策树算法常用的划分准则包括: A. 信息增益B. 基尼指数C. 误差平方和D. 均方差