logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。A.越小B.越大C.无关D.不确定标准答案:B数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A.异常值B.缺失值C.不一致的值D.重复值标准答案:C手肘法的核心指标是()。A.SESB.SSEC.RMSED.MSE标准答案:B通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()A.简单函数变换B.规范化C.属性构造D.连续属性离散化标准答案:C聚类是一种()。A.有监督学习B.无监督学习C.强化学习D.半监督学习标准答案:B具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。A.1,线性B.2,线性C.1,非线性D.2,非线性标准答案:A在一元线性回归模型中,残差项服从()分布。A.泊松B.正态C.线性D.非线性标准答案:B根据映射关系的不同可以分为线性回归和()。A.对数回归B.非线性回归C.逻辑回归D.多元回归标准答案:B考虑下面的频繁3-项集的集合:(1,2,3),(1,2,4),(1,2,5),(1,3,4),(1,3,5),(2,3,4),(2,3,5),(3,4,5)假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5标准答案:C某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.关联规则发现B.聚类C.分类D.自然语言处理标准答案:A层次聚类对给定的数据进行()的分解。A.聚合B.层次C.分拆D.复制标准答案:B以下哪一项不是特征工程的子问题()A.特征创建B.特征提取C.特征选择D.特征识别标准答案:D通过变量标准化计算得到的回归方程称为()。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程标准答案:A在回归分析中,自变量为(),因变量为()。A.离散型变量,离散型变量B.连续型变量,离散型变量C.离散型变量,连续型变量D.连续型变量,连续型变量标准答案:D某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=1.0-1.2X,这说明()。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元标准答案:C层次聚类适合规模较()的数据集A.大B.中C.小D.所有标准答案:C下面不是分类的常用方法的有()A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场标准答案:D以下哪些不是缺失值的影响()A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出标准答案:C我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左标准答案:B聚类的最简单最基本方法是()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类标准答案:A一元回归参数估计的参数求解方法有()。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法标准答案:ABC对于多层感知机,()层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层标准答案:BC聚类的主要方法有()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类标准答案:ABC下面例子属于分类的是()A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量标准答案:ABC层次聚类的方法是()A.聚合方法B.分拆方法C.组合方法D.比较方法标准答案:AB下列选项是BFR的对象是()A.废弃集B.临时集C.压缩集D.留存集标准答案:ACDk近邻法的基本要素包括()。A.距离度量B.k值的选择C.样本大小D.分类决策规则标准答案:ABD数据科学具有哪些性质()A.有效性B.可用性C.未预料D.可理解标准答案:ABCD系统日志收集的基本特征有()A.高可用性B.高可靠性C.可扩展性D.高效率标准答案:ABCK-means聚类中K值选取的方法是()。A.密度分类法B.手肘法C.大腿法D.随机选取标准答案:AB给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。T.对F.错标准答案:B给定关联规则A→B,意味着:若A发生,B也会发生。T.对F.错标准答案:B特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。T.对F.错标准答案:A决策树分类时将该结点的实例强行分到条件概率大的那一类去T.对F.错标准答案:A随着特征维数的增加,样本间区分度提高。T.对F.错标准答案:BPearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。T.对F.错标准答案:A聚合方法是自底向上的方法。T.对F.错标准答案:A对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。T.对F.错标准答案:A每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。T.对F.错标准答案:Asigmoid函数属于阶跃函数,是神经网络中常见的激活函数。T.对F.错标准答案:B朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能T.对F.错标准答案:A信息熵越大,数据信息的不确定性越小。T.对F.错标准答案:BK-means算法采用贪心策略,通过迭代优化来近似求解。T.对F.错标准答案:A决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布T.对F.错标准答案:A在数据预处理时,无论什么情况,都可以直接将异常值删除T.对F.错标准答案:B支持度是衡量关联规则重要性的一个指标。T.对F.错标准答案:A子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。T.对F.错标准答案:A特征的信息增益越大,则其越不重要。T.对F.错标准答案:B当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。T.对F.错标准答案:B由不同的距离度量所确定的最近邻点是不同的T.对F( )

秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用()。
A.越小
B.越大
C.无关
D.不确定标准答案:B数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A.异常值
B.缺失值
C.不一致的值
D.重复值标准答案:C手肘法的核心指标是()。
A.SES
B.SSE
C.RMSE
D.MSE标准答案:B通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()
A.简单函数变换
B.规范化
C.属性构造
D.连续属性离散化标准答案:C聚类是一种()。
A.有监督学习
B.无监督学习
C.强化学习
D.半监督学习标准答案:B具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
A.1,线性
B.2,线性
C.1,非线性
D.2,非线性标准答案:A在一元线性回归模型中,残差项服从()分布。
A.泊松
B.正态
C.线性
D.非线性标准答案:B根据映射关系的不同可以分为线性回归和()。
A.对数回归
B.非线性回归
C.逻辑回归
D.多元回归标准答案:B考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
A.1,2,3,4
B.1,2,3,5
C.1,2,4,5
D.1,3,4,5标准答案:C某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
A.关联规则发现
B.聚类
C.分类
D.自然语言处理标准答案:A层次聚类对给定的数据进行()的分解。
A.聚合
B.层次
C.分拆
D.复制标准答案:B以下哪一项不是特征工程的子问题()
A.特征创建
B.特征提取
C.特征选择
D.特征识别标准答案:D通过变量标准化计算得到的回归方程称为()。
A.标准化回归方程
B.标准化偏回归方程
C.标准化自回归方程
D.标准化多回归方程标准答案:A在回归分析中,自变量为(),因变量为()。
A.离散型变量,离散型变量
B.连续型变量,离散型变量
C.离散型变量,连续型变量
D.连续型变量,连续型变量标准答案:D某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=
1.0-1.2X,这说明()。
A.产量每增加一台,单位成本增加100元
B.产量每增加一台,单位成本减少
1.2元
C.产量每增加一台,单位成本平均减少
1.2元
D.产量每增加一台,单位平均增加100元标准答案:C层次聚类适合规模较()的数据集
A.大
B.中
C.小
D.所有标准答案:C下面不是分类的常用方法的有()
A.K近邻法
B.朴素贝叶斯
C.决策树
D.条件随机场标准答案:D以下哪些不是缺失值的影响()
A.数据建模将丢失大量有用信息
B.数据建模的不确定性更加显著
C.对整体总是不产生什么作用
D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出标准答案:C我们需要对已生成的树()进行剪枝,将树变得简单,从而使它具有更好的泛化能力。
A.自上而下
B.自下而上
C.自左而右
D.自右而左标准答案:B聚类的最简单最基本方法是()。
A.划分聚类
B.层次聚类
C.密度聚类
D.距离聚类标准答案:A一元回归参数估计的参数求解方法有()。
A.最大似然法
B.距估计法
C.最小二乘法
D.欧式距离法标准答案:ABC对于多层感知机,()层拥有激活函数的功能神经元。
A.输入层
B.隐含层
C.输出层标准答案:BC聚类的主要方法有()。
A.划分聚类
B.层次聚类
C.密度聚类
D.距离聚类标准答案:ABC下面例子属于分类的是()
A.检测图像中是否有人脸出现
B.对客户按照贷款风险大小进行分类
C.识别手写的数字
D.估计商场客流量标准答案:ABC层次聚类的方法是()
A.聚合方法
B.分拆方法
C.组合方法
D.比较方法标准答案:AB下列选项是BFR的对象是()
A.废弃集
B.临时集
C.压缩集
D.留存集标准答案:ACDk近邻法的基本要素包括()。
A.距离度量
B.k值的选择
C.样本大小
D.分类决策规则标准答案:ABD数据科学具有哪些性质()
A.有效性
B.可用性
C.未预料
D.可理解标准答案:ABCD系统日志收集的基本特征有()
A.高可用性
B.高可靠性
C.可扩展性
D.高效率标准答案:ABCK-means聚类中K值选取的方法是()。
A.密度分类法
B.手肘法
C.大腿法
D.随机选取标准答案:AB给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。
T.对
F.错标准答案:B给定关联规则A→B,意味着:若A发生,B也会发生。
T.对
F.错标准答案:B特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。
T.对
F.错标准答案:A决策树分类时将该结点的实例强行分到条件概率大的那一类去
T.对
F.错标准答案:A随着特征维数的增加,样本间区分度提高。
T.对
F.错标准答案:BPearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。
T.对
F.错标准答案:A聚合方法是自底向上的方法。
T.对
F.错标准答案:A对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。
T.对
F.错标准答案:A每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。
T.对
F.错标准答案:Asigmoid函数属于阶跃函数,是神经网络中常见的激活函数。
T.对
F.错标准答案:B朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能
T.对
F.错标准答案:A信息熵越大,数据信息的不确定性越小。
T.对
F.错标准答案:BK-means算法采用贪心策略,通过迭代优化来近似求解。
T.对
F.错标准答案:A决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布
T.对
F.错标准答案:A在数据预处理时,无论什么情况,都可以直接将异常值删除
T.对
F.错标准答案:B支持度是衡量关联规则重要性的一个指标。
T.对
F.错标准答案:A子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。
T.对
F.错标准答案:A特征的信息增益越大,则其越不重要。
T.对
F.错标准答案:B当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。
T.对
F.错标准答案:B由不同的距离度量所确定的最近邻点是不同的
T.对F( )

题目解答

答案

错误

相关问题

  • 聚类分析的常见应用领域不包括( )A. 数据分析B. 图像处理C. 客户分割D. 发现关联购买行为

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 下列关于回归分析的描述不正确的是()A. 回归分析研究单个变量的变化情况B. 刻画不同变量之间关系的模型统称为线性回归模型C. 回归分析研究不同变量之间存在的关系D. 回归分析模型可分为线性回归模型和非线性回归模型

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 下列关于变量的说法,错误的是(1.5) A. 常见的变量主要有自变量、因变量和混杂变量B. 混杂变量不会干扰研究结果C. 自变量不受结果的影响D. 自变量是因,因变量是果E. 因变量随自变量改变的影响而变化

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号