logonew chat icon top
  • icon-chaticon-chat-active搜题/提问
    new chat icon
    新建会话
  • icon-calculatoricon-calculator-active计算器
  • icon-subjecticon-subject-active学科题目
  • icon-pluginicon-plugin-active浏览器插件
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
recent chat icon
历史记录
首页
/
统计
题目

[]是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异A. 聚类B. 关联C. 分类D. 孤立点检测

[]是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异
  • A. 聚类
  • B. 关联
  • C. 分类
  • D. 孤立点检测

题目解答

答案

A

解析

考查要点:本题主要考查对数据挖掘中基本概念的理解,特别是聚类(Clustering)与其他相关概念的区别。

解题核心思路:
题目要求识别一种将数据按相似性分组的方法,需明确各选项的核心定义:

  • 聚类:无监督学习,根据数据相似性自动分组,同一类内部相似、不同类之间相异。
  • 分类:有监督学习,基于已知标签对数据进行预测。
  • 关联:发现数据项之间的关联规则(如购物篮分析)。
  • 孤立点检测:识别数据中的异常值。

破题关键点:
抓住题干中“按相似性归纳成类别”这一核心描述,排除依赖标签(分类)、关联规则(关联)或异常检测(孤立点检测)的选项,锁定聚类。

选项分析:

  1. A. 聚类:

    • 定义:将数据划分为多个簇(类别),使簇内数据相似性高,簇间相似性低。
    • 匹配度:完全符合题干描述。
  2. B. 关联:

    • 定义:发现数据项之间的频繁共现模式(如“购买A的人常购买B”)。
    • 矛盾点:与分组无关,聚焦于关系发现。
  3. C. 分类:

    • 定义:根据已知类别标签对数据进行预测(需训练数据)。
    • 矛盾点:题干未提及“标签”或“监督学习”,且分类强调预测而非自动分组。
  4. D. 孤立点检测:

    • 定义:识别数据中显著偏离正常模式的异常值。
    • 矛盾点:与分组无关,聚焦于异常识别。

结论:唯一符合题干描述的是聚类(A)。

相关问题

  • 下列说法不正确的是() A. 协方差数值上等于各个数据与样本方差之差的平方和B. 协方差和方差的计算完全一致C. 协方差描述了两个变量之间的相关程度D. 方差描述了样本数据的波动程度

  • 下列哪项属于常见的池化方式。() A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的 A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 区群谬误是用个体调查(分析)单位做资料收集与分析,却用集群乃至总体调查(分析)单位做结论。()A. 正确B. 错误

  • 下列哪项属于常见的池化方式。() A. 反向传播B. 方差池化C. 协方差池化D. 最大池化

  • 下列关于回归分析的描述不正确的是() A. 回归分析研究单个变量的变化情况B. 刻画不同变量之间关系的模型统称为线性回归模型C. 回归分析研究不同变量之间存在的关系D. 回归分析模型可分为线性回归模型和非线性回归模型

  • 48皮尔逊相关系数的取值范围为0到正无穷。() A. 错误B. 正确

  • 关于样本中某一变量的综合描述叫( )A. 统计值B. 平均值C. 估计值D. 参数值

  • 下列关于回归分析的描述不正确的是() A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 从总体中抽取的、对总体有一定代表性的一部分个体称为()A. 总体B. 部分C. 样本D. 取样

  • 下列说法正确的是() A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 下列说法正确的是() A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • 决策树算法常用的划分准则包括: A. 信息增益B. 基尼指数C. 误差平方和D. 均方差

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 皮尔逊相关系数的取值范围为0到正无穷。() A. 正确B. 错误

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 聚类分析的常见应用领域不包括( )数据分析图像处理客户分割发现关联购买行为

  • 下列哪项属于常见的池化方式。() A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市天河区黄村大观公园路10号3N2
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号