logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

(一)阅读下面的材料,完成7-9题。(10分) 材料一: 大数据的发展,可以使得很多传统的统计数据在很短时间内获取,一个最著名的例子是谷歌的“谷歌流感趋势”,通过汇集人们在谷歌上搜索的关键词,谷歌可以迅速标示流感疫情的发展、扩散情况,通过与美国疾病预防控制中心的监测报告进行比较,谷歌认为自已利用网络搜索做出的结果非常可靠。重要的是,谷歌的“谷歌流感趋势”只需要1天就可以生成一份最及时的报告,而不是美国疾病预防控制中心的2周。虽然针对谷歌的这一研究争论持续不断,但不可否认的是,谷歌的这一研究思路,极大地促进了“大数据"中“用户生成数据"的研究在学术界快速发展。 在对于大数据的“崇拜”或曰“幻觉”中,最需要一提的是“大数据做慢”的问题。在谷歌发表其“谷歌流感趋势”的研究后不久,另外一篇发表在《自然》杂志上的文章发现,如果使用2013年最断的数据进行检验,谷歌的预测结果存在非常严重的偏误。研究者认为,造成这种结果有两个重要原因。其中一个最重要的原因就是“大数据做慢",即大数据科学家们认为大数据是传统数据收集方法的终结而非补充,因此可以完全忽略传统的数据收集方式。在这个案例中,谷歌的工程师无法证明在网上进行搜索的群体等同于流感涉及的群体。如果我们无法判断这两个群体的具体情况,那么大数据所收集到的数据是一个有偏的样本,而一个有偏的样本其规模越大,做出错误判断的概率也就越高。同时,用户搜索行为的改变也会影响关键词的搜索结果。另外一个是算法变化,谷歌的工程师对算法会进行不断地调整和改进,而搜索引擎算法的改变会影响预测结果,比如媒体对于流感流行的报道会增加与流感相关的词汇的搜索次数,进而影响“谷歌流感趋势”的预测。 大数据的优势在于不用担心数据的代表性问题,可以弥补传统数据中不具代表性的问题。通过计算机巨量的运算方式发现相关关系,包括已知的和未知的,这种方式可以帮助研究者发现更有效的事实(比如超市中尿布与啤酒的关系)。但是,数据本身只是一种材料,大数据本身并不构成、也不能回答特定问题。大数据是寻找问题的一种方式,但其本身不构成对象,它只是一种工具,适用于一些特定用途,切忌将其盲目地神圣化。 (选自孙秀林、施润华的《社会学应该拥抱大数据》) 材料二: 306% 8000 10100-|||-28.6%-|||-4700-|||-2017-|||-6200-|||-2018E-|||-29.0%-|||-2019E 306% 8000 10100-|||-28.6%-|||-4700-|||-2017-|||-6200-|||-2018E-|||-29.0%-|||-2019E 图一:中国大数据产业总体规模及增速(单位:亿元) 图二:中国大数据核心产业规模及增速(单位:亿元) (摘自中国信息通信研究院《中国大数据发展调查报告(2018)》 材料三: 眼下,社会节奏加快,网络全面普及,各类信息呈爆炸式增长,数据资源极为庞大。就拿旅游来看,有媒体形象地称之为“人在游、网在看、云在算”,现实中的旅游活动,早已呈现于网络大数据中。当然,大数据应用关键在“用”。大数据数量巨大、来源分散、格式多样,让庞大的数据资源活起来,就要做好信息的公开与整合。因此,当务之急,要打通“信息孤岛”,借助人工智能、云计算等方式,做好信息的筛选与利用,让数据充分流动起来。在安全可靠的情况下,切实运用大数据提供更多差别化、个性化的公共服务,让虚拟数字更好地服务现实。 网络时代,善用数据者占先机。大数据不仅是新技术,更是全新的思维模式和工作方法。用好大数据,我们不仅能见微知著,防范于未然,还能抢立发展的“风口”,提升全面深化改革开放的质感。 (选自张成林《用大数据提升社会管理效能》) 材料四: 连玉明:数据保护与数据开放作为大数据时代的一对矛盾统一体,就像是天平的两端,只强调数据保护忽视数据开放,不利于大数据的发展;而只强调数据开放不注重数据保护,将会给世界带来一场灾难。因此,必须在开放中保护,在保护中开放。平衡好这一关系,关键在于构建一个基于数据力和数据关系的新的社会秩序,能够在保护个人尊严和自由的前提下, 实现数据的有效流转和价值挖掘,最终推动人类社会从工业文明进入数字文明新时代。. 皮剑龙:网络信息科技的发展是人类技术进步的趋势,为社会生产生活效率的提高作出了巨大的贡献。网络平台用户数量庞大,信息较为完整,且具有很强的私密性,一旦涉及金融、交易等业务环节的平台,具有极强的利益属性,很容易成为黑客攻击的对象,造成个人信息的泄露。科技本身没有道德可言,如何使用它,却是对商业机构以及有关监管机构的道德考验。国家与社会在大力扶持网络信息技术发展的同时,也需要对其弊端保持警惕,及时完善相关监管体制,提高企业个体的合规经营能力以及公民的个人信息保护意识。 姜颖:我们要明确的是,人类科技发展和安全并不是互相矛盾的,虽然产生了个人信息泄露这样的问题,但总体而言,科技让我们更安全了,比如我们可以通过对海量DNA数据的比对找到被拐儿童,也可以通过天眼系统识别犯罪嫌疑人。可以说,科技的发展、大数据的兴起极大地提高了社会治理的智能化水平。大数据的确对我们社会的发展起到了推动作用,因此我们要用积极的、包容的心态去看待科技,不断地完善科技。任何事物都有正反两面,我们可能没办法让科技只产生正效用,但是我们可以通过努力将科技发展给我们带来的负面影响降到最低程度, 让人类科技的发展和安全的守护相伴而行。 (选自(中国青年报)2019年9月1日) 7.根据材料,不能说明“谷歌流感趋势”有偏差的一项是( )(3分) A.谷歌流感趋势”只用了一 天时间研究得出的。 B.网上进行搜索的群体不等同于流感涉及的群体。 C.用户搜索行为的改变也会影响关键词的搜索结果。 D.谷歌的工程师对算法会进行不断地调整和改进。 8.下列对材料相关内容的概括和分析,不正确的一项是( )(3分) A.通过汇集搜索关键词可以迅速发现问题,这样的思路促进了“大数据”中“用户生成数据”的研究的快速发展。 B.近几年,中国大数据产业总体规模发展迅猛,大数据核心产业规模逐年攀升,不过增幅趋于平缓并小有下滑。 C.大数据是新技术,更是全新的思维模式和工作方法;不但可帮助研究者发现更有效的事实,且能直接解决现实难题。 D.通过对海量DNA数据的比对找到被拐儿童,通过天眼系统识别犯罪嫌疑人,这些都是大数据应用的积极作用。 9.根据材料四中受访者的回答,拟写采访者的问题。(4分)

(一)阅读下面的材料,完成7-9题。(10分)

材料一:

大数据的发展,可以使得很多传统的统计数据在很短时间内获取,一个最著名的例子是谷歌的“谷歌流感趋势”,通过汇集人们在谷歌上搜索的关键词,谷歌可以迅速标示流感疫情的发展、扩散情况,通过与美国疾病预防控制中心的监测报告进行比较,谷歌认为自已利用网络搜索做出的结果非常可靠。重要的是,谷歌的“谷歌流感趋势”只需要1天就可以生成一份最及时的报告,而不是美国疾病预防控制中心的2周。虽然针对谷歌的这一研究争论持续不断,但不可否认的是,谷歌的这一研究思路,极大地促进了“大数据"中“用户生成数据"的研究在学术界快速发展。

在对于大数据的“崇拜”或曰“幻觉”中,最需要一提的是“大数据做慢”的问题。在谷歌发表其“谷歌流感趋势”的研究后不久,另外一篇发表在《自然》杂志上的文章发现,如果使用2013年最断的数据进行检验,谷歌的预测结果存在非常严重的偏误。研究者认为,造成这种结果有两个重要原因。其中一个最重要的原因就是“大数据做慢",即大数据科学家们认为大数据是传统数据收集方法的终结而非补充,因此可以完全忽略传统的数据收集方式。在这个案例中,谷歌的工程师无法证明在网上进行搜索的群体等同于流感涉及的群体。如果我们无法判断这两个群体的具体情况,那么大数据所收集到的数据是一个有偏的样本,而一个有偏的样本其规模越大,做出错误判断的概率也就越高。同时,用户搜索行为的改变也会影响关键词的搜索结果。另外一个是算法变化,谷歌的工程师对算法会进行不断地调整和改进,而搜索引擎算法的改变会影响预测结果,比如媒体对于流感流行的报道会增加与流感相关的词汇的搜索次数,进而影响“谷歌流感趋势”的预测。

大数据的优势在于不用担心数据的代表性问题,可以弥补传统数据中不具代表性的问题。通过计算机巨量的运算方式发现相关关系,包括已知的和未知的,这种方式可以帮助研究者发现更有效的事实(比如超市中尿布与啤酒的关系)。但是,数据本身只是一种材料,大数据本身并不构成、也不能回答特定问题。大数据是寻找问题的一种方式,但其本身不构成对象,它只是一种工具,适用于一些特定用途,切忌将其盲目地神圣化。

(选自孙秀林、施润华的《社会学应该拥抱大数据》)

材料二:

图一:中国大数据产业总体规模及增速(单位:亿元) 图二:中国大数据核心产业规模及增速(单位:亿元)

(摘自中国信息通信研究院《中国大数据发展调查报告(2018)》

材料三:

眼下,社会节奏加快,网络全面普及,各类信息呈爆炸式增长,数据资源极为庞大。就拿旅游来看,有媒体形象地称之为“人在游、网在看、云在算”,现实中的旅游活动,早已呈现于网络大数据中。当然,大数据应用关键在“用”。大数据数量巨大、来源分散、格式多样,让庞大的数据资源活起来,就要做好信息的公开与整合。因此,当务之急,要打通“信息孤岛”,借助人工智能、云计算等方式,做好信息的筛选与利用,让数据充分流动起来。在安全可靠的情况下,切实运用大数据提供更多差别化、个性化的公共服务,让虚拟数字更好地服务现实。

网络时代,善用数据者占先机。大数据不仅是新技术,更是全新的思维模式和工作方法。用好大数据,我们不仅能见微知著,防范于未然,还能抢立发展的“风口”,提升全面深化改革开放的质感。

(选自张成林《用大数据提升社会管理效能》)

材料四:

连玉明:数据保护与数据开放作为大数据时代的一对矛盾统一体,就像是天平的两端,只强调数据保护忽视数据开放,不利于大数据的发展;而只强调数据开放不注重数据保护,将会给世界带来一场灾难。因此,必须在开放中保护,在保护中开放。平衡好这一关系,关键在于构建一个基于数据力和数据关系的新的社会秩序,能够在保护个人尊严和自由的前提下, 实现数据的有效流转和价值挖掘,最终推动人类社会从工业文明进入数字文明新时代。.

皮剑龙:网络信息科技的发展是人类技术进步的趋势,为社会生产生活效率的提高作出了巨大的贡献。网络平台用户数量庞大,信息较为完整,且具有很强的私密性,一旦涉及金融、交易等业务环节的平台,具有极强的利益属性,很容易成为黑客攻击的对象,造成个人信息的泄露。科技本身没有道德可言,如何使用它,却是对商业机构以及有关监管机构的道德考验。国家与社会在大力扶持网络信息技术发展的同时,也需要对其弊端保持警惕,及时完善相关监管体制,提高企业个体的合规经营能力以及公民的个人信息保护意识。

姜颖:我们要明确的是,人类科技发展和安全并不是互相矛盾的,虽然产生了个人信息泄露这样的问题,但总体而言,科技让我们更安全了,比如我们可以通过对海量DNA数据的比对找到被拐儿童,也可以通过天眼系统识别犯罪嫌疑人。可以说,科技的发展、大数据的兴起极大地提高了社会治理的智能化水平。大数据的确对我们社会的发展起到了推动作用,因此我们要用积极的、包容的心态去看待科技,不断地完善科技。任何事物都有正反两面,我们可能没办法让科技只产生正效用,但是我们可以通过努力将科技发展给我们带来的负面影响降到最低程度,

让人类科技的发展和安全的守护相伴而行。

(选自(中国青年报)2019年9月1日)

7.根据材料,不能说明“谷歌流感趋势”有偏差的一项是( )(3分)

A.谷歌流感趋势”只用了一 天时间研究得出的。

B.网上进行搜索的群体不等同于流感涉及的群体。

C.用户搜索行为的改变也会影响关键词的搜索结果。

D.谷歌的工程师对算法会进行不断地调整和改进。

8.下列对材料相关内容的概括和分析,不正确的一项是( )(3分)

A.通过汇集搜索关键词可以迅速发现问题,这样的思路促进了“大数据”中“用户生成数据”的研究的快速发展。

B.近几年,中国大数据产业总体规模发展迅猛,大数据核心产业规模逐年攀升,不过增幅趋于平缓并小有下滑。

C.大数据是新技术,更是全新的思维模式和工作方法;不但可帮助研究者发现更有效的事实,且能直接解决现实难题。

D.通过对海量DNA数据的比对找到被拐儿童,通过天眼系统识别犯罪嫌疑人,这些都是大数据应用的积极作用。

9.根据材料四中受访者的回答,拟写采访者的问题。(4分)

题目解答

答案

7.A (“谷歌流感趋势”只需更1天就可以生成一份最及时的报告强调是优势)

8.C (材料一中提到,大数据本身不能解决难题)

9.示例一:大数据时代的个人信息泄露问题背后映射出的是人类科技发展和安全的关系,您认为应该如何看待和处理两者之间的关系? (“ 大数据"“信息泄漏”“科技发展”“安全”各1分)

示例二:大数据时代,我们是否应关注个人信息进露问题?我们是否应进一步思考人类科技发展和安全的关系问题?科技发展和安全两者之间的关系该如何看待和处埋? (答出一个问题给2分,两个给3分,三个给4分)

相关问题

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号