7.[单选题]设X_(1),X_(2),X_(3)是来自总体X、容量是3的一样本,则总体均值的无偏估计是A. (1)/(6)X_(1)+(5)/(6)X_(2)-(2)/(6)X_(3)B. (1)/(6)X_(1)+(1)/(3)X_(2)+(1)/(6)X_(3)C. (1)/(3)X_(1)+(1)/(3)X_(2)+(1)/(3)X_(3)D. (1)/(5)X_(1)+(4)/(5)X_(2)-(3)/(5)X_(3)
关于Y=a+bx中的b,下列哪者是错误的?A. a为回归直线在X轴上的截距B. a>0表示直线与纵轴的交点在原点上方C. aD. a=0表示直线与纵轴通过原点E. a的位置与b的大小有关
甲、乙两种品牌的手表,它们的日走时误差分别为X和Y(单位:s),其分布列为:甲品牌的走时误差分布列 X -1 0 1 P 0.1 0.8 0.1 乙品牌的走时误差分布列 X -2 -1 0 1 2 P 0.1 0.2 0.4 0.2 0.1 试比较甲、乙两种品牌手表的性能.
2018年第一季度,共有9586家星级饭店通过省级旅游主管部门审核,全国星级饭店第一季度的营业收入为-|||-487.11亿元,同比增长2.43 %。餐饮收入为208.24亿元,客房收入为209.12亿元。-|||-第一季度全国50个重点旅游城市共有3636家星级饭店通过省级旅游主管部门数据审核,第一季度全国50个-|||-重点旅游城市星级饭店营业收入为320.19亿元。-|||-2018年第一季度全国星级饭店经营情况统计表-|||-星级 数量(家) 营业收入(亿元) 餐饮收入比重(%) 客房收入比重(%)-|||-合计 9586 487.11 42.75 42.93-|||-星级 62 0.19 48.84 46.62-|||-二星级 1683 20.16 30.17 37.35-|||-星级 4613 105.76 45.93 41.58-|||-四星级 2401 166.54 43.45 41.23-|||-五星级 827 194.46 41.73 45.71-|||-101 2018年第一季度,全国哪类星级饭店的营业收入中,餐饮、客房收入占比最低?-|||-A、五星级 B、四星级 C、三星级 D、二星级-|||-102 2018年第一季度,平均每家四星级及以上饭店月均营业收入:-|||-A、低于300万元 B、在 300-500 万元之间-|||-C、在 (500-1000) 万元之间 D、超过1000万元-|||-103 已知2018年一季度全国三星级酒店平均客房收入为260.26元/间夜,问该季度平均每家三星级酒店订-|||-出客房:-|||-A、不到2000间 B、 -5000 间之间-|||-C、 5000-10000 间之间 D、超过10000间-|||-104 2018年第一季度全国50个重点旅游城市星级饭店营业收入为其他城市星级饭店营业收入的:-|||-A、不到1.1倍 B、 https:/img.zuoyebang.cc/zyb_5c8051f113c7997f24b0c9193954a20b.jpg.1-1.51 倍之间-|||-C、 https:/img.zuoyebang.cc/zyb_5c8051f113c7997f24b0c9193954a20b.jpg.5-21 倍之间 D、2倍以上-|||-105 下列能够从上述资料中推出的是:-|||-A、2017年第一季度,全国星级饭店营业收入超过480亿元-|||-B、2018年第一季度,五星级饭店数量占全国星级饭店的一成以上-|||-C、2018年第一季度,全国二星级饭店的客房收入比餐饮收入高2亿多元-|||-D、2018年第一季度,全国50个重点旅游城市平均每家星级饭店营业收入高于全国平均水平
1030. [单选题] 随机误差的特点是:( )A. 随机误差是一类不恒定的、随机变化的误差B. 是恒定的误差C. 对检验结果影响大D. 呈偏态分布
[.单选题]下列属于顺序变量的是()。A. 性别B. 产品等级C. 产品产量D. 年龄
(一)阅读下面的材料,完成7-9题。(10分) 材料一: 大数据的发展,可以使得很多传统的统计数据在很短时间内获取,一个最著名的例子是谷歌的“谷歌流感趋势”,通过汇集人们在谷歌上搜索的关键词,谷歌可以迅速标示流感疫情的发展、扩散情况,通过与美国疾病预防控制中心的监测报告进行比较,谷歌认为自已利用网络搜索做出的结果非常可靠。重要的是,谷歌的“谷歌流感趋势”只需要1天就可以生成一份最及时的报告,而不是美国疾病预防控制中心的2周。虽然针对谷歌的这一研究争论持续不断,但不可否认的是,谷歌的这一研究思路,极大地促进了“大数据"中“用户生成数据"的研究在学术界快速发展。 在对于大数据的“崇拜”或曰“幻觉”中,最需要一提的是“大数据做慢”的问题。在谷歌发表其“谷歌流感趋势”的研究后不久,另外一篇发表在《自然》杂志上的文章发现,如果使用2013年最断的数据进行检验,谷歌的预测结果存在非常严重的偏误。研究者认为,造成这种结果有两个重要原因。其中一个最重要的原因就是“大数据做慢",即大数据科学家们认为大数据是传统数据收集方法的终结而非补充,因此可以完全忽略传统的数据收集方式。在这个案例中,谷歌的工程师无法证明在网上进行搜索的群体等同于流感涉及的群体。如果我们无法判断这两个群体的具体情况,那么大数据所收集到的数据是一个有偏的样本,而一个有偏的样本其规模越大,做出错误判断的概率也就越高。同时,用户搜索行为的改变也会影响关键词的搜索结果。另外一个是算法变化,谷歌的工程师对算法会进行不断地调整和改进,而搜索引擎算法的改变会影响预测结果,比如媒体对于流感流行的报道会增加与流感相关的词汇的搜索次数,进而影响“谷歌流感趋势”的预测。 大数据的优势在于不用担心数据的代表性问题,可以弥补传统数据中不具代表性的问题。通过计算机巨量的运算方式发现相关关系,包括已知的和未知的,这种方式可以帮助研究者发现更有效的事实(比如超市中尿布与啤酒的关系)。但是,数据本身只是一种材料,大数据本身并不构成、也不能回答特定问题。大数据是寻找问题的一种方式,但其本身不构成对象,它只是一种工具,适用于一些特定用途,切忌将其盲目地神圣化。 (选自孙秀林、施润华的《社会学应该拥抱大数据》) 材料二: 306% 8000 10100-|||-28.6%-|||-4700-|||-2017-|||-6200-|||-2018E-|||-29.0%-|||-2019E 306% 8000 10100-|||-28.6%-|||-4700-|||-2017-|||-6200-|||-2018E-|||-29.0%-|||-2019E 图一:中国大数据产业总体规模及增速(单位:亿元) 图二:中国大数据核心产业规模及增速(单位:亿元) (摘自中国信息通信研究院《中国大数据发展调查报告(2018)》 材料三: 眼下,社会节奏加快,网络全面普及,各类信息呈爆炸式增长,数据资源极为庞大。就拿旅游来看,有媒体形象地称之为“人在游、网在看、云在算”,现实中的旅游活动,早已呈现于网络大数据中。当然,大数据应用关键在“用”。大数据数量巨大、来源分散、格式多样,让庞大的数据资源活起来,就要做好信息的公开与整合。因此,当务之急,要打通“信息孤岛”,借助人工智能、云计算等方式,做好信息的筛选与利用,让数据充分流动起来。在安全可靠的情况下,切实运用大数据提供更多差别化、个性化的公共服务,让虚拟数字更好地服务现实。 网络时代,善用数据者占先机。大数据不仅是新技术,更是全新的思维模式和工作方法。用好大数据,我们不仅能见微知著,防范于未然,还能抢立发展的“风口”,提升全面深化改革开放的质感。 (选自张成林《用大数据提升社会管理效能》) 材料四: 连玉明:数据保护与数据开放作为大数据时代的一对矛盾统一体,就像是天平的两端,只强调数据保护忽视数据开放,不利于大数据的发展;而只强调数据开放不注重数据保护,将会给世界带来一场灾难。因此,必须在开放中保护,在保护中开放。平衡好这一关系,关键在于构建一个基于数据力和数据关系的新的社会秩序,能够在保护个人尊严和自由的前提下, 实现数据的有效流转和价值挖掘,最终推动人类社会从工业文明进入数字文明新时代。. 皮剑龙:网络信息科技的发展是人类技术进步的趋势,为社会生产生活效率的提高作出了巨大的贡献。网络平台用户数量庞大,信息较为完整,且具有很强的私密性,一旦涉及金融、交易等业务环节的平台,具有极强的利益属性,很容易成为黑客攻击的对象,造成个人信息的泄露。科技本身没有道德可言,如何使用它,却是对商业机构以及有关监管机构的道德考验。国家与社会在大力扶持网络信息技术发展的同时,也需要对其弊端保持警惕,及时完善相关监管体制,提高企业个体的合规经营能力以及公民的个人信息保护意识。 姜颖:我们要明确的是,人类科技发展和安全并不是互相矛盾的,虽然产生了个人信息泄露这样的问题,但总体而言,科技让我们更安全了,比如我们可以通过对海量DNA数据的比对找到被拐儿童,也可以通过天眼系统识别犯罪嫌疑人。可以说,科技的发展、大数据的兴起极大地提高了社会治理的智能化水平。大数据的确对我们社会的发展起到了推动作用,因此我们要用积极的、包容的心态去看待科技,不断地完善科技。任何事物都有正反两面,我们可能没办法让科技只产生正效用,但是我们可以通过努力将科技发展给我们带来的负面影响降到最低程度, 让人类科技的发展和安全的守护相伴而行。 (选自(中国青年报)2019年9月1日) 7.根据材料,不能说明“谷歌流感趋势”有偏差的一项是( )(3分) A.谷歌流感趋势”只用了一 天时间研究得出的。 B.网上进行搜索的群体不等同于流感涉及的群体。 C.用户搜索行为的改变也会影响关键词的搜索结果。 D.谷歌的工程师对算法会进行不断地调整和改进。 8.下列对材料相关内容的概括和分析,不正确的一项是( )(3分) A.通过汇集搜索关键词可以迅速发现问题,这样的思路促进了“大数据”中“用户生成数据”的研究的快速发展。 B.近几年,中国大数据产业总体规模发展迅猛,大数据核心产业规模逐年攀升,不过增幅趋于平缓并小有下滑。 C.大数据是新技术,更是全新的思维模式和工作方法;不但可帮助研究者发现更有效的事实,且能直接解决现实难题。 D.通过对海量DNA数据的比对找到被拐儿童,通过天眼系统识别犯罪嫌疑人,这些都是大数据应用的积极作用。 9.根据材料四中受访者的回答,拟写采访者的问题。(4分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是-|||-符合题目要求的.-|||-1.已知复数z的共轭复数为 =1+i, 则 (overline (z)+1)=A-|||-A. 3+i B. 3-i C. 1+3i D. 1-3i-|||-2.设向量 a=(2,1) =(lambda ,1), 若 (a+2b)bot a, 则实数λ的值等于 B-|||-A. -2 B. -dfrac (7)(4) C.2 D. dfrac (7)(4)-|||-3.如图,在直三棱柱 -A'B'C' 中, =BC=CC'-|||-dfrac (7)(4)-|||-A` C`-|||-B-|||-A c-|||-大-|||-B-|||-且 angle ABC=(90)^circ . 则异面直线AC与BC所成的角为 C-|||-A.30°-|||-B.45°-|||-C.60°-|||-D.90°-|||-4.我国施行个人所得税专项附加扣除办法,涉及子女教育继续教育、大病医疗住房贷款-|||-利息、住房租金、赡养老人等六项专项附加扣除.某单位老年、中年△青年员工分别有80-|||-人、100人、120人,现采用分层随机抽样的方法,从该单位上述员工中抽取30人调查专项-|||-附加扣除的享受情况.则应从青年员工中抽取的人数为-|||-A.8人 B.10人 C.12人 D.18人-|||-5.已知样本数据x1 ,x2,···,x100的方差为4,若由 _(1)=2(x)_(1)+3;(y)_(2)=2(x)_(2)+3 ...... _(100)=2(x)_(100)+3-|||-得到另一组样本数据y1,y2,···,y100,则样本数据y1,y2,···,y100的方差为 B-|||-A.8 B.16 C.32 D.64-|||-6.为了让学生了解更多的"一带一路"倡议的信息,某 ↑频率/组距-|||-中学举行了一次"丝绸之路知识竞赛",全校学生的 0.030-|||-0.025-|||-参赛成绩的频率分布直方图如图所示,若60%的学 0.020-|||-生不能参加复赛,则可以参加复赛的成绩约为 0.015-|||-A.72 B.73 0.010-|||-C.74 D.75 0.005 40 50 60 70 80 90 100 成绩/分
某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( )。A. C_(400)^45 cdot C_(200)^15 种B. C_(400)^20 cdot C_(200)^40 种C. C_(400)^30 cdot C_(200)^30 种D. C_(400)^40 cdot C_(200)^20 种
某医生收集到数据经过统计学家分析应该进行t检验应计算的指标是A. 变异系数B. 几何均数C. 均数D. 全距E. 中位数
热门问题
对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性
以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度
下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度
{1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准
皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误
像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验
下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况
1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)
请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化
假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9
重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3
5.聚类分析可以看作是一种非监督的分类。()
可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小
设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布
{15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别
44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁
48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确
下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化