logo
  • write-homewrite-home-active首页
  • icon-chaticon-chat-activeAI 智能助手
  • icon-pluginicon-plugin-active浏览器插件
  • icon-subjecticon-subject-active学科题目
  • icon-uploadicon-upload-active上传题库
  • icon-appicon-app-active手机APP
首页
/
统计
题目

某课题组拟进行一项非匹配设计病例对照研究探究吸烟与膀胱癌的关联,假设OR=1.9,人群吸烟率=23%,α=0.05(双侧检验),power=0.90,病例组与对照组拟纳入相同数量的研究对象,则每组的最小样本量n=_____(要求:需使用Excel软件计算,保留整数)。第1空:246

某课题组拟进行一项非匹配设计病例对照研究探究吸烟与膀胱癌的关联,假设OR=1.9,人群吸烟率=23%,α=0.05(双侧检验),power=0.90,病例组与对照组拟纳入相同数量的研究对象,则每组的最小样本量n=_____(要求:需使用Excel软件计算,保留整数)。 第1空:246

题目解答

答案

为了确定非匹配设计病例对照研究中每组的最小样本量,我们需要使用计算病例对照研究样本量的公式。公式如下: \[ n = \frac{(Z_{1-\alpha/2} + Z_{1-\beta})^2 \cdot (p_1(1-p_1) + p_2(1-p_2))}{(p_1 - p_2)^2} \] 其中: - $ n $ 是每组的样本量 - $ Z_{1-\alpha/2} $ 是双侧检验中 $ \alpha $ 水平的Z分数 - $ Z_{1-\beta} $ 是 $ \beta $ 水平的Z分数(其中 $ \beta = 1 - \text{power} $) - $ p_1 $ 是病例组的暴露率 - $ p_2 $ 是对照组的暴露率 已知: - $ \text{OR} = 1.9 $ - 人群吸烟率 $ p = 0.23 $ - $ \alpha = 0.05 $(双侧检验) - $ \text{power} = 0.90 $ - 病例组与对照组拟纳入相同数量的研究对象 首先,我们需要找到 $ Z_{1-\alpha/2} $ 和 $ Z_{1-\beta} $: - 对于 $ \alpha = 0.05 $(双侧检验), $ Z_{1-\alpha/2} = Z_{0.975} = 1.96 $ - 对于 $ \text{power} = 0.90 $, $ \beta = 1 - 0.90 = 0.10 $,所以 $ Z_{1-\beta} = Z_{0.90} = 1.28 $ 接下来,我们需要计算 $ p_1 $ 和 $ p_2 $: - $ p_2 = p = 0.23 $(对照组的暴露率,即人群吸烟率) - $ p_1 = \frac{p \cdot \text{OR}}{1 - p + p \cdot \text{OR}} = \frac{0.23 \cdot 1.9}{1 - 0.23 + 0.23 \cdot 1.9} = \frac{0.437}{1 - 0.23 + 0.437} = \frac{0.437}{1.207} \approx 0.3621 $ 现在,我们可以将这些值代入样本量公式: \[ n = \frac{(1.96 + 1.28)^2 \cdot (0.3621(1-0.3621) + 0.23(1-0.23))}{(0.3621 - 0.23)^2} \] \[ n = \frac{(3.24)^2 \cdot (0.3621 \cdot 0.6379 + 0.23 \cdot 0.77)}{(0.1321)^2} \] \[ n = \frac{10.5056 \cdot (0.2308 + 0.1771)}{0.01745} \] \[ n = \frac{10.5056 \cdot 0.4079}{0.01745} \] \[ n = \frac{4.2875}{0.01745} \] \[ n \approx 245.67 \] 将 $ n $ 四舍五入到最接近的整数,我们得到: \[ n = 246 \] 因此,每组的最小样本量是 $\boxed{246}$。

解析

考查要点:本题主要考查病例对照研究中样本量的计算方法,涉及比值比(OR)、统计功效(power)、显著性水平(α)等核心概念,以及如何通过公式推导最小样本量。

解题核心思路:

  1. 确定关键参数:根据题目给出的OR值、人群吸烟率、α和power,结合病例对照研究的公式,计算每组所需样本量。
  2. 公式选择:使用病例对照研究样本量公式,需明确公式中各参数的含义及计算方式。
  3. Z值与暴露率计算:通过α和power确定对应的Z分数,并利用OR值推导病例组的暴露率。

破题关键点:

  • 正确转换OR值为暴露率:通过OR的定义式,结合对照组暴露率计算病例组暴露率。
  • 公式代入与计算:注意公式中分子和分母的计算细节,确保数值代入准确。

步骤1:确定Z值

  • 双侧检验的Z₁₋α/₂:当α=0.05时,查标准正态分布表得 $Z_{0.975}=1.96$。
  • Z₁₋β:power=0.90对应β=0.10,查表得 $Z_{0.90}=1.28$。

步骤2:计算病例组暴露率p₁

  • 对照组暴露率p₂:题目直接给出 $p_2=0.23$。
  • 利用OR公式推导p₁:
    $\text{OR} = \frac{p_1/(1-p_1)}{p_2/(1-p_2)} \implies 1.9 = \frac{p_1/(1-p_1)}{0.23/0.77}$
    解得 $p_1 \approx 0.3621$。

步骤3:代入样本量公式

公式为:
$n = \frac{(Z_{1-\alpha/2} + Z_{1-\beta})^2 \cdot [p_1(1-p_1) + p_2(1-p_2)]}{(p_1 - p_2)^2}$
代入数值:
$n = \frac{(1.96 + 1.28)^2 \cdot [0.3621 \cdot 0.6379 + 0.23 \cdot 0.77]}{(0.3621 - 0.23)^2} \approx 245.67$
取整后得 $n=246$。

相关问题

  • 下列哪项属于常见的池化方式。()A. 协方差池化B. 方差池化C. 反向传播D. 最大池化

  • 对研究对象制定明确的纳入标准和排除标准,是为了保证样本的A. 可靠性B. 可行性C. 代表性D. 合理性E. 科学性

  • {1.5分)确定研究总体和样本时,不需要考虑A. 立题依据B. 样本量C. 抽样方法D. 目标总体E. 纳入及排除标准

  • 请你从下表中找出1~100中所有质数.并数一数一共多少个. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

  • 5.聚类分析可以看作是一种非监督的分类。()

  • 1. 名词解释 假设检验 (请在答题纸上手写并拍照上传)

  • 设随机变量XY都服从N(0,1),则有()A. X+Y服从正态分布B. X+Y服从x^2分布 C. X^2和Y^2都服从x^2分布 D. (X^2)div (Y^2)服从F分布

  • {15分)常规情况下,下列不属于人口学变量的是A. 民族B. 收入C. 年龄D. 睡眠时间E. 性别

  • 48皮尔逊相关系数的取值范围为0到正无穷。()A. 错误B. 正确

  • 下列哪项属于常见的池化方式。()A. 反向传播B. 最大池化C. 方差池化D. 协方差池化

  • 皮尔逊相关系数的取值范围为0到正无穷。()A. 正确B. 错误

  • 下列关于回归分析的描述不正确的是()A. 回归分析模型可分为线性回归模型和非线性回归模型B. 回归分析研究不同变量之间存在的关系()C. 刻画不同变量之间关系的模型统称为线性回归模型D. 回归分析研究单个变量的变化情况

  • 以下几种数据挖掘功能中,〔〕被广泛的用于购物篮分析.A. 关联分析B. 分类和预测C. 聚类分析D. 演变分析

  • 可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述正确的A. 每个样本数据分别归属于与其距离最远的聚类质心所在聚类集合B. 每个簇类的质心累加起来最小C. 最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最大D. 每个簇类的方差累加起来最小

  • 重测信度用重测相关系数来表示,相关系数越趋近于下列哪一数值时,则重测信度越高A. 1B. 0.7C. 2D. 3

  • 44.2021年,我国人均预期寿命提高到了()。A. 78岁B. 79岁C. 78.2岁D. 79.2岁

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差衡量了多个变量的分布C. 协方差和方差的计算方式完全一致D. 方差描述了样本数据的波动程度

  • 假定用于分析的数据包含属性age.数据元组[1]中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:A. 18.3B. 22。6C. 26。8D. 27。9

  • 下列说法正确的是()A. 方差数值上等于各个数据与样本方差之差的平方和之平均数B. 协方差和方差的计算方式完全一致C. 协方差衡量了多个变量的分布D. 方差描述了样本数据的波动程度

  • 像从性不好的资料是()A. 由于死亡或者其他原因不能继续试验B. 能按照试验规定要求完成实验C. 重复参加试验D. 由于纳入标准不合格导致选择的研究对象不符合试验要求E. 能完成试验但是不能按照规定要求完成试验

上一页下一页
logo
广州极目未来文化科技有限公司
注册地址:广州市黄埔区揽月路8号135、136、137、138房
关于
  • 隐私政策
  • 服务协议
  • 权限详情
学科
  • 医学
  • 政治学
  • 管理
  • 计算机
  • 教育
  • 数学
联系我们
  • 客服电话: 010-82893100
  • 公司邮箱: daxuesoutijiang@163.com
  • qt

©2023 广州极目未来文化科技有限公司 粤ICP备2023029972号    粤公网安备44011202002296号