题目
一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据: 不够良好 良好 病例组 40 60 对照组 10 90 (1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,((P(B|A)))/((P(overline{B)|A))}与((P(B|overline{A))})/((P(overline{B)|overline{A))}}的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:R=((P(A|B)))/((P(overline{A)|B))}•((P(overline{A)|overline(B))})/((P(A|overline{B)))};(ⅱ)利用该调查数据,给出P(A|B),P(A|overline(B))的估计值,并利用(ⅰ)的结果给出R的估计值.附:K2=(n(ad-bc)^2)/((a+b)(c+d)(a+c)(b+d)). P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828
一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,$\frac{{P(B|A)}}{{P(\overline{B}|A)}}$与$\frac{{P(B|\overline{A})}}{{P(\overline{B}|\overline{A})}}$的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:R=$\frac{{P(A|B)}}{{P(\overline{A}|B)}}$•$\frac{{P(\overline{A}|\overline{B})}}{{P(A|\overline{B})}}$;
(ⅱ)利用该调查数据,给出P(A|B),P(A|$\overline{B}$)的估计值,并利用(ⅰ)的结果给出R的估计值.
附:K2=$\frac{n(ad-bc)^{2}}{(a+b)(c+d)(a+c)(b+d)}$.
| 不够良好 | 良好 | |
| 病例组 | 40 | 60 |
| 对照组 | 10 | 90 |
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,$\frac{{P(B|A)}}{{P(\overline{B}|A)}}$与$\frac{{P(B|\overline{A})}}{{P(\overline{B}|\overline{A})}}$的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:R=$\frac{{P(A|B)}}{{P(\overline{A}|B)}}$•$\frac{{P(\overline{A}|\overline{B})}}{{P(A|\overline{B})}}$;
(ⅱ)利用该调查数据,给出P(A|B),P(A|$\overline{B}$)的估计值,并利用(ⅰ)的结果给出R的估计值.
附:K2=$\frac{n(ad-bc)^{2}}{(a+b)(c+d)(a+c)(b+d)}$.
| P(K2≥k) | 0.050 | 0.010 | 0.001 |
| k | 3.841 | 6.635 | 10.828 |
题目解答
答案
解:(1)补充列联表为:
计算K2=$\frac{200{×(40×90-10×60)}^{2}}{100×100×50×150}$=24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)证明:R=$\frac{{P(B|A)}}{{P(\overline{B}|A)}}$:$\frac{{P(B|\overline{A})}}{{P(\overline{B}|\overline{A})}}$=$\frac{P(B|A)}{P(\overline{B}|A)}$•$\frac{P(\overline{B}|\overline{A})}{P(B|\overline{A})}$=$\frac{\frac{P(AB)}{P(A)}}{\frac{P(A\overline{B})}{P(A)}}$•$\frac{\frac{P(\overline{A}\overline{B})}{P(\overline{A})}}{\frac{P(\overline{A}B)}{P(\overline{A})}}$=$\frac{P(AB)•P(\overline{A}\overline{B})}{P(A\overline{B})•P(\overline{A}B)}$=$\frac{\frac{P(AB)}{P(B)}}{\frac{P(\overline{A}B)}{P(B)}}$•$\frac{\frac{P(\overline{A}\overline{B})}{P(\overline{B})}}{\frac{P(A\overline{B})}{P(\overline{B})}}$=$\frac{{P(A|B)}}{{P(\overline{A}|B)}}•\frac{{P(\overline{A}|\overline{B})}}{{P(A|\overline{B})}}$;
(ⅱ)利用调查数据,P(A|B)=$\frac{40}{100}$=$\frac{2}{5}$,$P(A|\overline{B})$=$\frac{10}{100}$=$\frac{1}{10}$,P($\overline{A}$|B)=1-P(A|B)=$\frac{3}{5}$,P($\overline{A}$|$\overline{B}$)=1-P(A|$\overline{B}$)=$\frac{9}{10}$,
所以R=$\frac{\frac{2}{5}}{\frac{3}{5}}$×$\frac{\frac{9}{10}}{\frac{1}{10}}$=6.
| 不够良好 | 良好 | 合计 | |
| 病例组 | 40 | 60 | 100 |
| 对照组 | 10 | 90 | 100 |
| 合计 | 50 | 150 | 200 |
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)证明:R=$\frac{{P(B|A)}}{{P(\overline{B}|A)}}$:$\frac{{P(B|\overline{A})}}{{P(\overline{B}|\overline{A})}}$=$\frac{P(B|A)}{P(\overline{B}|A)}$•$\frac{P(\overline{B}|\overline{A})}{P(B|\overline{A})}$=$\frac{\frac{P(AB)}{P(A)}}{\frac{P(A\overline{B})}{P(A)}}$•$\frac{\frac{P(\overline{A}\overline{B})}{P(\overline{A})}}{\frac{P(\overline{A}B)}{P(\overline{A})}}$=$\frac{P(AB)•P(\overline{A}\overline{B})}{P(A\overline{B})•P(\overline{A}B)}$=$\frac{\frac{P(AB)}{P(B)}}{\frac{P(\overline{A}B)}{P(B)}}$•$\frac{\frac{P(\overline{A}\overline{B})}{P(\overline{B})}}{\frac{P(A\overline{B})}{P(\overline{B})}}$=$\frac{{P(A|B)}}{{P(\overline{A}|B)}}•\frac{{P(\overline{A}|\overline{B})}}{{P(A|\overline{B})}}$;
(ⅱ)利用调查数据,P(A|B)=$\frac{40}{100}$=$\frac{2}{5}$,$P(A|\overline{B})$=$\frac{10}{100}$=$\frac{1}{10}$,P($\overline{A}$|B)=1-P(A|B)=$\frac{3}{5}$,P($\overline{A}$|$\overline{B}$)=1-P(A|$\overline{B}$)=$\frac{9}{10}$,
所以R=$\frac{\frac{2}{5}}{\frac{3}{5}}$×$\frac{\frac{9}{10}}{\frac{1}{10}}$=6.