题目

3.10 假设总体X服从泊松分布Poisson(θ)，而参数θ的先验服从伽玛分布Gamma(α,β)，x_(1),…,x_(n)是来自边际分布m(x)的混合样本。试利用边际矩法证明超参数的估计值hat(alpha)=overline(x)^2/(s_(n-1)^2-overline(x))，hat(beta)=overline(x)/(s_(n-1)^2-overline(x))其中， 0leqoverline(x)leq s_(n-1)^2分别为混合样本均值和方差s_(n-1)^2=sum_(i=1)^n(x_(i)-overline(x))^2/(n-1)。

3.10 假设总体X服从泊松分布Poisson(θ)，而参数θ的先验服从伽玛分布Gamma(α,β)，$x_{1}$,…,$x_{n}$是来自边际分布m(x)的混合样本。试利用边际矩法证明超参数的估计值 $\hat{\alpha}=\overline{x}^{2}/(s_{n-1}^{2}-\overline{x})$，$\hat{\beta}=\overline{x}/(s_{n-1}^{2}-\overline{x})$ 其中，$ 0\leq\overline{x}\leq s_{n-1}^{2}$分别为混合样本均值和方差$s_{n-1}^{2}=\sum_{i=1}^{n}(x_{i}-\overline{x})^{2}/(n-1)$。

题目解答

答案

为了解决这个问题，我们需要使用边际矩法来估计伽玛分布的超参数$\alpha$和$\beta$。边际矩法涉及将边际分布的矩与样本矩相等。首先，让我们回顾泊松分布和伽玛分布的性质。 1. **泊松分布**：如果$X \sim \text{Poisson}(\theta)$，那么$X$的均值和方差都是$\theta$。 2. **伽玛分布**：如果$\theta \sim \text{Gamma}(\alpha, \beta)$，那么$\theta$的均值是$\alpha/\beta$，$\theta$的方差是$\alpha/\beta^2$。当$\theta$是随机变量，服从伽玛分布时，$X$的边际分布是$X$的期望值和方差的组合。$X$的边际均值是： \[ E(X) = E(E(X \mid \theta)) = E(\theta) = \frac{\alpha}{\beta} \] $X$的边际方差是： \[ \text{Var}(X) = E(\text{Var}(X \mid \theta)) + \text{Var}(E(X \mid \theta)) = E(\theta) + \text{Var}(\theta) = \frac{\alpha}{\beta} + \frac{\alpha}{\beta^2} = \frac{\alpha}{\beta} \left(1 + \frac{1}{\beta}\right) = \frac{\alpha}{\beta} \left(\frac{\beta + 1}{\beta}\right) = \frac{\alpha(\beta + 1)}{\beta^2} \] 现在，让我们将这些边际矩与样本矩相等。设$\overline{x}$是样本均值，$s_{n-1}^2$是样本方差。那么我们有： \[ \overline{x} = \frac{\alpha}{\beta} \] \[ s_{n-1}^2 = \frac{\alpha(\beta + 1)}{\beta^2} \] 我们可以解这些方程来找到$\alpha$和$\beta$。从第一个方程，我们可以用$\overline{x}$和$\beta$表示$\alpha$： \[ \alpha = \overline{x} \beta \] 将这个$\alpha$的表达式代入第二个方程，我们得到： \[ s_{n-1}^2 = \frac{(\overline{x} \beta)(\beta + 1)}{\beta^2} = \frac{\overline{x} \beta^2 + \overline{x} \beta}{\beta^2} = \overline{x} + \frac{\overline{x}}{\beta} \] 重新排列项以解$\beta$，我们得到： \[ s_{n-1}^2 - \overline{x} = \frac{\overline{x}}{\beta} \] \[ \beta = \frac{\overline{x}}{s_{n-1}^2 - \overline{x}} \] 现在，将这个$\beta$的表达式代回$\alpha$的表达式中，我们得到： \[ \alpha = \overline{x} \beta = \overline{x} \left(\frac{\overline{x}}{s_{n-1}^2 - \overline{x}}\right) = \frac{\overline{x}^2}{s_{n-1}^2 - \overline{x}} \] 因此，超参数的估计值是： \[ \hat{\alpha} = \frac{\overline{x}^2}{s_{n-1}^2 - \overline{x}} \] \[ \hat{\beta} = \frac{\overline{x}}{s_{n-1}^2 - \overline{x}} \] 最终答案是： \[ \boxed{\hat{\alpha} = \frac{\overline{x}^2}{s_{n-1}^2 - \overline{x}}, \hat{\beta} = \frac{\overline{x}}{s_{n-1}^2 - \overline{x}}} \]

解析

考查要点：本题主要考查边际矩法在泊松-伽玛混合模型中的应用，涉及全期望公式和全方差公式的使用，以及联立方程求解超参数的方法。

解题核心思路：

计算边际分布的均值和方差：利用泊松分布的条件矩和伽玛分布的先验矩，通过全期望和全方差公式得到X的边际矩。
建立矩方程：将样本矩（均值$\overline{x}$和方差$s_{n-1}^2$）与理论边际矩对应，建立方程组。
联立方程求解：通过代数变形解出超参数$\hat{\alpha}$和$\hat{\beta}$。

破题关键点：

正确应用全期望和全方差公式，明确泊松分布和伽玛分布的矩关系。
注意伽玛分布的参数化形式（形状参数$\alpha$，速率参数$\beta$），避免参数混淆。
验证分母条件$s_{n-1}^2 > \overline{x}$，确保估计值有意义。

1. 计算边际分布的均值和方差

边际均值

根据全期望公式：
$E(X) = E[E(X \mid \theta)] = E(\theta) = \frac{\alpha}{\beta}$

边际方差

根据全方差公式：
$\begin{aligned}\text{Var}(X) &= E[\text{Var}(X \mid \theta)] + \text{Var}[E(X \mid \theta)] \\&= E(\theta) + \text{Var}(\theta) \\&= \frac{\alpha}{\beta} + \frac{\alpha}{\beta^2} \\&= \frac{\alpha(\beta + 1)}{\beta^2}\end{aligned}$

2. 建立矩方程

将样本矩与理论矩对应：
$\begin{cases}\overline{x} = \dfrac{\alpha}{\beta} \\s_{n-1}^2 = \dfrac{\alpha(\beta + 1)}{\beta^2}\end{cases}$

3. 联立方程求解

解$\alpha$与$\beta$的关系

从第一个方程得：
$\alpha = \overline{x} \beta$

代入第二个方程

$s_{n-1}^2 = \frac{(\overline{x} \beta)(\beta + 1)}{\beta^2} = \overline{x} + \frac{\overline{x}}{\beta}$

解$\beta$

整理得：
$s_{n-1}^2 - \overline{x} = \frac{\overline{x}}{\beta} \quad \Rightarrow \quad \hat{\beta} = \frac{\overline{x}}{s_{n-1}^2 - \overline{x}}$

解$\alpha$

代入$\alpha = \overline{x} \beta$：
$\hat{\alpha} = \overline{x} \cdot \frac{\overline{x}}{s_{n-1}^2 - \overline{x}} = \frac{\overline{x}^2}{s_{n-1}^2 - \overline{x}}$