题目
2.8 已知两个类别omega_(1)和omega_(2),其先验概率P(omega_(1))=P(omega_(2)),两类的类条件概率密度服从正态分布,有p(X|omega_(1))sim N(mu_(1),Sigma)和p(X|omega_(2))sim N(mu_(2),Sigma),且mu_(1)=}00进行分类。
2.8 已知两个类别$\omega_{1}$和$\omega_{2}$,其先验概率$P(\omega_{1})=P(\omega_{2})$,两类的类条件概率密度服从正态分布,有$p(X|\omega_{1})\sim N(\mu_{1},\Sigma)$和$p(X|\omega_{2})\sim N(\mu_{2},\Sigma)$,且$\mu_{1}=\begin{bmatrix}0\\0\end{bmatrix}$,$\mu_{2}=\begin{bmatrix}3\\3\end{bmatrix}$,$\Sigma=\begin{bmatrix}1.1&0.3\\0.3&1.9\end{bmatrix}$。试采用贝叶斯决策对样本$X=\begin{bmatrix}1.0\\2.2\end{bmatrix}$进行分类。
题目解答
答案
为了使用贝叶斯决策对样本 $ X = \begin{bmatrix} 1.0 \\ 2.2 \end{bmatrix} $ 进行分类,我们需要比较后验概率 $ P(\omega_1 | X) $ 和 $ P(\omega_2 | X) $。由于先验概率 $ P(\omega_1) = P(\omega_2) $,后验概率与类条件概率密度成正比,即 $ P(\omega_1 | X) \propto p(X | \omega_1) $ 和 $ P(\omega_2 | X) \propto p(X | \omega_2) $。因此,我们只需要比较 $ p(X | \omega_1) $ 和 $ p(X | \omega_2) $。
类条件概率密度由下式给出:
\[ p(X | \omega_i) \sim N(\mu_i, \Sigma) = \frac{1}{(2\pi)^{d/2} |\Sigma|^{1/2}} \exp \left( -\frac{1}{2} (X - \mu_i)^T \Sigma^{-1} (X - \mu_i) \right) \]
其中 $ d = 2 $ 是维数,$ \mu_1 = \begin{bmatrix} 0 \\ 0 \end{bmatrix} $, $ \mu_2 = \begin{bmatrix} 3 \\ 3 \end{bmatrix} $,且 $ \Sigma = \begin{bmatrix} 1.1 & 0.3 \\ 0.3 & 1.9 \end{bmatrix} $。
首先,我们需要计算 $ \Sigma $ 的行列式和逆矩阵:
\[ |\Sigma| = 1.1 \cdot 1.9 - 0.3 \cdot 0.3 = 2.09 - 0.09 = 2 \]
\[ \Sigma^{-1} = \frac{1}{|\Sigma|} \begin{bmatrix} 1.9 & -0.3 \\ -0.3 & 1.1 \end{bmatrix} = \frac{1}{2} \begin{bmatrix} 1.9 & -0.3 \\ -0.3 & 1.1 \end{bmatrix} = \begin{bmatrix} 0.95 & -0.15 \\ -0.15 & 0.55 \end{bmatrix} \]
现在,我们计算指数项 $ (X - \mu_i)^T \Sigma^{-1} (X - \mu_i) $ 对于 $ i = 1, 2 $。
对于 $ \omega_1 $:
\[ X - \mu_1 = \begin{bmatrix} 1.0 \\ 2.2 \end{bmatrix} - \begin{bmatrix} 0 \\ 0 \end{bmatrix} = \begin{bmatrix} 1.0 \\ 2.2 \end{bmatrix} \]
\[ (X - \mu_1)^T \Sigma^{-1} (X - \mu_1) = \begin{bmatrix} 1.0 & 2.2 \end{bmatrix} \begin{bmatrix} 0.95 & -0.15 \\ -0.15 & 0.55 \end{bmatrix} \begin{bmatrix} 1.0 \\ 2.2 \end{bmatrix} \]
\[ = \begin{bmatrix} 1.0 & 2.2 \end{bmatrix} \begin{bmatrix} 0.95 \cdot 1.0 + (-0.15) \cdot 2.2 \\ (-0.15) \cdot 1.0 + 0.55 \cdot 2.2 \end{bmatrix} = \begin{bmatrix} 1.0 & 2.2 \end{bmatrix} \begin{bmatrix} 0.95 - 0.33 \\ -0.15 + 1.21 \end{bmatrix} \]
\[ = \begin{bmatrix} 1.0 & 2.2 \end{bmatrix} \begin{bmatrix} 0.62 \\ 1.06 \end{bmatrix} = 1.0 \cdot 0.62 + 2.2 \cdot 1.06 = 0.62 + 2.332 = 2.952 \]
对于 $ \omega_2 $:
\[ X - \mu_2 = \begin{bmatrix} 1.0 \\ 2.2 \end{bmatrix} - \begin{bmatrix} 3 \\ 3 \end{bmatrix} = \begin{bmatrix} -2.0 \\ -0.8 \end{bmatrix} \]
\[ (X - \mu_2)^T \Sigma^{-1} (X - \mu_2) = \begin{bmatrix} -2.0 & -0.8 \end{bmatrix} \begin{bmatrix} 0.95 & -0.15 \\ -0.15 & 0.55 \end{bmatrix} \begin{bmatrix} -2.0 \\ -0.8 \end{bmatrix} \]
\[ = \begin{bmatrix} -2.0 & -0.8 \end{bmatrix} \begin{bmatrix} 0.95 \cdot (-2.0) + (-0.15) \cdot (-0.8) \\ (-0.15) \cdot (-2.0) + 0.55 \cdot (-0.8) \end{bmatrix} = \begin{bmatrix} -2.0 & -0.8 \end{bmatrix} \begin{bmatrix} -1.9 + 0.12 \\ 0.3 - 0.44 \end{bmatrix} \]
\[ = \begin{bmatrix} -2.0 & -0.8 \end{bmatrix} \begin{bmatrix} -1.78 \\ -0.14 \end{bmatrix} = -2.0 \cdot (-1.78) + (-0.8) \cdot (-0.14) = 3.56 + 0.112 = 3.672 \]
由于 $ (X - \mu_1)^T \Sigma^{-1} (X - \mu_1) = 2.952 $ 小于 $ (X - \mu_2)^T \Sigma^{-1} (X - \mu_2) = 3.672 $,我们有 $ p(X | \omega_1) > p(X | \omega_2) $。因此,样本 $ X = \begin{bmatrix} 1.0 \\ 2.2 \end{bmatrix} $ 应该被分类为 $ \omega_1 $。
最终答案是:
\[ \boxed{\omega_1} \]