题目
1.设总体Xsim P(lambda),概率分布为P(X=x)=(lambda^xe^-lambda)/(x!),x=0,1,2...,lambda>0为未知参数,X_(1),X_(2),...,X_(n)是取自总体X的容量为n的样本,求参数lambda的最大似然估计量.
1.设总体$X\sim P(\lambda)$,概率分布为$P(X=x)=\frac{\lambda^{x}e^{-\lambda}}{x!},x=0,1,2\cdots,\lambda>0$为未知参数,$X_{1},X_{2},\cdots,X_{n}$是取自总体X的容量为n的样本,求参数$\lambda$的最大似然估计量.
题目解答
答案
设总体 $X \sim P(\lambda)$,概率分布为 $P(X = x) = \frac{\lambda^x e^{-\lambda}}{x!}$。样本 $X_1, X_2, \cdots, X_n$ 的似然函数为:
$L(\lambda) = \prod_{i=1}^n \frac{\lambda^{X_i} e^{-\lambda}}{X_i!} = \frac{\lambda^{\sum_{i=1}^n X_i} e^{-n\lambda}}{\prod_{i=1}^n X_i!}$
取对数似然函数:
$\ell(\lambda) = \sum_{i=1}^n X_i \ln \lambda - n\lambda - \sum_{i=1}^n \ln(X_i!)$
对 $\lambda$ 求导并令导数为零:
$\frac{d\ell(\lambda)}{d\lambda} = \frac{1}{\lambda} \sum_{i=1}^n X_i - n = 0 \implies \lambda = \frac{1}{n} \sum_{i=1}^n X_i = \bar{X}$
二阶导数为负,确认最大值。
结论: 参数 $\lambda$ 的最大似然估计量为 $\boxed{\bar{X}}$。
解析
本题考查的知识点是参数的最大似然估计法。解题思路如下:
- 首先根据总体的概率分布写出样本的似然函数。因为样本$X_1,X_2,\cdots,X_n$相互独立且都服从总体$X$的分布,所以似然函数$L(\lambda)$是各个样本点概率的乘积。
- 然后对似然函数取对数,得到对数似然函数$\ell(\lambda)$。取对数的目的是为了简化计算,将乘积形式转化为求和形式。
- 接着对对数似然函数求关于参数$\lambda$的导数,并令导数为$0$,解出$\lambda$的值。这个值就是使得似然函数取得最大值的$\lambda$的估计值。
- 最后通过求二阶导数判断该值是否为最大值点。
下面进行详细的计算:
- 求似然函数$L(\lambda)$:
已知总体$X\sim P(\lambda)$,概率分布为$P(X = x)=\frac{\lambda^{x}e^{-\lambda}}{x!},x = 0,1,2,\cdots,\lambda>0$,样本$X_1,X_2,\cdots,X_n$的似然函数为各个样本点概率的乘积,即:
$L(\lambda)=\prod_{i = 1}^{n}P(X_i = x_i)=\prod_{i = 1}^{n}\frac{\lambda^{X_i}e^{-\lambda}}{X_i!}$
根据指数运算法则$a^m\times a^n=a^{m + n}$和$(ab)^n=a^n\times b^n$,可将上式化简为:
$L(\lambda)=\frac{\lambda^{\sum_{i = 1}^{n}X_i}e^{-n\lambda}}{\prod_{i = 1}^{n}X_i!}$ - 求对数似然函数$\ell(\lambda)$:
对似然函数$L(\lambda)$取自然对数,根据对数运算法则$\ln(ab)=\ln a+\ln b$,$\ln\frac{a}{b}=\ln a-\ln b$,$\ln a^b = b\ln a$可得:
$\ell(\lambda)=\ln L(\lambda)=\ln\left(\frac{\lambda^{\sum_{i = 1}^{n}X_i}e^{-n\lambda}}{\prod_{i = 1}^{n}X_i!}\right)=\sum_{i = 1}^{n}X_i\ln\lambda - n\lambda-\sum_{i = 1}^{n}\ln(X_i!)$ - 求$\lambda$的估计值:
对对数似然函数$\ell(\lambda)$求关于$\lambda$的导数:
$\frac{d\ell(\lambda)}{d\lambda}=\frac{d}{d\lambda}\left(\sum_{i = 1}^{n}X_i\ln\lambda - n\lambda-\sum_{i = 1}^{n}\ln(X_i!)\right)$
因为$\sum_{i = 1}^{n}\ln(X_i!)$与$\lambda$无关,其导数为$0$,$\frac{d}{d\lambda}(\ln\lambda)=\frac{1}{\lambda}$,$\frac{d}{d\lambda}(n\lambda)=n$,所以:
$\frac{d\ell(\lambda)}{d\lambda}=\frac{1}{\lambda}\sum_{i = 1}^{n}X_i - n$
令$\frac{d\ell(\lambda)}{d\lambda}=0$,即$\frac{1}{\lambda}\sum_{i = 1}^{n}X_i - n = 0$,移项可得:
$\frac{1}{\lambda}\sum_{i = 1}^{n}X_i = n$
两边同时乘以$\lambda$得到:
$\sum_{i = 1}^{n}X_i = n\lambda$
解得$\lambda=\frac{1}{n}\sum_{i = 1}^{n}X_i=\overline{X}$,其中$\overline{X}$为样本均值。 - 判断最大值点:
对$\frac{d\ell(\lambda)}{d\lambda}$再求关于$\lambda$的导数,即求二阶导数:
$\frac{d^2\ell(\lambda)}{d\lambda^2}=\frac{d}{d\lambda}\left(\frac{1}{\lambda}\sum_{i = 1}^{n}X_i - n\right)=-\frac{1}{\lambda^2}\sum_{i = 1}^{n}X_i$
因为$\lambda>0$,$\sum_{i = 1}^{n}X_i>0$,所以$\frac{d^2\ell(\lambda)}{d\lambda^2}<0$,这说明当$\lambda = \overline{X}$时,对数似然函数$\ell(\lambda)$取得最大值,即似然函数$L(\lambda)$取得最大值。