Skip to content

ch3 参数估计

预备知识与记号

对于某个事物分为两类(a state of nature)ω1,ω2

对于其特征x(feature vector),其类条件概率密度/似然(class-conditional density / likelihood)为p(x|ω1),p(x|ω2)

p(x)称之为证据(evidence probability)

先验概率(prior probability)p(ω1),p(ω2)

后验概率(posterior probability)p(ω1|x),p(ω2|x)

对于独立同分布的一组变量

D={D1,D2,...,Dn}

容易计算先验概率为

P(ωj)=|Dj|i=1n|Di|

对于类条件概率分布:

  1. p(x|ωj)有参数形式
  2. p(x|ωj)没有参数形式(下一章内容)

p(x|ωj)有参数形式

比如服从高斯分布

p(x|ωj)N(μj,Σj)

目标

alt text

p(x|ωj)p(x|θj)

通过Dj来估计θj,其中

θj=(θ1,θ2,...,θm)T

概率与似然

概率:描述了参数已知时的随机变量的输出结果

似然:用来描述已知随机变量输出结果时,未知参数的可能取值。通过证据,对参数进行推断

最大似然估计:得到最可能的参数的过程。

极大似然估计

从特殊到一般,针对多次实验,用x1,x2,,xN描述实验结果,因为实现之间都是独立的,所以似然函数可以写成

L(θ)=i=1Np(xi|θ)

此时我们的目标就是

θ^=\argmaxθL(θ)

通常使用对数似然函数

LL(θ)=logL(θ)=i=1Nlogp(xi|θ)

目标转化为

θ^=\argmaxθLL(θ)

因为每个类都是独立的,所以从现在开始省略下标。

极大似然(ML)准则

D={x1,x2,,xn}

根据独立性假设,我们有:

p(D|θ)=p(x1|θ)p(x2|θ)p(xn|θ)

似然函数

L(θ|D)=p(D|θ)=k=1np(xk|θ)

极大似然估计

θ^=argmaxθL(θ|D)

经常转为对数似然

θ^=argmaxθlnL(θ|D)

计算极值

θ=(θ1,θ2,,θn)Tθf=0

正态分布的极大似然估计

  1. 情况1:均值未知,方差已知
  2. 情况2:均值未知,方差未知

情况1:均值未知,方差已知

推导可得到高斯分布的均值的极大似然估计为样本均值。

情况2:均值未知,方差未知

推导可得到高斯分布的均值的极大似然估计为样本均值,方差的极大似然估计为有偏样本方差,(n1)/n倍的样本方差。

贝叶斯估计

每个类独立的前提下,可以得出

P(x|ωi,D)=P(x|ωi,Di)P(ωi|D)=P(ωi)

问题公式化

P(ωi|x,D)=P(x|ωi,Di)P(ωi)j=1cP(x|ωj,Dj)P(ωj)

(了解即可,我们这边考试不考)