最大后验估计

如果我们没有理由偏爱的某个值，即若先验密度是扁平的，则后验将于似然f(X

theta)有同样的形式，并且MAP估计将等价于最大似然估计。

MAP估计器是比ML估计起更深层次的估计：a）ML估计起基于贝叶斯范式的极端，忽略了先验信息； b）ML估计器仅仅依赖于观测模型，因而可能导致非唯一解为了加强唯一性和稳定性，先验必须被合并到估计器的规划中，这正是MAP估计起要做的。

例子（重点）：

假设有五个袋子，各袋中都有无限量的饼干(樱桃口味或柠檬口味)，已知五个袋子中两种口味的比例分别是：樱桃100%；樱桃75% + 柠檬25%；樱桃50% + 柠檬50%；樱桃25% + 柠檬75%；柠檬100%；

问从同一个袋子中连续拿到2个柠檬饼干，那么这个袋子最有可能是上述五个的哪一个？

使用极大似然估计解：假设从袋子中能拿出柠檬饼干的概率为p，其中的参数对应着袋子，则似然函数可写作：p( 两个柠檬饼干

袋子 ) = p*p，而p的取值是一个离散值，即上面描述中的0,25%，50%，75%，1；我们只需要评估一下这五个值哪个值使得似然函数最大即可，得到为袋子5。这里便是最大似然估计的结果。

拓展：最大似然估计有一个问题，就是没有考虑到模型本身的概率分布，下面我们扩展这个饼干的问题。假设拿到袋子1或5的机率都是0.1，拿到2或4的机率都是0.2，拿到3的机率是0.4，那同样上述问题的答案呢？这个时候就变MAP了。

我们根据公式，MAP函数则可写成（pp）g，p的取值分别为0,25%，50%，75%，1，g的取值分别为0.1，0.2,0.4,0.2,0.1.分别计算出MAP函数的结果为：0,0.0125,0.125,0.28125,0.1。则结果为第4个袋子。

cjmcv