自然语言处理之hmm（隐马尔可夫模型）

2022-11-20人工智能63

Part 3 hmm（隐马尔可夫模型）

作为因为科研需要刚开始接触机器学习、深度学习的菜鸟，看了关于某些算法大神的解释仍是似懂非懂，特在此记录学习过程，争取通俗易懂。

为了便于理解，全文以实例贯穿。
假设我们有3个盒子，每个盒子里都有红色和白色两种球，这三个盒子里球的数量分别是：

盒子123红球数547白球数563

按照下面的方法从盒子里抽球，开始的时候，从第一个盒子抽球的概率是0.2，从第二个盒子抽球的概率是0.4，从第三个盒子抽球的概率是0.4。以这个概率抽一次球后，将球放回。然后从当前盒子转移到下一个盒子进行抽球。规则是：如果当前抽球的盒子是第一个盒子，则以0.5的概率仍然留在第一个盒子继续抽球，以0.2的概率去第二个盒子抽球，以0.3的概率去第三个盒子抽球。如果当前抽球的盒子是第二个盒子，则以0.5的概率仍然留在第二个盒子继续抽球，以0.3的概率去第一个盒子抽球，以0.2的概率去第三个盒子抽球。如果当前抽球的盒子是第三个盒子，则以0.5的概率仍然留在第三个盒子继续抽球，以0.2的概率去第一个盒子抽球，以0.3的概率去第二个盒子抽球。

一、基本定义

二、两个重要假设

盒子1盒子2盒子3盒子10.50.20.3盒子20.30.50.2盒子30.20.30.5

a = [ 0.5 0.2 0.3 0.3 0.5 0.2 0.2 0.3 0.5 ] (1) a=\left[ \begin{matrix} 0.5 & 0.2 & 0.3 \ 0.3 & 0.5 & 0.2 \ 0.2 & 0.3 & 0.5 \end{matrix} \right] \tag{1}a =⎣⎡0 .5 0 .3 0 .2 0 .2 0 .5 0 .3 0 .3 0 .2 0 .5 ⎦⎤(1 )

红白盒子10.50.5盒子20.40.6盒子30.70.3

b = [ 0.5 0.5 0.4 0.6 0.7 0.3 ] (2) b=\left[ \begin{matrix} 0.5 & 0.5 \ 0.4 & 0.6 \ 0.7 & 0.3 \end{matrix} \right] \tag{2}b =⎣⎡0 .5 0 .4 0 .7 0 .5 0 .6 0 .3 ⎦⎤(2 )

三、主要解决问题

预测问题，也称为解码问题。即给定模型λ=(A,B,Π)和观测序列O={o1,o2,...oT}，求给定观测序列条件下，最可能出现的对应的状态序列，这个问题的求解需要用到基于动态规划的维特比算法。

四、维特比算法

观察集合是:

V={红，白}，M=2

我们的状态集合是：

Q={盒子1，盒子2，盒子3}，N=3

而观察序列和状态序列的长度为3.

初始状态分布为：
Π = ( 0.2 , 0.4 , 0.4 ) T Π=(0.2,0.4,0.4)^\mathrm{T}Π=(0 .2 ,0 .4 ,0 .4 )T

状态转移概率分布矩阵为：
a = [ 0.5 0.2 0.3 0.3 0.5 0.2 0.2 0.3 0.5 ] (1) a=\left[ \begin{matrix} 0.5 & 0.2 & 0.3 \ 0.3 & 0.5 & 0.2 \ 0.2 & 0.3 & 0.5 \end{matrix} \right] \tag{1}a =⎣⎡0 .5 0 .3 0 .2 0 .2 0 .5 0 .3 0 .3 0 .2 0 .5 ⎦⎤(1 )
观测状态概率矩阵为：
b = [ 0.5 0.5 0.4 0.6 0.7 0.3 ] (2) b=\left[ \begin{matrix} 0.5 & 0.5 \ 0.4 & 0.6 \ 0.7 & 0.3 \end{matrix} \right] \tag{2}b =⎣⎡0 .5 0 .4 0 .7 0 .5 0 .6 0 .3 ⎦⎤(2 )
球的颜色的观测序列:

O={红，白，红}

首先需要得到三个隐藏状态在时刻1时对应的各自两个局部状态，此时观测状态为1：

δ1(1)=π1b1(o1)=0.2×0.5=0.1

δ1(2)=π2b2(o1)=0.4×0.4=0.16

δ1(3)=π3b3(o1)=0.4×0.7=0.28

Ψ1(1)=Ψ1(2)=Ψ1(3)=0

开始递推三个隐藏状态在时刻2时对应的各自两个局部状态，此时观测状态为2：

δ2(1)=max1≤j≤3[δ1(j)aj1]b1(o2)=max1≤j≤3[0.1×0.5,0.16×0.3,0.28×0.2]×0.5=0.028

Ψ2(1)=3

δ2(2)=max1≤j≤3[δ1(j)aj2]b2(o2)=max1≤j≤3[0.1×0.2,0.16×0.5,0.28×0.3]×0.6=0.0504

Ψ2(2)=3

δ2(3)=max1≤j≤3[δ1(j)aj3]b3(o2)=max1≤j≤3[0.1×0.3,0.16×0.2,0.28×0.5]×0.3=0.042

Ψ2(3)=3

继续递推三个隐藏状态在时刻3时对应的各自两个局部状态，此时观测状态为1：

δ3(1)=max1≤j≤3[δ2(j)aj1]b1(o3)=max1≤j≤3[0.028×0.5,0.0504×0.3,0.042×0.2]×0.5=0.00756

Ψ3(1)=2

δ3(2)=max1≤j≤3[δ2(j)aj2]b2(o3)=max1≤j≤3[0.028×0.2,0.0504×0.5,0.042×0.3]×0.4=0.01008

Ψ3(2)=2

δ3(3)=max1≤j≤3[δ2(j)aj3]b3(o3)=max1≤j≤3[0.028×0.3,0.0504×0.2,0.042×0.5]×0.7=0.0147

Ψ3(3)=3

因为δ3(3)最大，所以t=3时是从第三个盒子取出来的
因为Ψ3(3)=3，所以t=2时是从盒子3取出来的
因为Ψ2(3)=3，所以t=1时是从盒子3取出来的

从而得到最终的最可能的隐藏状态序列为：(3,3,3)

以上就是今天学习的内容，本文仅仅简单介绍了hmm算法，下期学习crf算法。

Original: https://blog.csdn.net/ST_xtt/article/details/123893426
Author: ST_xtt
Title: 自然语言处理之hmm（隐马尔可夫模型）

自然语言处理之hmm（隐马尔可夫模型）

一、基本定义

二、两个重要假设

三、主要解决问题

四、维特比算法

猿创征文｜时间序列分析算法之平稳时间序列预测算法和自回归模型(AR)详解+Python代码实现

logistic回归模型—基于R

环境混合物总体效应：加权分位数和回归（WQS）

数学建模学习：岭回归和lasso回归

R 计算均方差MSE(mean squared error)

python数据相关性绘图-散点图正态分布图回归图等及鸢尾花数据集可视化（附Python代码）

基于Lasso回归的实证分析（Python实现代码）

目标检测中边框回归的直观理解 bbox regression

通过R语言实现平稳时间序列的建模–基础（ARMA模型）

【sklearn使用】sklearn中调用R2（回归问题评价指标）的3种方式

【项目实战】Python实现GBDT(梯度提升树)回归模型(GradientBoostingRegressor算法)项目实战

机器学习算法系列（四）- 岭回归算法（Ridge Regression Algorithm）

stata基础–回归，画散点图，异质性分析

机器学习之分类回归树（CART）

机器学习基础：用 Lasso 做特征选择

利用lasso回归建立预测模型并绘制列线图二分类结局资料的lasso回归与列线图绘制

计量经济学笔记6-Eviews操作-自相关的检验与消除（DW、LM检验与FGLS、广义差分变换）

Pytorch：全连接神经网络-MLP回归

机器学习实验——回归预测算法

基于MATLAB的随机森林（RF）回归与变量影响程度（重要性）排序

机器学习算法、Python、数据分析、学习资料 & 面试大汇总（免费送）

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30