条件随机场

条件随机场(CRF)是2001年由Lafferty等人提出的,它结合了最大熵模型和隐马尔可夫模型(HMM)的优点,用于序列标注任务如分词、词性标注和命名实体识别。CRF是一种无向图模型,假设输出随机变量构成马尔可夫随机场。与HMM相比,CRF在处理序列数据时能更好地考虑全局信息。HMM的三个基本问题是预测、平滑和解码,分别对应不同的算法。CRF则在这些任务上提供了更优的解决方案。

条件随机场((conditional random field,简称CRF))



前言

条件随机场(CRF)由Lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。


一、CRF是什么?

条件随机场是条件概率分布模型 P(Y|X) ,表示的是给定一组输入随机变量 X 的条件下另一组输出随机变量 Y 的马尔可夫随机场,也就是说 CRF 的特点是假设输出随机变量构成马尔可夫随机场。条件随机场可被看作是最大熵马尔可夫模型在标注问题上的推广。

二、隐马尔可夫模型

隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。

HMM有三个典型(canonical)问题:
1、预测(filter):已知模型参数和某一特定输出序列,求最后时刻各个隐含状态的概率分布,通常使用前向算法解决.。
2、平滑(smoothing):已知模型参数和某一特定输出序列,求中间时刻各个隐含状态的概率分布, 通常使用forward-backward 算法解决。
3、解码(most likely explanation): 已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列,通常使用Viterbi算法解决。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值