crf++是一款非常常用的變成開源工具,主要用于文本標(biāo)注、分詞等等,用戶可以非常輕松的的完成各種變成任務(wù)。目前,crf++是國(guó)內(nèi)最實(shí)用的一款軟件,深受廣大程序員們的喜愛。還在等什么!快來(lái)旋風(fēng)軟件園下載吧!
doc文件夾:就是官方主頁(yè)的內(nèi)容
example文件夾:有四個(gè)任務(wù)的訓(xùn)練數(shù)據(jù)(test.data)、測(cè)試數(shù)據(jù)(train.data)和模板文件(template),還有一個(gè)執(zhí)行腳本文件exec.sh。
libcrffpp.dll:訓(xùn)練程序和測(cè)試程序需要使用的靜態(tài)鏈接庫(kù)。
clr_learn.exe:crf++的訓(xùn)練程序
crl_test.exe:crf++的測(cè)試程序
sdk文件夾:crf++的頭文件和靜態(tài)鏈接庫(kù)。
條件隨機(jī)場(chǎng)(crf)由lafferty等人于2001年提出,結(jié)合了最大熵模型和隱馬爾可夫模型的特點(diǎn),是一種無(wú)向圖模型,近年來(lái)在分詞、詞性標(biāo)注和命名實(shí)體識(shí)別等序列標(biāo)注任務(wù)中取得了很好的效果。條件隨機(jī)場(chǎng)是一個(gè)典型的判別式模型,其聯(lián)合概率可以寫成若干勢(shì)函數(shù)聯(lián)乘的形式,其中最常用的是線性鏈條件隨機(jī)場(chǎng)。若讓x=(x1,x2,…xn)表示被觀察的輸入數(shù)據(jù)序列,y=(y1,y2,…yn)表示一個(gè)狀態(tài)序列,在給定一個(gè)輸入序列的情況下,線性鏈的crf模型定義狀態(tài)序列的聯(lián)合條件概率為
p(y|x)=exp{} (2-14)
z(x)={} (2-15)
其中:z是以觀察序列x為條件的概率歸一化因子;fj(yi-1,yi,x,i)是一個(gè)任意的特征函數(shù);是每個(gè)特征函數(shù)的權(quán)值。
1、解壓后將crf_learn.exe crf_test.exe libcrfpp.dll文件復(fù)制到example文件夾的任意文件夾下
2、打開cmd命令行模式cd到1中目錄。
3、輸入指令crf_learn template train.data model即可生成model文件
MD5:406ba91db908a1151ca4957c51320d3b
大?。?66.00M / 版本:v0.58 官方版
大?。?3.35M / 版本:v0.58 官方版
大?。?8.17M / 版本:v0.58 官方版
大?。?.84M / 版本:v0.58 官方版
大小:34.58M / 版本:v0.58 官方版
大?。?.03M / 版本:v0.58 官方版
大小:891.00M / 版本:v0.58 官方版
大?。?0.40M / 版本:v0.58 官方版
大?。?6.56M / 版本:v0.58 官方版
大?。?27.69M / 版本:v0.58 官方版
大?。?66.78M / 版本:v0.58 官方版
大?。?.48M / 版本:v0.58 官方版