<progress id="blzj5"></progress>
<menuitem id="blzj5"><del id="blzj5"><address id="blzj5"></address></del></menuitem><thead id="blzj5"></thead>
<menuitem id="blzj5"><dl id="blzj5"></dl></menuitem>
<thead id="blzj5"><dl id="blzj5"></dl></thead>
<var id="blzj5"><dl id="blzj5"></dl></var>
<listing id="blzj5"><dl id="blzj5"><noframes id="blzj5">
<thead id="blzj5"><dl id="blzj5"></dl></thead><listing id="blzj5"></listing><listing id="blzj5"></listing>
<menuitem id="blzj5"></menuitem>
<ins id="blzj5"></ins>
<thead id="blzj5"><del id="blzj5"><th id="blzj5"></th></del></thead><listing id="blzj5"></listing>
<thead id="blzj5"></thead>
基于CRF模型的維吾爾語分詞研究
Uygur Word Segmentation Based on Conditional Random Fields Model
投稿時間:2019-03-23  修訂日期:2019-03-23
DOI:
中文關鍵詞: 條件隨機場  維吾爾語分詞  特征模板  分詞模型  分步實驗
英文關鍵詞: conditional random fields  Uyghur word segmentation  feature template  segmentation model  test
基金項目:國家自然科學基金項目(面上項目,重點項目,重大項目)
作者單位E-mail
李成華 中南民族大學 電子信息工程學院 mdlich@mail.scuec.edu.cn 
孫雅婧 中南民族大學 電子信息工程學院 14170651@qq.com 
張世娟 中南民族大學 電子信息工程學院  
艾提日也古麗?艾尼瓦爾 中南民族大學 教育學院  
摘要點擊次數: 193
全文下載次數: 0
中文摘要:
      條件隨機場(CRF,Conditional random fields)能夠很好地處理序列標注問題。引入條件隨機場進行維吾爾語分詞方法研究,主要包括制定詞性和分詞單獨標注與一體化標注標記集并建成語料庫;設計不同特征模板進行訓練測試,反復比較實驗結果,總結優化以獲取最佳的特征模板。本文在設計特征模板時充分了結合維吾爾語語言形態特征,采用了對稱特征組合非對稱特征的設計方法,將獲得的最佳分詞模板應用到分步預測詞性和分詞實驗中,得到最佳分詞準確率、召回率、F 值分別為90.28%、88.81%、89.54%的實驗結果。相比單獨分詞標注,分詞時加入詞性特征列進行分詞與詞性一體化標注能取得更好的分詞性能。
英文摘要:
      CRF (Conditional random fields), a word segmentation algorithm is introduced to handle sequence labeling problems. The main tasks include the formulation of the corresponding tag sets, part of speech tagging and integrated tagging. Furthermore, this paper focuses on the design of feature templates fully combined with the morphological features of Uyghur language and asymmetric features, which are applied to building corresponding segmentation models. The experiments are carried out repeatedly using different templates in order to obtain the best one. Ultimately, the accuracy, the recall and the F value of the test are 90.28%, 88.81% and 89.54% respectively. Compared with the separate word segmentation, the participle feature column used for word segmentation performs better.
View Fulltext   查看/發表評論  下載PDF閱讀器
關閉
秒速赛车开奖查询结果