专利内容由知识产权出版社提供
专利名称:一种基于依存连贯性约束的双语词语自动对齐方法专利类型:发明专利发明人:宗成庆,王志国申请号:CN201210175015.2申请日:20120530公开号:CN102708098A公开日:20121003
摘要:本发明公开了一种基于依存连贯性约束的双语词对齐方法。该方法首先对训练句子对进行依存句法分析。在训练阶段,利用训练句子对和依存句法树,训练基于源语言端和目标语言端依存连贯性约束的词对齐模型。在测试阶段,利用基于源语言端和目标语言端依存连贯性约束的词对齐模型为测试句子对产生满足源语言端和目标语言端依存连贯性约束的词对齐结果,并将这两个词对齐结果进行合并,产生一个兼顾准确率和召回率的满足双语依存连贯性约束的词对齐结果。本发明相对于现有技术得到的词对齐错误率较低。
申请人:中国科学院自动化研究所
地址:100190 北京市海淀区中关村东路95号
国籍:CN
代理机构:中科专利商标代理有限责任公司
代理人:宋焰琴
更多信息请下载全文后查看