斯坦福依赖解析器无法处理一些中文句子

时间:2012-04-27 03:08:58

标签: parsing dependencies nlp stanford-nlp

我正在解析一组中文句子。通常斯坦福解析器运行良好,但

  1. 在特殊情况下,例如'柴油机可燃混合气的形成和燃烧都是直接在燃烧室内进行的。' '在日常行驶中肯定不可能保持燃油量的多少,乘客的胖瘦,直接影响到前后轴的配重问题。'。它们格式正确,但NullPointerException在行' List tdl = gs .typedDependenciesCCprocessed();',从Demo.java复制。

  2. 我注意到即使程序运行正常,依赖解析的输出也会遗漏某些东西,比如说'[advmod(传统-3,这种-2),amod(范畴-6,传统-3) ),nn(范畴-6,油门-4),nn(范畴-6,应用-5),dep(限制-8,受到-7),root(ROOT-0,限制-8),dep(精确性) -11,缺乏-10),conj_并(限制-8,精确性-11),nn(形势-18,汽车电子技术-16),nn(形势-18,发展-17),num(电子油门-23,一-21),dep(一-21,种-22),dep(egas-25,( - 24),dep(电子油门-23,egas-25),dep(egas-25,) - 26)]',可以看出没有' -1',' -9',' -12',' -13& #39;,' -14',' -15',' 19'在依赖项解析结果中。相应的原始句子是'但这种传统油门应用范畴受到限制并缺乏精确性,在日新月异的汽车电子技术发展形势下,一种电子油门(egas)应运而生。',if你需要。

  3. 如何修复它们。感谢。

0 个答案:

没有答案