从文本数据中解析大小

时间:2011-07-21 14:08:59

标签: parsing nlp text-parsing

我想从文本数据中提取尺寸(“导弹长达五十五英寸。”或“他加权九磅半。”)并将它们转换为程序可用格式的数据。

有什么好办法可以解决这个问题? 有没有有用的图书馆?

这项任务有多复杂?

1 个答案:

答案 0 :(得分:0)

您可以将此视为信息提取(IE)问题。在这种情况下,基本方法是制定一堆正则表达式来近似地描述问题并对其进行细化,直到它们要么足够好或者你不能再得到它们。

或者,您可以您最喜欢的解析器,看看它为您所追求的句子生成了哪种树/依赖结构,找出一般模式,检查它的效果并过滤结果使用正则表达式或返回结构的一些谓词。

相关问题