【发布时间】:2011-07-21 14:08:59
【问题描述】:
我想从文本数据(“导弹长五十五英寸。”或“他重九磅半。”)中提取尺寸,并将它们转换为程序可用格式的数据。
有什么好的方法来解决这个问题? 有什么有用的库吗?
这个任务有多复杂?
【问题讨论】:
标签: parsing nlp text-parsing
我想从文本数据(“导弹长五十五英寸。”或“他重九磅半。”)中提取尺寸,并将它们转换为程序可用格式的数据。
有什么好的方法来解决这个问题? 有什么有用的库吗?
这个任务有多复杂?
【问题讨论】:
标签: parsing nlp text-parsing
您可以将此视为信息提取 (IE) 问题。在这种情况下,基本方法是制定一堆正则表达式来大致描述问题并对其进行细化,直到它们足够好或者您无法再进一步。
或者,您可以您最喜欢的解析器并查看它为您所追求的句子生成什么样的树/依赖结构,找出一般模式,检查它的表现如何,也许还可以过滤带有正则表达式或返回结构上的某些谓词的结果。
【讨论】: