【发布时间】:2012-09-21 18:38:43
【问题描述】:
我需要一些关于 NLP 的解释。是否可以使用 PHP cURL 和 DOM Parser 从非结构化的 html 内容中提取数据,形成结构化的内容,然后将内容保存到数据库中,这算是 NLP 的一种形式吗?任何解释都将不胜感激。
【问题讨论】:
我需要一些关于 NLP 的解释。是否可以使用 PHP cURL 和 DOM Parser 从非结构化的 html 内容中提取数据,形成结构化的内容,然后将内容保存到数据库中,这算是 NLP 的一种形式吗?任何解释都将不胜感激。
【问题讨论】:
没有。 NLP 是描述试图分析和理解自然语言的技术的术语。换言之,NLP 仅适用于您真正尝试理解所说的内容。
【讨论】:
不是——NLP的意思是自然语言处理。你说的任务是纯编程任务,与NLP无关。 XML 是一种已知格式,您需要编写一个 XML 解析器才能从 XML 中读取数据并将其格式化为用户所需的数据库数据类型。
从高层次的角度来看,NLP 是关于编写一个可以理解任何人类语言(如英语或法语)并以所需格式存储数据的解析器,然后进一步将这些数据用于任何目的。
假设有一条消息“打开画廊”。您的 NLP 解析器可以解析该语句并且可以发现 open 是一个动词,而那是一个名词。 NLP的这个NLP任务称为词性(POS)标注。
任何可以以编程方式使用自然语言的任务都称为 NLP。
【讨论】: