【问题标题】:Processing and understanding sentences处理和理解句子
【发布时间】:2011-07-01 00:15:12
【问题描述】:

我正在尝试编写一个简单的代码,可以处理句子中的单词以形成含义。很长一段时间以来,我一直在尝试开发一个好的算法,但是我尝试这样做,该算法非常复杂且冗长。如果您有一些建议,我将不胜感激。谢谢

【问题讨论】:

  • 简单...处理单词...我在这里看到了一个潜在的问题...
  • 这是一个非常复杂的问题,很多人都在研究它。我不会说不存在一种简单的方法,但我会说,如果它确实存在,那么还没有人找到它。
  • 这很有趣。我期待听到充满人工智能术语的令人沮丧的句子。
  • 你可以问 IBM 他们是怎么做 Watson www-943.ibm.com/innovation/us/watson 但我怀疑他们会给你一个简单的答案。
  • @NullSet:确实你是对的,我仍在尝试很多想法,不过刚刚发布了我当前的解决方案,到目前为止,这似乎适用于大多数情况,因为基础理论解释了很多.我现在的主要问题是生成句子作为回复。

标签: algorithm artificial-intelligence nlp analysis data-analysis


【解决方案1】:

好吧,事实证明算法必须复杂而漫长,因为大脑实际上是复杂而深刻的。我的代码取得了进步,但这并不容易。我的方法是使用一个信息数据库,通过检查每个句子中的每个单词及其含义+关联来进行分析,但无论我多么努力,我发现理解只能是模拟的。例如:

我的口袋里全是虫子。

会被理解为:

Animal Bug 在你的口袋里。

含义:

  • 你有麻烦了
  • 你是个 bug 收集者
  • 你想利用错误来做某事

电子虫在你的口袋里

含义

  • 你的口袋里有虫子
  • 你有一些电子错误

bug 的词数据库(名词)是:

虫子(动物)

  • 定义:昆虫。
  • 属性:宽度:15mm;高度:25mm;颜色:黑色、红色、橙色; 重要性:相对 - 生物学;危险:2;合意度:0;
  • 功能:基础

错误(设备)

  • 定义:电子设备。
  • 属性:宽度:45mm;高度:45mm;颜色:任意;重要性:相对 - 安全性;危险:2;合意度:1
  • 功能:录音

至少可以从上面推导出两个模拟的含义,并且算法进行智能猜测以开始一系列问题以找出确切的含义。

【讨论】:

  • 我所知道的最能说明英语有多难的例子是以下句子:“时间如箭,果蝇如香蕉”。请注意单词“flies”和“like”的语法类别如何根据周围单词的含义而变化。 IOW 在不“知道它的意思”的情况下推断句子的语法并不总是可能的。
  • 哈哈,英语确实很复杂,对人工智能来说是个大难题。甚至还有ROILA——一种专门为机器人设计的语言。我的决心是,就成语而言,解释是相对的,应该由理解处理器根据不同的人记录下来。
【解决方案2】:

您正在讨论自然语言处理 (NLP) 领域。这是一个非常复杂的问题,也是一个积极研究的领域。

可以肯定地说,解析一般英语句子永远不会有简单的方法,更不用说确定意义了。

苏塞克斯大学信息学院有一组在线NLP lectures,可以帮助您了解使这个问题变得如此困难的一些问题。

【讨论】:

  • 是的,我知道这很难。我还研究了它面临的问题。我目前正在阅读语音语言处理,我强烈认为这可以不用像许多人接管它那样大惊小怪地完成。
  • @opatachibueze:我知道你可能强烈地觉得它可以做到,但我想每个人都会更感兴趣听听你为什么认为它可以做到。然后我们都会有一些事情要讨论。
  • 是的,好问题。我认为这是可以做到的,因为我开发算法的方法是基于我在没有自动化的情况下采取的实际步骤。同样,我相信我可以开发一种“软件记忆”,我可以从中关联数据以同时找到目的和意义。我认为的主要任务是找出如何最好地关联数据而不会生气。目的可以通过使用标签/同义词趋势理解上下文来找到,并且可以通过定义目的来创建含义。..
  • @opatachibueze,我相信,如果它低估了我们大脑所采取的先天步骤,这项技术将会失败,我们的大脑在没有意识的情况下高度发展了某些任务。例如我不知道如何从人群中集中注意力;但我仍然可以做到。
  • 您可以根据声音、动作和外观从人群中专注于一个扬声器。这些参数还连接到“相似度”参数。聚焦本身是由你的大脑完成的。您会听到周围的所有声音,但您会过滤掉来自用户的声音,这首先是通过同步声音方向、嘴唇移动和用户演示(如果适用)来识别的。我们的大脑使用在自然界中难以理解的原始能量智能,但我们可以在 PC 上重现它,我只是试图重现处理这个问题的部分:)
猜你喜欢
  • 1970-01-01
  • 2015-05-20
  • 1970-01-01
  • 2011-08-06
  • 2015-04-13
  • 1970-01-01
  • 2014-03-31
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多