如何在 Microsoft.Speech 中使用 DTMFRecognitionEngine 类答案

【问题标题】：How to use the DTMFRecognitionEngine class in Microsoft.Speech如何在 Microsoft.Speech 中使用 DTMFRecognitionEngine 类
【发布时间】：2016-02-24 19:53:09
【问题描述】：

Microsoft.Speech SDK 有一个 DTMFRecognitionEngine 类，我想尝试一下 - 我们需要在 WAV 文件中检测 DTMF 音调（我知道还有其他方法可以做到这一点，但我正在评估所有可能的方法）。

文档并不清楚如何实际使用该类：它的伴侣类SpeechRecognitionEngine 有很多示例和清晰的方法，例如SetInputToWaveFile。 DTMFRecognitionEngine 没有这样的方法。

有人可以提供有关如何在我自己的代码中使用此组件的见解吗？

编辑：似乎没有任何方法可以将这个类用于......好吧，真的。我正在寻找一个库，它允许我检测音频文件中 DTMF 数字的位置和持续时间。我查看了TapiEx，但他们没有回复电子邮件。如果有人有任何其他建议，他们将不胜感激......

【问题讨论】：

... 并且，立即对“过于宽泛”投了赞成票。鉴于实际文档本身并没有提供太多线索，我不确定如何使问题变得“更窄”？看来我不是唯一一个：codeproject.com/Questions/423912/How-to-detect-a-DTMF-sound
我认为困难的部分只是直接询问源示例。也许有一种方法可以改写这个问题，你可以让它不那么像"Someone please give me code"，更像"Could someone provide insight on how this part works?"
不幸的是，这种社区审查系统可以保留那些可能不会再看线程的人的密切投票。如果它被关闭，并且进行了此编辑，我认为它应该会通过并且您应该能够重新打开它。此外，当您在这方面工作时，您编辑和添加的细节越多越好。使用这种奇特的 API/文档可能很难在这个问题上找到帮助——但祝你好运！

标签： c# .net dtmf

【解决方案1】：

这似乎是不可能的。我什至得到了 DtmfRecognitionEngine 的私有 _engine，它是 SpeechRecognitionEngine 的包装器，并没有运气调用它的 SetInputToWaveFile。显然，将音调输入 DtmfRecognitionEngine 的唯一方法是调用 AddTone()。我已经包含了一个示例语法文件和一些您可以使用的源代码。有趣的是，如果您取消注释 dre.AddTone()，您会看到 sre 的事件和 dre 的事件都被触发了。

将调用切换到 sre.RecognizeAsync() 没有帮助。

看来您需要一个不同的库...

PinGrammar.xml

<?xml version="1.0"?>
<grammar mode="dtmf" version="1.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://www.w3.org/2001/06/grammar 
                             http://www.w3.org/TR/speech-grammar/grammar.xsd"
         xmlns="http://www.w3.org/2001/06/grammar"
         root="pin">

  <rule id="digit">
    <one-of>
      <item> 0 </item>
      <item> 1 </item>
      <item> 2 </item>
      <item> 3 </item>
      <item> 4 </item>
      <item> 5 </item>
      <item> 6 </item>
      <item> 7 </item>
      <item> 8 </item>
      <item> 9 </item>
    </one-of>
  </rule>

  <rule id="pin" scope="public">
    <one-of>
      <item>
        <item repeat="4">
          <ruleref uri="#digit"/>
        </item>
        #
      </item>
      <item>
        * 9
      </item>
    </one-of>
  </rule>

</grammar>

来源：

using Microsoft.Speech.Recognition;
using System.Reflection;

namespace DTMF_Recognition
{
    class Program
    {
        static void Main(string[] args)
        {
            Grammar grammar = null;
            grammar = new Grammar("PinGrammar.xml");

            DtmfRecognitionEngine dre = new DtmfRecognitionEngine();
            dre.DtmfRecognized += dre_DtmfRecognized;

            FieldInfo field = typeof(DtmfRecognitionEngine).GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
            var wrapper = field.GetValue(dre);
            FieldInfo engineField = wrapper.GetType().GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
            SpeechRecognitionEngine sre = (SpeechRecognitionEngine)engineField.GetValue(wrapper);

            dre.DtmfHypothesized += dre_DtmfHypothesized;
            dre.DtmfRecognitionRejected += dre_DtmfRecognitionRejected;
            dre.RecognizeCompleted += dre_RecognizeCompleted;
            dre.LoadGrammar(grammar);

            //dre.AddTone(DtmfTone.One);
            //dre.AddTone(DtmfTone.Two);
            //dre.AddTone(DtmfTone.Three);
            //dre.AddTone(DtmfTone.Four);
            //dre.AddTone(DtmfTone.Hash);

            sre.SetInputToWaveFile(@"C:\Users\Clay Ver Valen\Desktop\3.wav");
            sre.SpeechHypothesized += sre_SpeechHypothesized;
            sre.SpeechDetected += sre_SpeechDetected;
            sre.SpeechRecognitionRejected += sre_SpeechRecognitionRejected;

            dre.RecognizeAsync();
            System.Threading.Thread.Sleep(30000);
        }

        static void sre_SpeechRecognitionRejected(object sender, SpeechRecognitionRejectedEventArgs e)
        {
            int i = 1;
        }

        static void sre_SpeechHypothesized(object sender, SpeechHypothesizedEventArgs e)
        {
            int i = 1;
        }

        static void sre_SpeechDetected(object sender, SpeechDetectedEventArgs e)
        {
            int i = 1;
        }

        static void dre_DtmfRecognitionRejected(object sender, DtmfRecognitionRejectedEventArgs e)
        {
            int i = 1;
        }

        static void dre_DtmfHypothesized(object sender, DtmfHypothesizedEventArgs e)
        {
            int i = 1;
        }

        static void dre_RecognizeCompleted(object sender, DtmfRecognizeCompletedEventArgs e)
        {
            int i = 1;
        }

        static void dre_DtmfRecognized(object sender, DtmfRecognizedEventArgs e)
        {
            int i = 1;
        }
    }
}

【讨论】：

您需要自己的带有 DTMF 音调的 WAV 文件，不过我想您已经拥有了……
我担心会是这样。我查看了 TapiEx 的组件，但他们没有回复让我担心的电子邮件......我将更新原始问题：任何人都可以建议一个可以检测 DTMF 音调的库（以删除它们，所以我需要准确的位置和持续时间）？