【问题标题】:How to perform FST (Finite State Transducer) composition如何执行 FST(有限状态传感器)合成
【发布时间】:2010-04-15 22:40:27
【问题描述】:

考虑以下 FST:

T1 

0 1 a : b
0 2 b : b
2 3 b : b
0 0 a : a
1 3 b : a

T2

0 1 b : a
1 2 b : a
1 1 a : d
1 2 a : c

如何对这两个 FST(即 T1 o T2)执行合成操作 我看到了一些算法,但不太了解。如果有人能以简单的方式解释它,那将是一个很大的帮助。

请注意,这不是家庭作业。该示例取自提供解决方案的演讲幻灯片,但我不知道如何解决。

【问题讨论】:

    标签: nlp finite-automata state-machine


    【解决方案1】:

    由于您没有指定输入格式,我假设 0 是初始状态,出现在第二列但不是第一列的任何整数都是接受状态(T1 为 3,T2 为 2),并且每行是转换关系的一个元素,给出前一个状态、下一个状态、输入字母和输出字母。

    对 FST 的任何操作都需要产生一个新的 FST,因此我们需要状态、输入字母表、输出字母表、初始状态、最终状态和转换关系(下面给出 FST A、B 和 W 的规范按此顺序)。假设我们的 FST 是:

    A = (Q, Σ, Γ, Q0, QF, α)
    B = (P, Γ, Δ, P0, PF, β)

    我们想找到

    W = (R, Σ, Δ, R0, RF, ω) = A ∘ B

    请注意,我们不需要确定 W 的字母;组合的定义就是这样做的。

    想象一下 A 和 B 串联运行,A 的输出磁带作为 B 的输入磁带进给。组合 FST 的状态就是 A 和 B 的组合状态。换句话说,组合的状态是各个 FST 状态的叉积。

    R = Q × P

    在您的示例中,W 的状态将是整数对:

    R = {(0,0), (0,1), ... (3, 2)}

    虽然我们可以重新编号并得到(例如):

    R = {00, 01, 02, 10, 11, 12, 20, 21, 22, 30, 31, 32}

    同样,组合 FST 的初始状态和接受状态是组件 FST 中的叉积。特别是,R 接受一个字符串iff A 和 B 都接受这个字符串。

    R0 = Q0 × P0
    RF = QF × PF

    在示例中,R0 = {00} 和 RF = {32}。

    剩下的就是确定过渡关系ω。为此,将 A 的每个转换规则与 B 可能适用的每个转换规则结合起来。也就是说,将 A (q<sub>i</sub>, σ) → (q<sub>j</sub>, γ) 的每个转换规则与 B 的每个以“γ”作为输入字符的规则组合。

    ω = { ((qi,ph), σ) → ((qj, pk), δ) : (qi, σ) → (qj, γ) ∈ α,
                                         (ph, γ) → (pk, δ) ∈ β}

    在示例中,这意味着将 T1 的 0 1 a : b 与 T2 的 0 1 b : a1 2 b : a 组合(例如)得到:

    00 11 一个:一个 01 12 一个:一个

    同样,您可以将 T1 的 0 2 b : b 与 T2 的 0 1 b : a1 2 b : a、T1 的 0 0 a : a 与 T2 的 1 1 a : d1 2 a : c 等组合起来。

    请注意,您可能有无法到达的状态(那些永远不会作为“下一个”状态出现的状态)和永远不会发生的转换(那些来自无法到达的状态)。作为优化步骤,您可以删除这些状态和转换。但是,将它们留在里面不会影响构造的正确性;这只是一种优化。

    【讨论】:

      【解决方案2】:

      如果您更愿意接受图形解释,以下幻灯片提供了实践中组合算法的增量图形示例,还包括对分量传感器中的 epsilon 转换的讨论。 Epsilon 转换使合成过程复杂化,在这种情况下,outis answer 中描述的算法可能不会生成正确的结果,具体取决于所使用的半环。

      有关一些图形示例,请参见幻灯片 10~35:

      http://www.gavo.t.u-tokyo.ac.jp/~novakj/wfst-algorithms.pdf

      【讨论】:

      • 链接已失效
      【解决方案3】:

      T1 和 T2

      T1和T2的组成

      组合T的状态是T1状态和T2状态的对。 T满足以下条件:

      1. 它的初始状态是T1的初始状态和初始状态的对 T2
      2. 它的最终状态是 T1 的最终状态和 T2 的最终状态的对
      3. 对于从 q1 到 r1 和 T2 从 q2 到 r2 的每对转换 T1,存在从 (q1, q2) 到 (r1, r2) 的转换 t,这样 T1 的输出标签与 T2 的输入标签匹配。转换 T 从 T1 获取输入标签,从 T2 获取输出标签,其权重是 T1 和 T2 的权重的组合,通过相同的操作完成 沿路径组合权重。

      由于没有权重,我们可以忽略这一点。上面是从下面一张漂亮的纸上摘下来的。 Link here

      【讨论】:

        猜你喜欢
        • 2011-05-04
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2011-01-14
        • 2016-08-20
        相关资源
        最近更新 更多