有限自动机需要正则表达式：偶数个 1 和偶数个 0答案

【问题标题】：Need Regular Expression for Finite Automata: Even number of 1s and Even number of 0s有限自动机需要正则表达式：偶数个 1 和偶数个 0
【发布时间】：2013-06-29 12:15:01
【问题描述】：

我的问题对你来说可能听起来不一样。

我是初学者，我正在学习有限自动机。我正在互联网上搜索下面给定机器有限自动机的正则表达式。

谁能帮我写一下上面机器的“有限自动机的正则表达式”

任何帮助将不胜感激

【问题讨论】：

试试雅顿的 Therm。这个答案可能对您有所帮助：How to write regular expression for a DFA
@GrijeshChauhan。感谢您的链接。因为我是新手，很难理解。 :(
我只为新手精心编写 :) 尝试使用 Arden 的 Therm。实际上为您的 DFA 编写 RE 直接有点典型。（即使使用 Arden 的热解决方案也会很长）
感谢您的宝贵支持。我已经尝试了很多，我只看到了你的帖子。但是因为我无法解决这个问题，所以我在这里发帖。仍在等待解决方案:(

标签： regular-language finite-automata computation-theory dfa

【解决方案1】：

如何使用 Arden 定理为 DFA 编写正则表达式

我们用Σ = {a, b}代替语言符号0,1，下面是新的DFA。

注意开始状态是Q₀

你还没有给出，但在我的回答中，初始状态是 Q₀，最终状态也是 Q₀。

DFA 接受的语言是由符号 a 和 b 组成的所有字符串的集合，其中符号的数量 a 和 b 是偶数（包括Λ）。

一些示例字符串是{Λ, aa, bb, abba, babbab }，没有符号出现的顺序和模式的限制，只是两者都应该是偶数次。
注意：Λ 是允许的，因为 numberOf(a) 和 numberOf(b) 为零，即偶数。

正如我在直线回答中所说：How to write regular expression for a DFA 每个州都存储一些信息。以下是上述 DFA 中每个状态存储的信息。

Q₀：偶数a和偶数b
Q₁：a的奇数和b的偶数
Q₂：奇数a和奇数b
Q₃：偶数个a和奇数个b

（您可以通过更改最终状态集来为更有趣的语言制作 DFA）
_{应该阅读划线的答案，因为我在两个答案中都为 DFA 罚款 RE 的方法不一样}

什么是正则表达式？
该方法在下面使用Arden's Theorem 进行解释，适用于转换图，其中有一个单一的开始状态并且没有定义空移动（我们的 DFA 就是这种形式）。该技术在一本书中进行了解释：Formal Languages And Automata Theory

记住4.2 ARDEN THEOREM：

让B 和C 是Σ 上的两个正则表达式。如果C 不包含Λ，那么对于方程A = B + AC 有一个唯一的（唯一一个）解A = BC*。

[解决方案]：

Step-1：写初始方程，一个方程对应DFA中的每个状态。这个等式表示如何一步达到一个状态

所以根据我们的 DFA，以下 4 个方程是可能的：

Q₀ = Λ + Q₁a + Q₃b

Q₁ = Q₀a + Q₂b

Q₂ = Q₁b + Q₃a

Q₃ = Q₀b + Q₂a

在等式（1）中，额外的Λ 是因为Q₀ 是初始状态，无需任何输入（起点）即可到达。因为 Q₀ 也只是一个最终状态，所以由 a, b 组成的字符串如果以 Q₀ 结尾是可以接受的。 Q₀ 的值将为我们提供所需的正则表达式，因此我们的目标是根据 a, b 来简化等式-(1)。

第 2 步： 使用来自其他方程的状态值并使用 Arden 的简化方程来简化方程。

让我们首先取方程-(4) 并从方程-(3) 中替换 Q₂ 的值。

Q₃ = Q₀b + Q₂a
Q₃ = Q₀b + (Q₁b + Q₃a) a
Q₃ = Q₀b + Q₁ba + Q₃aa

最后一个方程可以用雅顿方程A = B + AC的形式来查看。其中 A 是 Q₃，B = Q₀b + Q₁ba 和 C = aa。所以根据 Arden 的 therm，方程 Q₃ = Q₀b + Q₁ba + Q₃aa 有一个独特的解决方案是：

Q₃ = (Q₀b + Q₁ba)(aa)*

或者可以这样写：

5.Q₃ = Q₀b(aa)* + Q₁ba(aa)*

从逻辑上讲，您可以检查/理解 eq-(5) 意味着 Q₃ 可以通过在 Q_{0 上应用 b 以两种方式 (+) 获得sub> 然后在 Q₃ 上有一个带有标签 aa 的循环，第二种方法是从 Q₁ 应用 ba。}

类似的方法，我们可以化简方程-(2)

Q₁ = Q₀a + Q₂b
Q₁ = Q₀a + (Q₁b + Q₃a)b
Q₁ = Q₀a + Q₁bb + Q₃ab

在此处使用 Arden 的简化规则。

Q₁ = (Q₀a + Q₃ab)(bb)*

进一步简化

6.Q₁ = Q₀a(bb)* + Q₃ab(bb)*

现在 Q₃ 的值从方程-(5) 到方程-(6)

Q₁ = Q₀a(bb)* + (Q₀b(aa)* + Q_{1ba(aa)* )ab(bb)*

Q₁ = Q₀a(bb)* + Q₀b(aa)* ab(bb)* + Q₁ba(aa)* ab(bb)*}

再次使用 Arden 简化定律改进最后一个方程。

Q₁ = (Q₀a(bb)* + Q₀b(aa)* ab(bb)* ) ( ba(aa)* ab(bb)* )*

采取Q₀骗子：

7.Q₁ = Q₀(a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab (bb)* )*

你能理解这个方程，它是如何从状态 Q₀ 到 Q₁ 的？我们将这个解记为方程-(7)

如上所述，我们可以根据状态 Q₀ 和 a, b 来评估 Q₁ 的值，同样我们要评估值对于状态 Q₃。为此，我们可以简单地将方程-(5) 中的状态值 Q₁ 放入方程-(7)。

5.Q₃ = Q₀b(aa)* + Q₁ba(aa)*
@987654367 @ Q₃ = Q₀b(aa)* + Q₀(a(bb)* + b(aa)* ab(bb )* ) (ba(aa)* ab(bb)* )* ba(aa)*
8. Q₃ = Q₀ ( b(aa )* + (a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* ba(aa)* )

现在，在方程编号 (1) 中，从方程编号 (8) 和 (7) 接受状态 Q₃ 和 Q₁ 的值。

Q₀ = Λ + Q₁a + Q₃b
Q₀ = Λ + Q₀(a(bb)* + (aa)* ab(bb)* ) (ba(aa)* ab(bb) * )* a + Q₀ ( b(aa)* + (a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* ba(aa)* ) b

现在，上次应用 Arden 解决方案以符号 a 和 b 的形式找到状态 Q₀ 的值。

Q₀ = Λ + ( (a(bb)* + (aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* a + ( b(aa)* + (a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* ba(aa)* ) b )*

这与（我们可以在这里丢弃Λ）RE：

( (a(bb)* + (aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* a + ( b(aa)* + (a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* ba(aa)* ) b )*

这就是您要寻找的 RE。

我不确定它是否可以进一步简化。我把它留给你作为练习。

在链接的问题中，我提出了一种非形式化的分析方法，但很难为这个 DFA 应用和找到 RE，这个问题展示了 Arden 定理的力量和逐步解决方案。

编辑：

我之前的正则表达式是正确的，但是因为不对称的形式很难葡萄。下面我正在写更对称的新形式的 RE。

我们有方程-(5)、(6)如下：

5. Q₃ = Q₀b(aa)* + Q₁ba(aa)*
@987654376 @Q₁ = Q₀a(bb)* + Q₃ab(bb)*

两者结构对称且易于学习。（在上面的 eq-(5) 之后阅读我的评论）

为了根据 Q₀ 评估状态 Q₁ 的值，我将方程-(5) 中的 Q₃ 的值放入等式-(6) 给我等式-(7) 如下：

7. Q₁ = Q₀(a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab (bb)* )*

类似地，要根据 Q₀ 来评估状态 Q₃ 的值，我们可以将 Q₁ 的值从方程-( 6) 将方程-(5) 转化为方程-(8) 的新形式，如下所示：

Q₃ = Q₀b(aa)* + Q₁ba(aa)*
Q₃ = Q₀b(aa)* + (Q₀a(bb)* + Q₃ ab(bb)* ) ba(aa)*
Q₃ = Q₀b(aa)* + Q₀a(bb)* ba(aa)* + Q₃ab(bb)* ba(aa)*

现在，我们可以得到所需形式的方程-(8)：

8.Q₃ = Q₀(b(aa)* + a(bb)* ba(aa)* )(ab(bb)* ba (aa)* )*

现在，我们有方程-(1)、(7)、(8)：

1. Q₀ = Λ + Q₁a + Q₃b
7. Q₁ = Q₀(a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )*
8. Q₃ = Q₀(b(aa)* + a(bb)* ba(aa)* ) (ab(bb)* ba(aa) * )*

现在，我们可以得到所需形式的方程-(8)：

8.Q₃ = Q₀(b(aa)* + a(bb)* ba(aa)* )(ab(bb)* ba (aa)* )*

现在，我们有方程-(1)、(7)、(8)：

1. Q₀ = Λ + Q₁a + Q₃b
7. Q₁ = Q₀(a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )*
8. Q₃ = Q₀(b(aa)* + a(bb)* ba(aa)* ) (ab(bb)* ba(aa) * )*

现在将状态 Q₁ 和 Q₃ 的值代入方程-(1)：

Q₀ = Λ + Q₀(a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* a + Q₀(b(aa)* + a(bb)* ba(aa)* ) (ab(bb)* ba(aa)* )* b

也可以写成：

Q₀ = Λ + Q₀ ( (a(bb)* + b(aa)* ab(bb)* ) (ba(aa) * ab(bb)* )* a + (b(aa)* + a(bb)* ba(aa)* ) (ab(bb)* ba(aa)* )* b)

接下来，对这个方程应用Arden定理，我们得到最终的RE：

偶数个'a'和偶数个'b'的正则表达式：

( (a(bb)* + b(aa)* ab(bb)* ) (ba(aa)* ab(bb)* )* a + (b(aa)* + a(bb)* ba(aa)* ) (ab(bb)* ba(aa)* )* b )*

可以进一步简化如下：

((a + b(aa)*ab)(bb)*(ba(aa)*ab(bb)*)*a + (b + a(bb)*ba)(aa)*(ab(bb)*ba(aa)*)*b)*

【讨论】：

有关所使用算法的实现，请参阅我对github.com/whekman/red-dragon-book/blob/master/ch3/3_7.md中的相关问题的回答

【解决方案2】：

设E是a偶数个b的语言，下面是E语言的正则表达式

[00 + 11 + (01+10)(11+00)(01+10)]

00 = type1

11 = 类型 2

(01+10)(00+11)*(01+10) = type3

假设我们从左开始沿着 E 语言中的一个单词扫描一次正确阅读两个字母。首先我们来一个双0（type1），然后到 double 1 (type2) ，然后到另一个 double 0 （再次输入 1）。然后也许我们遇到了一对不一样的字母。例如，假设接下来的两个字母是 10。这必须以 type3 的子字符串开头。它以一个未加倍的对（01 或 10）开始，然后是一段加倍的字母（00 或 11 的多次重复），最后以另一个未加倍的对（又是 01 或 10）结束。这部分单词的一个特性是它有偶数个 0 和偶数个 1。如果该部分以 10 开头，则它可以以 01 结尾，但在结尾处仍然给出两个 0 和两个 1，其间只有两个字母。如果开始了以 10 结尾并以 01 结尾，同样，它会给出偶数个 0 和偶数个 1。在 type3 的这一部分之后，我们可以继续有更多类型的部分，或者 type2 直到我们遇到另一个 undoubled 对，开始另一个 type3 部分。我们知道另一对不会翻倍来平衡最初的。总的效果是每个字 E的语言包含偶数个0和偶数个 1 个

【讨论】：

【解决方案3】：

这是偶数语言的 DFA 包含偶数个 0 和 1

它的 RE 是这样的

(00 + 11 + (01+10)(01+10) (00 + 11)*)*

这里，它会接受 0 和 1 的偶数的 lemda

或将接受 (00) 偶数 nmbr 为 0 并且没有 1 表示此处的 nmber of 1 是偶数。或者 (11) 在这种情况下 (0) 的 nmber 是偶数 .. 所以您可以检查它是否会生成包含偶数个 0 和 1 的字符串 ..

希望它能解决你的问题

【讨论】：