【发布时间】:2021-12-14 11:36:50
【问题描述】:
我有以下状态
states = [(0,2,3,0), (2,2,3,0), (2,2,2,0), (2,2,1,0)]
另外,我还有下面的转移矩阵
import pandas as pd
transition_matrix = pd.DataFrame([[1, 0, 0, 0],
[0.5, 0.3, 0.2, 0],
[0.5, 0.3, 0, 0.2],
[0.5, 0.5, 0, 0]], columns=states, index=states)
因此,如果您处于状态 (2,2,1,0),那么您有 50% 的可能性进入状态 (0,2,3,0),并且有 50% 的可能性进入状态 (2,2,3,0)。
如果你处于状态(0,2,3,0),吸收状态,你赢了。
我们可以写出以下等式
p_win_(0,2,3,0) = 1 p_win_(2,2,3,0) = 0.50 * p_win_(0,2,3,0) + 0.3 * p_win(2,2,3,0) + 0.2 * p_win(2,2,2,0) p_win_(2,2,2,0) = 0.50 * p_win_(0,2,3,0) + 0.3 * p_win(2,2,3,0) + 0.2 * p_win(2,2,1,0) p_win_(2,2,1,0) = 0.50 * p_win_(0,2,3,0) + 0.5 * p_win(2,2,3,0)
我想解决上面的公式。我查看了np.linalg.solve 函数的documentation。该示例没有使用已定义的变量,此外,我在等号的两边都有术语。
请告诉我如何解决上述问题。
【问题讨论】:
标签: numpy linear-algebra markov