转载:https://github.com/Renovamen/pcalg-py

PC Algorithm

理想情况(知道所有条件独立关系)

Estimating High-Dimensional Directed Acyclic Graphs with the PC-Algorithm, Markus Kalisch, Peter Bu ̈hlmann. 2007
因果分析,PC算法(PC Algorithm)

line 11: 需要条件独立关系

偏相关系数

校正其它变量后某一变量与另一变量的相关关系,校正的意思可以理解为假定其它变量都取值为均数

服从高斯分布的随机变量,条件独立性与偏相关系数为0等价:

假设随机变量 XX 服从多元高斯分布,对于ij(1,...,p)k(1,...,p)/ (ij)i \not =j∈(1, ..., p),k⊆(1, ..., p) /\ (i,j),用 ρijkρ_{i,j|k} 表示 X(i)X(i)X(j)X(j)X(r)(rk)X^{(r)} (r∈k) 之间的偏相关系数 。 当且仅当 X(i)X(i)X(j)X( j ) 条件独立与 X(r)(rk)X^{(r)} (r∈k) 时,ρijk=0ρ_{i,j|k}=0

∴ 条件独立性可由偏相关估计出来,条件独立性检验转偏相关系数检验

任意两个变量i,ji, jhh(排除其他hh个变量的影响后,h<=k2h<=k-2)阶样本偏相关系数:

因果分析,PC算法(PC Algorithm)

Fisher Z Test(ρ0ρ\not=0时的显著性检验)

ρ0ρ\not=0时不是正态分布,不能进行 tt 检验。将 ρρ 进行 Fisher Z 转换,转换后可以认为是正态分布。

Fisher’s z-transform:

因果分析,PC算法(PC Algorithm)

零假设:H0(i,jk):ρijk0H_0(i,j|k): ρ_{i,j|k} \not= 0

对立假设:H1(i,jk):ρijk=0H_1(i,j|k): ρ_{i,j|k} = 0

nk3Z(i,jk)>Φ1(1α/2)\sqrt{n-|k|-3}|Z(i,j|k)>Φ^{-1}(1-α/2)H0H_0成立

∴ 用nk3Z(i,jk)<=Φ1(1α/2)\sqrt{n-|k|-3}|Z(i,j|k)<=Φ^{-1}(1-α/2)替换 PC-Algorithm 中的“如果 i,ji,jkk dseparationd-separation

paper: Frequency Distribution of the Values of the Correlation Coefficient in Samples from an Indefinitely large population, Fisher, R.A., 1915

R语言实现

zStat(x, y, S, C): 计算并返回nk3Z(i,jk)\sqrt{n-|k|-3}|Z(i,j|k)的值

pcorOrder(i, j, k, C): 计算并返回 iijjkk 的偏相关系数

condIndFisherZ(x, y, S, C): 计算nk3Z(i,jk)\sqrt{n-|k|-3}|Z(i,j|k),返回它是否<= cutoff

gaussCItest(x, y, S, suffStat): 计算并返回Φ1(1α/2)Φ^{-1}(1-α/2)

CPDAG

An algorithm for fast recovery of sparse causal graphs, Peter Spirtes, Clark N. Glymour., 1990

因果分析,PC算法(PC Algorithm)

得到骨架(无向图)。

任意 BN 的马尔科夫等价类都存在唯一的 CPDAG 与之等价,因此, CPDAG可作为贝叶斯网络等价类的图形化表示

将骨架扩展为等价类的CPDAG:

Causal inference and causal explanation with background knowledge, Meek., 1995

因果分析,PC算法(PC Algorithm)

一些定义:

骨架:把有向图 GG 的有向边变成无向边。

PDAG:设 G=(V,E)G = (V, E) 是一个图,若边集 EE 中包含有向边和无向边,则称???? 是一个部分有向图。若部分有向图 ???? 中不存在有向圈,则称 ???? 是一个部分有向无环图(PDAG)

马尔科夫等价:贝叶斯网络 <G1,P1><G_1, P_1><G2,P2><G_2, P_2>马尔科夫等价, 当且仅当 G1G_1G2G_2 具有相同的框架和V结构

有向无环图 G=(V,E)G = (V, E) ,任意有向边 ViVjEV_i \rightarrow V_j ∈ E,若存在图 G=(V,E)G' = (V, E')GG 等价,且VjViEV_j \rightarrow V_i ∈ E',则称有向边 ViVjV_i \rightarrow V_jGG 中是可逆的,否则是不可逆的.。

同理, 对任意无向边 ViVjEV_i \rightarrow V_j ∈ E​,若存在 G1=(V,E1)G_1 = (V, E_1)​G2=(V,E2)G_2 = (V, E_2)​ 均与 GG​ 等价,且ViVjE1V_i \rightarrow V_j ∈ E_1​VjViE2V_j \rightarrow V_i ∈ E_2​, 则 称 无 向边 ViVjV_i \rightarrow V_j​GG​ 中是可逆的,否则是不可逆的

CPDAG:设 G=(V,E)G = (V, E) 是一个部分有向无环图,若 EE 中的有向边都是不可逆的,并且 EE 中的无向边都是可逆的,则称 GG 是一个完全部分有向无环图(CPDAG)

相关文章:

  • 2021-07-02
  • 2022-12-23
  • 2021-12-06
  • 2021-10-26
  • 2022-12-23
  • 2021-12-17
  • 2021-09-03
  • 2022-12-23
猜你喜欢
  • 2021-04-27
  • 2021-12-05
  • 2021-07-22
  • 2022-12-23
  • 2021-09-29
  • 2022-12-23
  • 2022-01-29
相关资源
相似解决方案