线性结构任意分布下如何学习隐变量的因果结构？——线性隐变量模型的可识别性

点击此处查看最新的网赚项目教程

导读

在实验室老师们的指导下，DMIR实验室的同学们在研究上继续稳步前行，产出了一批优秀论文成果，其中代表性工作包括国际顶级学术会议AAAI的文章。来跟着文章作者们一起了解我们最新的研究进展吧！

线性结构和非线性结构的区别_线性结构_线性结构是什么意思

成果简介

该工作回答了在线性隐变量模型中，当噪声的分布为任意分布时，结构模型（隐变量之间的因果结构）的识别性问题。本文给出关于结构模型可识别的充分必要条件：在隐变量的马尔可夫等价类中，任意两个相连的隐变量的因果方向是可识别的有且仅有它们满足（1）其中一个隐变量的噪声是非高斯的；或者（2）对于其中至少一个隐变量至少存在一个非高斯祖先，且非高斯祖先不会被这两个隐变量的结构混淆因子d-分离。这个识别性结果将非高斯约束放宽到只有一个（尽可能最小的）变量子集，很好地拓展了结构模型的应用范围。基于上述可识别性结果，我们进一步提出了一个实用性的算法来学习结构模型。

主要理论

本文解决的是线性隐变量模型在允许隐变量的噪声分布任意分布的情况下，隐变量结构发现的问题。我们基于线性隐变量模型的假设和每个隐变量至少存在两个纯的测量变量的假设，分别探讨了关于任意两个相连隐变量至少存在一个噪声是非高斯和两个隐变量噪声都是高斯的识别性问题。对于第一种情况（至少存在一个非高斯噪声），我们先看一个简单的示例，如图1所示（其中圆圈代表隐变量的噪声服从高斯分布，方块代表隐变量的噪声服从非高斯分布，下同）：

线性结构_线性结构是什么意思_线性结构和非线性结构的区别

图1

我们发现，对于两个直接相连且没有混淆因子影响的隐变量和，它们之间的因果方向是可识别的：只需要其中一个隐变量的噪声是非高斯的。其可识别的原因是服从因果方向的GIN条件是满足的，而反向的GIN条件不满足。通过这种不对称性，满足上述条件的两个隐变量之间的因果方向是可识别的。（注：详细的证明在论文的附录中）

线性结构和非线性结构的区别_线性结构是什么意思_线性结构

图2

然而在马尔可夫等价类中，任意一对相连的隐变量，还可能存在结构混淆因子影响。如图2所示，是与的结构混淆因子，只考虑和之间不同方向的GIN条件没有法识别和之间的因果方向。幸运的是，通过从隐变量的骨架（马尔可夫等价类）中选取这两个隐变量的合适邻接子集从而剔除混淆因子的影响，和的因果方向仍然可识别。

线性结构_线性结构和非线性结构的区别_线性结构是什么意思

图3

对于第二种情况（两个隐变量的噪声都是高斯），我们发现在线性模型下非高斯噪声具备传递性。那么对于两个相连的隐变量，借以它们其中至少一个的非高斯祖先噪声传递，其因果方向也可识别。如图3(a)所示，虽然的噪声是高斯的，但是由于存在一个非高斯祖先，的噪声可以重写成，此时服从非高斯分布。根据前面的结论，那么这两个隐变量的正反方向GIN条件的不对称性仍然存在，也即它们之间的因果方向是可识别的。图3罗列了一些关于非高斯噪声传递性可识别的特殊结构，通过从图的角度总结这些特殊的结构，我们给出了非高斯噪声传递性的识别性理论。

线性结构_线性结构和非线性结构的区别_线性结构是什么意思