图半监督学习
图半监督学习这一块是对应机器学习西瓜书中半监督学习部分的章节,在期末考试阶段对此部分信息做了一个整理,恰巧作者最近也在进行图神经网络的学习,为了方便引用,遂将其po到博客上,如果有收获就好了。以及部分公式参考南瓜书
图半监督学习的目标是从关系图网络中学习实值函数,即节点(样本)到预测的映射
我们考虑相似的样本,即在图上分布接近的样本具有相同的标记,于是定义关于该映射的能量函数为我们的最小化目标
其中用于表示i与j两个样本之间的亲和度,即节点之间的关联性,被表示为图的边,具体定义如下
即能量函数表示不同节点之间属性差于节点之间关系的加权和,继续考虑原式
其中D为度矩阵,W为邻接矩阵,合计表示为拉普拉斯矩阵L=D-W,另外有di为W矩阵i行元素之和
另外,由于全连接特性,D的值不为邻接节点个数,而是总连接权值
但是这个结构的目标是什么呢?我们已知了部分映射情况,并希望根据已知知识进行推广,获取未知部分的映射函数
通过分块矩阵的方式,可以将原式改写成
由于我们的目标是获取最小化时的值,即取的情况,得到
遂有,依此通过已知的对未标注样本进行预测
多分类问题的解决
为了代替上式解决多分类问题,需要额外引入一个进行标签判断的量,其中第i行元素表示为,表示第i个样本上γ个标签分布的概率,作为的标记向量,有分类规则,即最大概率类
根据已知的y标签,我们对F进行初值赋予。随后,我们要将F的标签信息在图上进行迭代传播,从而使未标记样本获取标签信息
我们定义在图上的正则化传播矩阵为,考虑标签信息在图上的迭代传播
我们的目标是获得F在图上的收敛解,从而获取样本标签
证明:
Comments NOTHING