自我介绍范文网

当前位置:自我介绍范文网 > 学习方法 > >

郑文琛:基于网络功能模块的图特征学习

来源::网络整理 | 作者:管理员 | 本文已影响

郑文琛:基于网络功能模块的图特征学习 | AI 研习社79期大讲堂

2018-11-04 10:45 来源:雷锋网 隐私 /人工智能 /电商

原标题:郑文琛:基于网络功能模块的图特征学习 | AI 研习社79期大讲堂

雷锋网AI研习社按:图是一种常见的数据结构,可以被用于许多不同的预测任务。如何从图数据学习有效特征是个重要的问题。我们的新概念是从点和边出发,拓展到更高阶的子图结构(比如路径、子图)来帮助图特征学习。这些高阶的子图结构通常具有不同的功能,事实上在一起共同构造了整个网络,所以我们称这些高阶的子图结构为网络功能模块(Network Functional Blocks)。

在这次分享中,嘉宾将用语义相关度搜索(Semantic Proximity Search)作为一个应用例子,来介绍他们最近在探索不同粒度的网络功能模块、以进行有效图特征学习的一些进展。

分享嘉宾:

郑文琛,微众银行人工智能项目组专家工程师和副总经理。主要研究方向为结构化数据的特征学习和迁移学习,已在相关研究领域发表了60余篇顶级会议和期刊论文,并拥有多项专利和技术。

在图数据特征工程的成就获得国际人工智能顶级会议 IJCAI 2018 年的 Early Career Spotlight,在迁移学习应用于用户行为识别的成就获得国际会议ICCSE 2018年的最佳论文奖。是 Cognitive Computation 杂志的副主编。同时也是多个顶级人工智能国际会议的编委会委员和研讨会的组织者。

公开课回放地址:

?=Leiphone

分享主题:基于网络功能模块的图特征学习

分享提纲:

图特征学习简介。

网络功能模块的概念,及其在语义相关度搜索的应用。

利用节点路径作为网络功能模块的解决方案。

利用子图扩展路径作为网络功能模块的解决方案。

利用异质有向无环图作为网络功能模块的解决方案。

总结。

微众 AI 招聘简介

雷锋网 AI 研习社将其分享内容整理如下:

首先,我给大家做一些简单的介绍,图是一种常见的数据结构,我们会发现存在很多不一样的图结构,尤其是这种异质图的网络,比较常见的类型包括职场网络、社交网络、学术网络和电商网络等等。

郑文琛:基于网络功能模块的图特征学习

过去我们处理图数据/图的特征学习,主要解决的是「点」层面的图的特征学习,比如下面这张图,左边是图的结构,我们通常会据此做图的特征学习,就是将图上的每个点映射到第一维的空间上,这样做的话图上相近的点在第一维空间上同样会很靠近,黄色的点与黄色的点聚在一起,黑色的点与黑色的点聚在一起。

郑文琛:基于网络功能模块的图特征学习

将一个图的结构映射到一个低维空间,从而得到一个点的表征,是一种比较简单的做法。实际上,图的结构还挺有意思的,特别是当图存在异质信息的时候。由于图本身具有拓扑结构,我们会发现存在很多不同的模块。考虑一个电商图,这个点可能是个买家,而在功能定位上它是一个角色(role)。除了点的结构以外,还存在其他的一些结构,比如说路径(买家-车-卖家),更复杂的我们还有子图(卖家-书&城市-买家)

郑文琛:基于网络功能模块的图特征学习

因此,同样的一张图,通过不同的点、不同的图来组成模块,它们之间是有区别的,从点——路径——子图,它们各自承载不同的功能,正因为功能的不同,随之语义也就不同。所以我们认为一张图是由许多不同的模块组成的,而每一个模块的功能主要取决于两个因素:一是拓扑结构,也就是说形状是什么样的;二是它的预测任务究竟是什么。

这也意味着,图并不只是点与点之间的连接,实际上这些点与点之间的变化是很丰富的,它们构成了不同子图的结构,这些子图结构又为我们带来了丰富的语义。

根据传统的做法,大家会直接把图上的点单独做成特征向量,那么问题来了,我们能不能利用好这些含有丰富语义的拓扑结构,无论是路径也好,子图也好,我们将它们扩展开来,利用语义更丰富的这些结构作为网络的功能模块,再基于这些功能模块来做网络特征学习,最后利用这些特征来做点的分类、回归、排序等等。总之,不局限于点的层面,而是探索网络功能模块这么一个概念。这是我们的一个整体思路。

语义相关度搜索(Semantic Proximity Search)

郑文琛:基于网络功能模块的图特征学习

我们近期在做的工作,是探索一些比较特殊的网络功能模块的使用场景。这里我会以一个场景作为例子介绍这个网络功能模块的概念。这个例子就是语义相关度搜索(Semantic Proximity Search),这是一个比较常见的异质图搜索应用。在语义相关度搜索使用场景中,只要给定一个 query 和一个 relation,可以对其他节点进行排序,让我们对这个应用有了很大的想象空间。再者,异质图本身存在不同的功能模块,用来做语义相关搜索可说是最适合不过。

那么做语义相关检索会遇到哪些挑战呢?我们认为主要有两个:

1)点嵌入(node embedding)是一个比较间接的解法。我们做语义相关度检索,关心的是两个节点之间的语义相关度,对于点嵌入来说,它更关心的是每个节点之间的向量。考虑到两个节点之间并不一定直接相邻的,在给定两个点的向量后,我们需要算出两个点之间的距离,这意味着必须通过很多种方式去计算,然而我们并不知道哪种计算方式是最好的。此外,在大部分情况下,点嵌入更多被用来处理同质图;如果是异质图,我举个例子:「我买了一个牙刷」,不能说我跟牙刷的 embedding 很像,这说明什么呢?传统的 node embedding 是很难处理这种图的异质性的。总而言之,node embedding 是一个比较间接的解法,因为关心的是两个点之间的结构,而不是单个点的结构。


本文标题:郑文琛:基于网络功能模块的图特征学习
分享到: 更多

更多关于“学习方法”的文章

随机阅读TODAY'S FOCUS