DeepWalk

8/2/2021 DeepWalk

# DeepWalk的主要思想是什么?说出算法步骤

在互联网场景下,数据对象之间更多呈现的是图结构,比如由用户行为数据生成的物品关系图,以及属性与实体组成的知识图谱。Graph Embedding是一种对图结构中的节点进行Embedding编码的方法,最终生成的节点Embedding向量一般包含图的结构信息及附近节点局部相似性信息。

DeepWalk是影响力比较大的Graph Embedding方法,主要思想是在由物品的图结构上随机游走,产生大量物品序列,然后将这些物品序列作为训练样本输入Word2Vec进行训练,得到物品的Embedding。

它的步骤如下:

1)a是原始的用户行为序列 2)基于用户行为序列构建物品关系图,比如物品A和B之间的边产生的原因是用户U1先后购买了物品A和物品B,若后续产生了多条相同的有向边,则有向边的权重被加强,在将所有用户行为序列都转换成物品关系图中的边之后,全局的物品关系图就建立起来了。 3)采用随机游走的方式随机选择起始点,重新产生物品序列 4)将这些物品序列输入到d所示的Word2Vec模型中,生成最终的物品Embedding向量。