Skip to content

yh443042575/gitdata

Repository files navigation

gitdata

github平台社交行为模式挖掘

一共分如下两个模块 一、数据的采集与持久化

二、数据的分析 1、数据分析基于gsp算法进行 2、实现多个算法,每一个算法都负责一个社交行为模型的挖掘 3、对用户的行为进行编码,进而挖掘

在数据的挖掘上,程序一共挖掘了3种行为模式 1、最简单的行为模式,把所有在github上的用户的行为归纳成,<发起者A,发起了XX动作 ,接收者B>,用户的每一个动作都转换为前面的形式,进而作为一个数据项,利用GSP算法进行挖掘。 2、基于相对时间的行为模式,用户之间的行为是有先后的,那也行为与行为之间也是有时间间隔的,把时间间隔离散化,例如1天之内,1天-7天,7天-14天等等。。。,那么用户的行为可以归纳成<发起者A,发起了XX动作 ,接收者B,据上一次用户行为的相对时间>,进而作为一个数据项,利用GSP算法挖掘所有用户的行为。 3、基于抽象用户的行为模式,如果基于具体的用户,那么行为可能不具有频繁性,但是将用户抽象,那么有些行为可能就是频繁的,比如说juli,wang,jaz进入实验室时,第一件事都是打开电脑,但是juli打开电脑,wang打开电脑,jaz打开电脑这三个行为按照1和2的归纳来说,是不同的,但是我们把这三个人都抽象成A,那么这三个行为就可以等价成一个,隐含的意义就是,不论是谁,一般同学进屋都会先打开电脑(只是举例,你不一定第一件事是打开电脑,也有可能是先跟同学说hello)。

感谢各位老爷们关注我的程序(你能找到这个程序我也是真佩服你啊哈哈),如果有问题可以用邮件咨询我coderbdhao@163.com

About

github平台社交行为模式挖掘

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages