学位专题

<
DOI:10.7666/d.y2158352

社会网络中焦点人物及其关系的挖掘方法研究与实现

赵峰
中国海洋大学
引用
随着网络技术的迅速发展,越来越多的用户参与到网络平台进行信息的分享与交流,社会网络的概念也随之呈现。用户在社会网络中以blog的形式记录并与他人分享自己在各方面的知识领悟,极大地促进了信息的共享与交流。而社会网络用户数量的急剧增长也直接导致了blog文章的膨胀。为了能在众多用户和blog中找出最受欢迎或者最具有价值的以供其他用户进行参考,本文提出了挖掘社会网络中焦点人物和用户关系的理论观点并进行了系统的设计与实现。   挖掘社会网络中的焦点人物及其用户关系首先需要进行数据采集,然后进行数据分析,最后提供一个可供查询的用户关系显示界面。本课题的研究首先要开发一个进行数据抓取的网络爬虫系统抓取万维网上的数据,然后设计可以分析网页数据并提取出关键信息的数据分析器,最后提供一个可供用户进行用户关系查询以及显示网站中焦点人物的界面。   本文中的焦点人物是指在目标网站中影响力最高的一些用户。而用户影响力的计算是根据blog的被推荐次数、评论条数以及访问量来计算。本文主要介绍了挖掘焦点人物以及人物关系的算法设计,开发了焦点人物及其关系查询系统。   首先阐述了研究课题的背景和开发的意义,描述了所用到的MD5、TFIDF算法以及Linux网络编程、WebService和Silverlight等关键技术。   其次对本研究课题进行了需求分析和算法设计,并介绍了系统的详细设计和具体实现。   最后,对本文的工作进行了总结并对后续的工作进行了展望。

网络编程;社会网络;焦点人物;数据挖掘;网络爬虫系统;需求分析

中国海洋大学

硕士

计算机技术

徐建良

2011

中文

TP311.131;TP393.09

68

2012-12-27(万方平台首次上网日期,不代表论文的发表时间)