失效链接处理 |
基于Python实现的微信好友数据分析 PDF 下载
本站整理下载:
相关截图:
主要内容:
引言有人说,人性远比计算机编程更复杂,因为即使是人类迄今为止最伟大的发明——计算机,在面对人类的自 然语言时同样会张惶失措 。人类有多少语言存在着模棱两可的含义,我认为语言是人类最大的误解,人类 时常喜欢揣测语言背后隐藏的含义,好像在沟通时表达清晰的含义会让人类没有面子,更不用说网络上流行 的猜测女朋友真实意图的案例。金庸先生的武侠小说《射雕英雄传》里,在信息闭塞的南宋时期,江湖上裘 等级: 访问量: 58.51万 积分: 9324 排名: 2387 他的最新文章 更多文章 首届“AIIA杯”人工智能巡回赛起航,5 大赛区邀你来战 MIT与商汤科技成立人工智能联盟 AI一分钟 | 阿里与南洋理工成立AI联合 研究院;传蔚来汽车拟赴美IPO,融资20 亿美元 70个NumPy分级练习:用Python一举搞定 机器学习矩阵运算 大福利!Google机器学习零基础在线课程 发布,免费!有中文版! AI 76篇 人工智能 78篇 机器人 1篇 神经网络 1篇 机器学习 2篇 Python 1篇 2018年3月 5篇 2018年2月 89篇 AI科技大本营 原创304 粉丝810 喜欢314 评论445 文章分类 展开 文章存档 博客 学院 下载 GitChat 论坛 写博客 发Chat 登录 注册 住人集装箱
2018/3/2 基于Python实现的微信好友数据分析 - CSDN博客 http://blog.csdn.net/dqcfkyqdxym3f8rb0/article/details/79386668 2/14 千丈的一句鬼话,就搅得整个武林天翻地覆。其实,一两句话说清楚不好吗?黄药师、全真七子、江南六怪 间的种种纠葛,哪一场不是误会?一众儿武功震古烁今的武林高手,怎么没有丝毫的去伪存真的能力,语言 造成了多少误会。 可即便人类的语言复杂得像一本无字天书,可人类还是从这些语言中寻觅到蛛丝马迹。古人有文王”拘而演 周易”、东方朔测字卜卦,这种带有”迷信”色彩的原始崇拜,就如同今天人们迷信星座运势一般,都是人 类在上千年的演变中不断对经验进行总结和训练的结果。如此说起来,我们的人工智能未尝不是一种更加科 学化的”迷信”,因为数据和算法让我们在不断地相信,这一切都是真实地。生活在数字时代的我们,无疑 是悲哀的,一面努力地在别人面前隐藏真实地自己,一面不无遗憾地感慨自己无处遁逃,每一根数字神经都 紧紧地联系着你和我,你不能渴望任何一部数字设备具备真正的智能,可你生命里的每个瞬间,都在悄然间 被数据地折射出来。 今天这篇文章会基于 Python 对微信好友进行数据分析,这里选择的维度主要有:性别、头像、签名、位 置,主要采用图表和词云两种形式来呈现结果,其中,对文本类信息会采用词频分析和情感分析两种方法。 常言道:工欲善其事,必先利其器也。在正式开始这篇文章前,简单介绍下本文中使用到的第三方模块: * itchat:微信网页版接口封装Python版本,在本文中用以获取微信好友信息。 * jieba:结巴分词的 Python 版本,在本文中用以对文本信息进行分词处理。 * matplotlib: Python 中图表绘制模块,在本文中用以绘制柱形图和饼图 * snownlp:一个 Python 中的中文分词模块,在本文中用以对文本信息进行情感判断。 * PIL: Python 中的图像处理模块,在本文中用以对图片进行处理。 * numpy: Python中 的数值计算模块,在本文中配合 wordcloud 模块使用。 * wordcloud: Python 中的词云模块,在本文中用以绘制词云图片。 * TencentYoutuyun:腾讯优图提供的 Python 版本 SDK ,在本文中用以识别人脸及提取图片标签信 息。以上模块均可通过 pip 安装,关于各个模块使用的详细说明,请自行查阅各自文档。 数据分析 分析微信好友数据的前提是获得好友信息,通过使用 itchat 这个模块,这一切会变得非常简单,我们通 过下面两行代码就可以实现: itchat.auto_login(hotReload = True) friends = itchat.get_friends(update = True) 同平时登录网页版微信一样,我们使用手机扫描二维码就可以登录,这里返回的friends对象是一个集合, 第一个元素是当前用户。所以,在下面的数据分析流程中,我们始终取friends[1:]作为原始输入数据,集 合中的每一个元素都是一个字典结构,以我本人为例,可以注意到这里有Sex、City、Province、HeadImg Url、Signature这四个字段,我们下面的分析就从这四个字段入手:
|