代理ip

>

换ip软件

>

http代理

>

ip代理

您的位置:首页 > 新闻资讯 > 文章内容
python3爬取微信步骤(下)
来源:互联网 作者:admin 时间:2020-02-18 17:33:36

  用python爬取微信好友信息并且进行数据清洗,网连代理之前已经将教程的上半部分进行了分解,下面我们继续来解决这个问题,将接下来的两个步骤完成。



  4、利用签名绘制词云


  #4、绘制词云


  #4.1替换签名中的emoji、span、class、类似<>/=之类的符号等等


  siglist=[]


  for i in friends:


  signature=i["Signature"].strip().replace("span","").replace("class","").replace("emoji","")


  rep=re.compile("1f\d+\w*|[<>/=]")


  signature=rep.sub("",signature)


  siglist.append(signature)


  text="".join(siglist)


  #4.2把结巴分词这个包搞进来分词


  import jieba


  wordlist=jieba.cut(text,cut_all=True)


  word_space_split="".join(wordlist)


  #4.3进入画图阶段,根据自己想要的图片、形状、颜色画出相似的图形


  import matplotlib.pyplot as plt


  from wordcloud import WordCloud,ImageColorGenerator


  import numpy as np


  import PIL.Image as Image


  coloring=np.array(Image.open("101.jpg"))


  my_wordcloud=WordCloud(background_color="white",max_words=2000,


  mask=coloring,max_font_size=60,random_state=42,scale=2,


  font_path="STXINWEI.TTF").generate(word_space_split)


  image_colors=ImageColorGenerator(coloring)


  plt.imshow(my_wordcloud.recolor(color_func=image_colors))


  plt.imshow(my_wordcloud)


  plt.axis("off")


  plt.show()


  5、ggplot图形展示


  #5、ggplot图形展示


  import matplotlib.pyplot as plt


  #获取csv内容


  df=pd.read_csv('data.csv')


  #配置图


  fig=plt.figure()


  ax=fig.add_subplot(1,1,1)


  ax.hist(df['Sex'],bins=7)


  #标题


  plt.title('Sex distribution')


  #X轴标题


  plt.xlabel('Sex')


  #Y轴标题


  plt.ylabel('people')


  plt.show()


  以上当这些步骤执行完之后,我们就能够将微信好友的基本信息抓取完毕了。


相关文章内容简介
推荐阅读
  • 29 2019-08
    什么是开放代理、私密代理、独享代理?

    什么是开放代理、私密代理、独享代理?别着急,网连代理小编马上为大家解答。开放代理:是由全网扫描而来,就是别人搭建了代理服务器被扫到了拿来用,采用分布在全球各地的云服务器使

  • 19 2019-11
    如何使用http代理IP

    什么是代理IP?如何使用http代理IP?代理服务器(Proxy)是网络信息的中转站,比方说HTTP代理服务器。我们使用网络浏览器直接链接其他Internet站点并取得网络信息时,需送出Request信号来得到回

  • 30 2019-12
    独享IP和共享IP差别大吗

    无论你是做网站、发帖、注册、投票,还是爬虫、补量、数据采集,IP都是必不可少的,那么选择独享IP还是共享IP呢?独享IP和共享IP差别大吗?小编可以很负责的告诉你,同样都是代理IP,差别

  • 12 2019-01
  • 26 2019-08
    如何选择稳定可靠的爬虫代理IP

    如何选择稳定可靠的爬虫代理IP?由于开python培训有讲过爬虫的缘故,这个问题已经被ask无数次了,一般问的基友也都是爬虫防ban用的,总体来讲,质量好的都不便宜,便宜的质量都比较渣,一

  • 25 2019-10
    爬虫需要什么类型的代理IP

    IP限制常见于大部分的网站平台,为了限制大量爬虫。如果爬虫想要突破IP限制,通常使用代理IP。现在可能新手都知道要用代理IP突破限制,但你可能还不知道代理IP也分类型的,那么爬虫需要