Python批量查询关键词微信指数实例方法

 更新时间:2019年06月27日 11:18:09   作者:胡斐张无忌   我要评论
在本篇文章中小编给大家整理的是关于Python批量查询关键词微信指数实例方法以及相关代码,需要的朋友们可以跟着学习下。

教你用Python批量查询关键词微信指数

前期准备安装好Python开发环境及Fiddler抓包工具。前期准备安装好Python开发环境及Fiddler抓包工具。

首先打开Fiddler软件,点击Tools,在下拉菜单选择Options,然后选中HTTPS,进行HTTPS设置,如下图所示:

再进行connections设置,如下图所示:

手机配置主要是使电脑和手机处于同一个局域网,打开手机WLAN设置,开启手动代理,然后设置代理服务器主机名和代理服务器端口。代理服务器主机名为电脑IPv4地址,电脑运行cmd,输入ipconfig回车即可获取。如下图:

代理服务器端口为Fiddler软件connections设置的默认端口8888。当然这个端口写可以修改成别的,只要一致就可以,这边就直接使用默认端口了。最终配置如下图所示:

然后手机浏览器访问http://+IPv4地址+端口,如本例http://192.168.100.226:8888/,在页面中点击FiddlerRoot certificate下载证书,按照提示安装即可。这样就实现了全部配置,在手机访问页面,就可以在Fiddler中看到抓包数据了。然后手机浏览器访问http://+IPv4地址+端口,如本例http://192.168.100.226:8888/,在页面中点击FiddlerRoot certificate下载证书,按照提示安装即可。这样就实现了全部配置,在手机访问页面,就可以在Fiddler中看到抓包数据了。

打开微信指数小程序,搜索关键词,如“演唱会”,找到Host为search.weixin.qq.com的请求点击进去,取出Request Headers中的几个参数:GET,即请求连接;User-Agent用户代理及referer(如下图所示)。代码中需要修改请求头中的这三个配置。

代码示例:

import requests,urllib,json,random,time
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
headers = {'Accept-Encoding': 'gzip',
    'referer': 'https://servicewechat.com/wxc026e7662ec26a3a/7/page-frame.html',#需按实际抓包修改
    'content-type': 'application/json',
    'User-Agent': 'Mozilla/5.0 (Linux; Android 5.1.1; vivo V3Max A Build/LMY47V) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/39.0.0.0 Mobile Safari/537.36 MicroMessenger/7.0.4.1420(0x27000435) Process/appbrand2 NetType/WIFI Language/zh_CN', #需按实际抓包修改
    'Host': 'search.weixin.qq.com',
    'Connection': 'Keep-Alive'
    }
with open('weixin.txt','w',encoding='utf-8') as f:
 for line in open('keywords.txt',encoding='utf-8-sig'):
   word = line.rstrip()
   kw = urllib.parse.quote(word)
   url = 'https://search.weixin.qq.com/cgi-bin/searchweb/wxindex/querywxindexgroup?group_query_list={}&wxindex_query_list={}&gid=&openid=ov4ns0NiA4_Cshlsxa5pT640jC5w&search_key=1560843991380393_3137533225'.format(kw,kw) #需按实际抓包修改
   html = requests.get(url,headers=headers,verify=False).text
   time.sleep(random.uniform(2, 4))
   datas = json.loads(html)
   if datas.get('data'):
    try:
      wxindex_str = datas['data']['group_wxindex'][0]['wxindex_str']
      if wxindex_str:
       index = wxindex_str.split(',')[-1]
      else:
       index = 0
    except:
      index = 0
   else:
    index = 0
   data = '{}\t{}\n'.format(word,index)
   print(data.rstrip())
   f.write(data)

注意请求链接的修改,需要将取出的原始链接中groupquerylist及wxindexquerylist等号后边的字符修改成{}。关键词保存在keywords.txt文件中,一行一个。运行脚本,数据输出如下图所示,数据最终会保存到weixin.txt。

总结:

以上就是关于Python批量查询关键词微信指数的全部知识点,感谢大家的学习和对澳门金沙网上娱乐的支持。

相关文章

  • numpy.where() 用法详解

    numpy.where() 用法详解

    这篇文章主要介绍了numpy.where() 用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05
  • 通过mod_python配置运行在Apache上的Django框架

    通过mod_python配置运行在Apache上的Django框架

    这篇文章主要介绍了通过mod_python配置运行在Apache上的Django框架,Django是最具人气的Python web开发框架,需要的朋友可以参考下
    2015-07-07
  • Python中编写ORM框架的入门指引

    Python中编写ORM框架的入门指引

    这篇文章主要介绍了Python中编写ORM框架的入门指引,示例代码基于Python2.x版本,需要的朋友可以参考下
    2015-04-04
  • python连接mysql实例分享

    python连接mysql实例分享

    本文给大家汇总介绍了使用python连接mysql的几个实例,非常的简单实用,有需要的小伙伴可以参考下
    2016-10-10
  • Python深入学习之装饰器

    Python深入学习之装饰器

    这篇文章主要介绍了Python深入学习之装饰器,装饰器(decorator)是一种高级Python语法,本文全面介绍了Python中的装饰器,需要的朋友可以参考下
    2014-08-08
  • python实现定时提取实时日志程序

    python实现定时提取实时日志程序

    这篇文章主要为大家详细介绍了python实现定时提取实时日志程序,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-06-06
  • Python实现对PPT文件进行截图操作的方法

    Python实现对PPT文件进行截图操作的方法

    这篇文章主要介绍了Python实现对PPT文件进行截图操作的方法,涉及Python操作幻灯片的相关技巧,非常具有实用价值,需要的朋友可以参考下
    2015-04-04
  • 详解Python中的文本处理

    详解Python中的文本处理

    这篇文章主要介绍了Python中的文本处理,包括从最基本的string模块的基础使用和更进一步的re模块的使用,本文来自IBM官方开发者技术文档,需要的朋友可以参考下
    2015-04-04
  • pygame游戏之旅 添加游戏界面按键图形

    pygame游戏之旅 添加游戏界面按键图形

    这篇文章主要为大家详细介绍了pygame游戏之旅的第10篇,教大家如何添加游戏界面按键图形,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-11-11
  • Python自动化导出zabbix数据并发邮件脚本

    Python自动化导出zabbix数据并发邮件脚本

    这篇文章主要介绍了Python自动化导出zabbix数据并发邮件脚本,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08

最新评论