Skip to content

Latest commit

 

History

History
55 lines (22 loc) · 923 Bytes

File metadata and controls

55 lines (22 loc) · 923 Bytes

WeChat-articles-spider

概述:

在一次更新团队主页时发现公众号推文已经长时间没有更新到官网上,然而手动copy文字+图片显然不太现实(三十多篇能累死) 因此有了这个小工具爬取微信公众号文章和图片

此工具仅用于交流学习,请勿用于违法用途,作者本人一概不负责任

此工具始终开源,欢迎各位贡献和star~

功能:

  • 此工具可以爬取微信公众号文章并保存为markdown格式
  • 爬取的图片会存放在/images/文章标题/目录下
  • 可导入urls.txt文件以实现批量处理
  • 能够避免微信图片防反爬处理

安装

git clone https://github.com/fishcanf1y/wechat-articles-spider.git

pip install -r requirment.txt

工具使用

首先将需要处理的文章URL批量复制到urls.txt

然后直接

python ./main.py 

即可