Tags:InfoSpider,爬虫,工具箱
InfoSpider爬虫工具箱可以帮助你从各大软件和网站当中拿出你自己的数据内容,本软件需要在一定的编程知识下面才能够进行使用,你需要通过各种库来进行软件的安装,所支持的数据源非常的多,用户能够从这些数据源当中爬取你自己的数据内容,感兴趣的话就快来下载这款InfoSpider爬虫工具箱!
InfoSpider爬虫工具箱软件
INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱,旨在安全快捷的帮助用户拿回自己的数据,工具代码开源,流程透明。支持数据源包括 GitHub 、QQ 邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail 邮箱、Outlook 邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ 好友、QQ 群、生成朋友圈相册、浏览器浏览历史、12306 、博客园、CSDN 博客、开源中国博客、简书。
软件特色
安全可靠:本项目为开源项目,代码简洁,所有源码可见,本地运行,安全可靠。
使用简单:提供 GUI 界面,只需点击所需获取的数据源并根据提示操作即可。
结构清晰:本项目的所有数据源相互独立,可移植性高,所有爬虫脚本在项目的 Spiders 文件下。
数据源丰富:本项目目前支持多达24+个数据源,持续更新。
数据格式统一:爬取的所有数据都将存储为json格式,方便后期数据分析。
个人数据丰富:本项目将尽可能多地为你爬取个人数据,后期数据处理可根据需要删减。
数据分析:本项目提供个人数据的可视化分析,目前仅部分支持。
文档丰富:本项目包含完整全面的使用说明文档和视频教程
安装说明
安装python3和Chrome浏览器
安装与Chrome浏览器相同版本的驱动
安装依赖库 pip install -r requirements.txt
工具运行
进入 tools 目录
运行 python3 main.py
在打开的窗口点击数据源按钮, 根据提示选择数据保存路径
弹出的浏览器输入用户密码后会自动开始爬取数据, 爬取完成浏览器会自动关闭.
在对应的目录下可以查看下载下来的数据(xxx.json), 数据分析图表(xxx.html)
相关新闻
通过编写好的软件在特定的网站也软件当中爬取你自己所想要的内容!
软件评论 请自觉遵守互联网相关政策法规,评论内容只代表网友观点,与本站立场无关!
网友评论