python实践:利用爬虫刷网课
利用爬虫刷网课
用过python的人应该都会知道爬虫这个东西,网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
今天就来讲讲如何利用爬虫技术刷网课。
最近学校又推送了一波网课,一个一个的看实在太费时间,于是乎就想到了爬虫来自动刷网课。
分析网站源代码,看看网站是如何上传用户的数据的。
这是我们的主站
这是我们要刷的课程
接下来就开始分析源代码了哦,
这个就是播放视频相关的js代码。
我们点进去找找播放之后上传相关的函数。
从这个javascript函数我们可以看到这个是播放完毕以后上传到服务器的json数据包。
我们只需要两个参数就可以实现这个函数的重放了。
courseId就是url里面的419
couttentkpointId就是url里面的10506
每个视频的pointid不一样,我们只需要for循环遍历就行了。
接下来我们就需要看看这个网站是如何登录的了。
看到没,这个网站连验证码都没有,模拟登录就是小儿科了。
打开我们的brup suite抓个包看看,当然也可以不需要抓包,直接分析源代码就可以,照顾一下新手,我们就来抓个包吧。
从这里我们就可以看到这是一个POST方法,三个参数分别是account,password,ipForget。
好的接下来我们就用python来模拟登陆了。
首先在终端下面安装一下requests。我的系统是mac os
这个是已经安装好了的,没有安装就安装一下,windows是需要先安装python的。这里我就不讲如何安装了。
然后打开我们的代码编辑器。我这里用的是sublime.
代码如下:
首先就是一个登陆,登陆之后我们就有了cookie,然后利用这个cookie来发包刷网课就行了。
这个网站还是存在很多问题的,如何登陆缺乏验证就可快速爆破,在笔记的地方存在xss漏洞,具体分析过程我在这里就不写了。谢谢大家。
更多内容请访问:https://blog.123wk.top/
1. 本站所有资源来源于用户上传和网络,如有侵权请联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,请使用WINRAR解压,如遇到无法解压的请联系管理员!
8. 精力有限,不少源码未能详细测试(解密),不能分辨部分源码是病毒还是误报,所以没有进行任何修改,大家使用前请进行甄别!
教热门 » python实践:利用爬虫刷网课