Time Machine - QQ作业爬虫

 

写了一个爬虫用以获取 QQ 作业历史记录, 代码发在了 Github 上.

主要是因为寒假 + 网校期间作业实在太多了, 纸质稿都是分开打印的, 已经十分混乱…

所以就直接写了一个爬虫把我所有交上去的作业再下载回来保存起来.

后来就又想到: 既然可以获取自己作业, 那就也可以获取同学的作业咯?

只不过腾讯在权限管理这方面还是做的比较好的, 不像之前用的课后网 CDN 上的图片命名是有规律的, 直接按照规律就可以获取同学的作业…

腾讯的图片虽然用了没有身份校验的 CDN, 但是图片命名是随机的, 还是需要群管理员权限才可以获取所有同学的作业.

所以就又写了一个版本, 可以用管理员账号登录后保存所有同学的作业记录…

至于保存的作业有什么用… 本来是想通过 exif 可以获取更多信息的(开始是想统计同学手机型号的来着), 可是腾讯作业上传的时候会二压直接把 exif 给砍掉了… 爬到的数据也就这样闲置了…

(但不得不感叹就纯文本的数据能存到 20 M, 疫情期间同学和老师也真的辛苦了…

数据库数据库

本文采用 CC BY-NC-SA 4.0 许可协议发布.

作者: lyc8503, 文章链接: https://blog.lyc8503.net/post/qq-homework-crawler/
如果本文给你带来了帮助或让你觉得有趣, 可以考虑赞助我¬_¬