您需要 登录 才可以下载或查看,没有账号?注册账号
看了七八年小说了,很是苦恼有时候有时候找不到下载的网站。 当然随便搞了油猴脚本就能抓下来,不过经常会抓到好多广告内容,就很烦。 正好没事就写了个通用的小说下载软件。 因为是自己下来看,就不考虑速度什么的了,为了不用去考虑某些加密什么的,所以直接用了精易web浏览器来访问网页,取网页源代码分析。 为啥说通杀呢,其实简单的说就是自己在软件中填网页源代码中内容前后的HTML标签,然后不停的用文本_取出中间文本() 为何不直接读取目录地址,然后直接多线程get呢?某些网站为了防止爬虫,会在目录中隐藏一部分章节,所以可能会出现内容不全。 应该除了飞卢等少数内容用图片呈现的网站外,都可以抓到(一章内容被分成了两页的也可以)。 对一些不可避免的广告,还写了几个容易碰到的文本处理功能。 调用了精易模块,另外一个皮肤模块自行删掉就行。
使用道具 举报
本版积分规则 发表回复 返回列表 发新帖 回帖后跳转到最后一页
注册账号后积极发帖的会员
经常参与各类话题的讨论,发帖内容较有主见
经常帮助其他会员答疑
积极宣传本站,为本站带来更多注册会员
积极宣传本站,为本站带来更多的用户访问量
经常在论坛发帖,且发帖量较大
长期对论坛的繁荣而不断努力,或多次提出建设性意见
活跃且尽责职守的版主
曾经为论坛做出突出贡献目前已离职的版主
为论坛做出突出贡献的会员
首页
消息
登录
发布
资讯
扫一扫,关注我们
下载APP客户端