• 新浪微博:
  • 按键公众号 :
按键精灵电脑版
立即下载

软件版本:2014.06
软件大小:22.9M
更新时间:03-18

按键精灵安卓版
立即下载

软件版本:3.5.3
软件大小:46.2M
更新时间:03-02

按键精灵iOS版
立即下载

软件版本:1.7.3
软件大小:29.2M
更新时间:12-06

最新企业版UiBot
立即下载

软件版本:3.3
软件大小:282M
更新时间:08-06

快捷导航

登录 后使用快捷导航
没有帐号? 注册

发新话题 回复该主题

【大猪蹄子】用按键精灵爬取网络免费小说 [复制链接]

1#
点击关闭鉴定图章
大家好,我是大猪蹄子,闲着无聊,发个按键爬取网络上免费小说的教程,没用正则,变量名字也简洁易懂,方便新手学习,按键能做的事情还是很多的,希望按键越来越好,bug越来越少.话不多说,源码奉上.==============================源码=====================================
  1. 网页 = "https://www.xbiquge.la" : 完整网页 = 网页 & "/32/32522/"
  2. 原网页源码 = 网页_获取网页源文件(完整网页)
  3. 保存位置 = "C:\Users\Administrator\Desktop\小说爬取\"
  4. If Plugin.File.IsFileExist(保存位置) = false Then
  5. Call Plugin.File.CreateFolder(保存位置)
  6. TracePrint "创建小说文件夹"
  7. End If
  8. //Plugin.File.WriteFileEx "C:\Users\Administrator\Desktop\百度.txt", 原网页源码
  9. 开始位置 = 1
  10. If 原网页源码 <> "" Then
  11. Do
  12. 内容 = 取中间文本(原网页源码, "<dd><a href='", "' >第", 开始位置,1)
  13. 内容 = Replace(内容, "<dd><a href='", "")
  14. If 内容 <> "" Then
  15. // TracePrint "网址" & 网页 & 内容
  16. 获取章节正文 网页 & 内容
  17. Else
  18. TracePrint "内容为空,停止" & time : Exit Do
  19. End If
  20. Loop
  21. End If
  22. Function 获取章节正文(网址)
  23. For 20
  24. 没处理网页源码 = 网页_获取网页源文件(网址)
  25. //Plugin.File.WriteFileEx "C:\Users\Administrator\Desktop\百度2.txt", 没处理网页源码
  26. If 没处理网页源码 <> "" Then
  27. 章节 = 取中间文本(没处理网页源码, " <h1>全部章节", "</h1>", 1,0)
  28. 章节 = Replace(章节, "<h1>", "") : 章节 = Replace(章节, "全部章节", "")
  29. 文章内容 = 取中间文本(没处理网页源码, " ", "<p><a href=", 1,0)
  30. 文章内容 = Replace(文章内容, "<br /> ", "") '删除正文中的多余符号
  31. 文章内容 = Replace(文章内容, "<br />", "") '删除正文中的多余符号
  32. 文章内容 = Replace(文章内容, " ", "") '删除正文中的多余符号
  33. If 文章内容 <> "" Then
  34. Plugin.File.WriteFileEx 保存位置 & 章节 & ".txt", 章节
  35. Plugin.File.WriteFileEx 保存位置 & 章节 & ".txt", 文章内容
  36. TracePrint "爬取章节 - " & 章节 : Exit Function
  37. End If
  38. End If
  39. Next
  40. TracePrint "内容为空,爬取结束 " & 网址 : ExitScript
  41. End Function
  42. Function 取中间文本(原文本, 左边文本, 右边文本, 左边位置,赋值1)
  43. Dim 返回长度, 开始, 结束
  44. 取中间文本=""
  45. 开始 = InStr(左边位置, 原文本, 左边文本, 1)
  46. If 开始 > 0 Then
  47. 结束 = InStr(开始, 原文本, 右边文本, 1)
  48. If 结束 > 开始 Then
  49. 返回长度 = 结束 - 开始
  50. 取中间文本 = mid(原文本, 开始, 返回长度)
  51. If 赋值1 = 1 Then 开始位置 = 结束
  52. Else
  53. TracePrint "取中间文本错误,开始" & 开始 & "结束" & 结束
  54. End If
  55. End If
  56. End Function
  57. Function 网页_获取网页源文件(网址)
  58. '此函数可以模拟成真实访问
  59. Set xmlHttp = CreateObject("Microsoft.XMLHTTP")
  60. xmlHttp.Open "Get", 网址, False
  61. xmlHttp.Send
  62. 网页_获取网页源文件 = xmlHttp.ResponseText
  63. Set xmlHttp = Nothing
  64. End Function
复制代码
===================效果图========================


点评

果壳王子  恭喜获得小编勋章、教程达人勋章  发表于 2021/11/19 10:25:59

    已有1评分我要评分查看所有评分

    本主题由 超级版主 瑞祥幽冥狼 于 2022/1/25 11:09:58 执行 忽略帖子 操作
    2#

    谢谢管理

    3#

    啊 学习了学习了

    承接各类游戏脚本制作,post,手游,端游,办公,自动化

    有偿解决任何按键基础问题(可远程讲解、教会为止)

    如果我的回答能帮助了你,大家可以加个好友互相了解
    QQ : 262832680
    4#

    有点意思

    5#

    哇 哪个牛逼印章怎么弄的 真NB

    喜欢学习
    6#

    学习了,真NB,

    7#

    该用户帖子内容已被屏蔽

    8#

    该用户帖子内容已被屏蔽

    9#

    该用户帖子内容已被屏蔽

    10#

    该用户帖子内容已被屏蔽

    11#

    回复 1楼aaron8127的帖子

    高手,学习学习

    发新话题 回复该主题