特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

糗事百科的爬虫源码

来源：互联网收集：自由互联发布时间：2021-07-03

JS爬虫源码，实现了采集糗事百科上的所有段子，代码可以拷贝到神箭手云爬虫（http://www.shenjianshou.cn/）上直接跑。对爬虫感兴趣的可以加qq群讨论：342953471。 1. [代码] [JavaScript]代码

JS爬虫源码，实现了采集糗事百科上的所有段子，代码可以拷贝到神箭手云爬虫（http://www.shenjianshou.cn/）上直接跑。对爬虫感兴趣的可以加qq群讨论：342953471。

1. [代码][JavaScript]代码

var configs = {
    domains: ["www.qiushibaike.com"],
    scanUrls: ["http://www.qiushibaike.com/"],
    contentUrlRegexes: ["http://www\\.qiushibaike\\.com/article/\\d+"],
    fields: [
        {
            name: "content",
            selector: "//*[@id='single-next-link']",
            required: true
        },
        {
            name: "author",
            selector: "//div[contains(@class,'author')]//h2"
        }
    ]
};
var crawler = new Crawler(configs);
crawler.start();

上一篇：大众点评网的爬虫实现源码
下一篇：淘宝商品数据采集爬虫源码

糗事百科的爬虫源码

1. [代码][JavaScript]代码

相关文章