脚本宝典收集整理的这篇文章主要介绍了node.js使用cheerio抓取网页数据,脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
/* * @Description: 使用cheerio抓取网页数据 * @Version: 1.0 * @Autor: Nanke_南柯 * @Date: 2021-11-02 18:59:35 * @LastEditors: Nanke_南柯 * @LastEditTime: 2021-11-02 19:31:44 */ // npm i cheerio -S 安装html 解析html非常方便,就像在浏览器中使用jquery一样 const http = require("http") const https = require("https") const cheerio =require("cheerio") let filterData = (data)=>{ // console.log('整个页面',data); const $ = cheerio.load(data) $('.typography-body-reduced').each((index,el)=>{ console.log('通过cheerio插件获取我们想要的dom的索引:',index); console.log('通过cheerio插件获取我们想要的dom:',$(el).text()); }) } const server = http.createServer((req,res)=>{ let data = '' https.get('https://www.apple.com.cn/iphone/',(result)=>{ result.on('data',(chunk)=>{ data+=chunk }) result.on('end',()=>{ filterData(data) }) }) }) server.listen(5080,()=>{ console.log('localhost:5080 Listen...'); })
hotnode index.js后浏览器访问http://localhost:5080/
可以看到 利用cheerio插件我们可以直接筛选我们爬取到整个网页的内容进行过滤,得到我们想要的内容,如图
cheerio二次中文翻译大家可以看这篇
https://www.jianshu.com/p/629a81b4e013
以上是脚本宝典为你收集整理的node.js使用cheerio抓取网页数据全部内容,希望文章能够帮你解决node.js使用cheerio抓取网页数据所遇到的问题。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。