当前位置: 首页 > news >正文

优秀企业网站建设价格seo对各类网站的作用

优秀企业网站建设价格,seo对各类网站的作用,正规的培训行业网站开发,基于html5开发的网站开发使用场景:半自动,一次性少量数据采集需求在工作中还是不少遇到的,无论使用模拟的方式,或者破解都不太划算。其实这种需求,使用半自动爬虫是最简单的。不需要考虑网站反爬虫的问题,因为你使用的就是真实的浏…

使用场景:半自动,一次性少量数据采集需求在工作中还是不少遇到的,无论使用模拟的方式,或者破解都不太划算。其实这种需求,使用半自动爬虫是最简单的。不需要考虑网站反爬虫的问题,因为你使用的就是真实的浏览器,不会通过代码来发起请求

  1. 从chrome获取har包
    首先打开浏览器的开发者工具,勾选上Perserve log复选框,如下图所示:
    在这里插入图片描述

然后刷新页面。注意一定要先打开开发者工具再刷新页面,顺序不能搞反了。接下来,你就正常往下滚动页面或者点击翻页按钮,滚到你不想滚为止。此时开发者工具里面已经有很多数据包了。如下图所示:

在这里插入图片描述

在任何一个数据包上面右键,选择Save all as HAR with content。就会把当前页面的所有数据包全部合并到一个 har 文件里面,如下图所示:
在这里插入图片描述
备注:如果遇到需要来回跳转的页面,可以使用抓包工具获取har,这个自己搜吧

  1. 示例代码,只需要按提示修改相关变量和函数即可运行
import json
import csv
import jsonpath
from haralyzer import HarParser
#功能: 解决一次性数据量不大的数据采集需求,通过chrome获取所有请求包,打包成har包,然后解析存储# har包获取方法:
# 1、打开chrome的检查,
# 2:勾选Network中的Preserve log,
# 3:刷新当前网页,点击下一页或者滑动,直到自己需要的数据加载完,
# 4: 点击右上角的下载图标,或者是选择任意一个请求,右击,点击’Save all as HAR with content‘# 代码使用方法: 按照需要修改har_file_path, url_keyword, csv_title_title三个变量,以及解析函数parser_har, 其他都不需要动def save_csv(title_list, data_list):'''保存数据到csv文件中'''data_list.insert(0, title_list)with open('result_csv.csv', 'w', encoding='utf-8-sig', newline='') as csvFile:writer = csv.writer(csvFile)# 写入多行用writerowswriter.writerows(data_list)print('组合数据运行结束, 结果文件result_csv.csv位于当前目录下')def read_har_file(har_file_path):'''读取指定路径的har文件'''har_parser = HarParser.from_file(har_file_path)data = har_parser.har_dataentries = data['entries']for entry in entries:yield entrydef crawle_har_to_csv(har_file_path, url_keyword, csv_title_title):'''主启动函数'''all_result_list = []for entry in read_har_file(har_file_path):url = entry['request']['url']if url.find(url_keyword) > -1:print(url)body = entry['response']if 'text' in body['content']:content = body['content']['text']info = json.loads(content)if sub_result_list := parser_har(info):all_result_list.extend(sub_result_list)save_csv(csv_title_title, all_result_list)#需要修改
def parser_har(json_content):'''解析har中的相关数据,这个需要根据具体返回内容进行修改'''result_list = []data_list = jsonpath.jsonpath(json_content, '$.data.content.offerList.*')if data_list:for offer in data_list:result_list.append([offer['subject'], offer['price']])return result_listelse:print('parser_har函数没有获取指定的data_list')return []if __name__ == '__main__':#har包地址, 需修改har_file_path = r'C:\Users\men\Desktop\milishipin.1688.com.har'#择选的请求唯一关键词,用来筛选关键词, 需修改url_keyword = 'mtop.1688.shop.data.get/1.0'#csv文件中的title列表, 需修改csv_title_title = ['名称', '价格']crawle_har_to_csv(har_file_path, url_keyword, csv_title_title)
http://www.hengruixuexiao.com/news/34017.html

相关文章:

  • 政府 网站建设自查报告怎么做网站赚钱
  • 用php做视频网站有哪些seo关键字怎么优化
  • 网站建设最好的公司足球世界排名前十
  • 教外国人做中国菜网站宣传推广方案范文
  • 免费做网站的公司广告推广怎么做最有效
  • 用vultr做网站石家庄seo顾问
  • 如何做好一名销售嘉兴百度快照优化排名
  • 厂房出租做推广什么网站好长春seo顾问
  • 做电影网站如何推广百度竞价包年推广公司
  • 网站备案后应该做什么营销培训讲师
  • 自己的公司怎么做网站磁力库
  • 中国建筑app下载官网seo优化专员招聘
  • 企业网站备案费用百度站长平台登录
  • 一站式做网站多少钱b2b网站大全免费推广
  • 成都做一个小企业网站需要多少钱百度搜索排名推广
  • 网站打开的速度很慢应该怎么做软文代写新闻稿
  • 怎么在新建网站上做分享代码电商平台排行榜
  • 建站好用的软件企业新闻稿发布平台
  • 网站建设优化服务器5118关键词查询工具
  • 用香港服务器建网站做微商商品推广软文范例300字
  • 专线网站建设百度里面的站长工具怎么取消
  • 网站后台上传文章格式百度竞价推广什么意思
  • 施工企业破产质保seo搜索引擎优化营销案例
  • 企业网站备案建设方案策划书排名优化公司口碑哪家好
  • 长沙专业网站优化定制宣传软文怎么写
  • 建设项目银行网站企业网站建设方案论文
  • 包头做网站公司广告资源网
  • 中文html5网站欣赏宁波seo优化项目
  • 做竞价的网站如何做企业网站
  • 模板网站哪家好网站策划方案书