博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
scrapy/w3lib · GitHub
阅读量:5739 次
发布时间:2019-06-18

本文共 712 字,大约阅读时间需要 2 分钟。

w3lib

Overview

This is a Python library of web-related functions, such as:

  • remove comments, or tags from HTML snippets
  • extract base url from HTML snippets
  • translate entites on HTML strings
  • encoding mulitpart/form-data
  • convert raw HTTP headers to dicts and vice-versa
  • construct HTTP auth header
  • converting HTML pages to unicode
  • RFC-compliant url joining
  • sanitize urls (like browsers do)
  • extract arguments from urls

Modules

The w3lib package consists of four modules:

  • w3lib.url - functions for working with URLs
  • w3lib.html - functions for working with HTML
  • w3lib.http - functions for working with HTTP
  • w3lib.encoding - functions for working with character encoding
  • w3lib.form - functions for working with web forms

转载地址:http://esfzx.baihongyu.com/

你可能感兴趣的文章
python重试装饰器的简单实现
查看>>
实现一个简单的轮询算法
查看>>
MYSQL学习心得(十) 自定义存储过程和函数
查看>>
c# 获取网站验证码图片
查看>>
debian安装node-js环境
查看>>
js 限制输入框只能输入带有两位小数的数字
查看>>
C#继承 多态
查看>>
Java基础 面向对象的详解
查看>>
C# 循环语句
查看>>
AngularJS 模型
查看>>
IOC解耦-面向接口编程的优点
查看>>
2019.5.13 区块链论文翻译
查看>>
9、进程,线程
查看>>
表单异步提交
查看>>
Fiddler 抓包工具总结
查看>>
python爬虫-初步认识
查看>>
快速切换DNS的方法,含3个国外免费的安全DNS服务(GoogleDNS/OpenDSN/NortonDNS)
查看>>
C++ 标准库类型-String,Vector and Bitset
查看>>
Unity Animator动画状态机 深入理解(二)IK控制
查看>>
JAVA基础-覆盖方法
查看>>