python urllib.parse的常用方法有哪些
1.urlparse()方法
urlparse()方法用于将字符串解析为url,并返回ParseResult对象,该对象包含url的各个部分,如scheme、netloc、path等。它接受一个可选的参数,用于指定url的组成部分,例如:
from urllib.parse import urlparse
url = 'http://www.example.com/path/file?k1=v1&k2=v2#frag'
result = urlparse(url)
print(result)
输出结果:
ParseResult(scheme='http', netloc='www.example.com', path='/path/file', params='', query='k1=v1&k2=v2', fragment='frag')
2.urlunparse()方法
urlunparse()方法用于将ParseResult对象转换为url,它接受一个可选的参数,用于指定url的组成部分,例如:
from urllib.parse import urlunparse
result = ('http', 'www.example.com', '/path/file', '', 'k1=v1&k2=v2', 'frag')
url = urlunparse(result)
print(url)
输出结果:
http://www.example.com/path/file?k1=v1&k2=v2#frag
3.urljoin()方法
urljoin()方法用于将基础url和相对url拼接成完整的url,它接受两个参数:baseurl和relativeurl,例如:
from urllib.parse import urljoin
baseurl = 'http://www.example.com/path/'
relativeurl = 'file?k1=v1&k2=v2#frag'
url = urljoin(baseurl, relativeurl)
print(url)
输出结果:
http://www.example.com/path/file?k1=v1&k2=v2#frag
4.urlencode()方法
urlencode()方法用于将字典转换为url参数形式的字符串,例如:
from urllib.parse import urlencode
data = {'k1': 'v1', 'k2': 'v2'}
params = urlencode(data)
print(params)
输出结果:
k1=v1&k2=v2