PythonでURLのparse

Pythonのurllibを使うと簡単にURLをparseすることができます。

>>> import urllib.parse
>>> urlparse = urllib.parse.urlparse('http://www.example.com/python/?q1=example&q2=10')
>>> urlparse
ParseResult(scheme='http', netloc='www.example.com', path='/python/', params='', query='q1=example&q2=10', fragment='')
>>> urlparse.scheme
'http'
>>> urlparse.netloc
'www.example.com'
>>> urlparse.query
'q1=example&q2=10'

更に、queryをparseしたい場合はparse_qsを使うと便利です。

>>> urllib.parse.parse_qs(urlparse.query)
{'q2': ['10'], 'q1': ['example']}

リンク

urllib.parse — Parse URLs into components — Python 3.7.3 documentation
https://docs.python.org/3/library/urllib.parse.html

コメントを残す

メールアドレスが公開されることはありません。