Pythonのurllib
を使うと簡単にURLをparseすることができます。
>>> import urllib.parse
>>> urlparse = urllib.parse.urlparse('http://www.example.com/python/?q1=example&q2=10')
>>> urlparse
ParseResult(scheme='http', netloc='www.example.com', path='/python/', params='', query='q1=example&q2=10', fragment='')
>>> urlparse.scheme
'http'
>>> urlparse.netloc
'www.example.com'
>>> urlparse.query
'q1=example&q2=10'
更に、query
をparseしたい場合はparse_qs
を使うと便利です。
>>> urllib.parse.parse_qs(urlparse.query)
{'q2': ['10'], 'q1': ['example']}
リンク
urllib.parse — Parse URLs into components — Python 3.7.3 documentation
https://docs.python.org/3/library/urllib.parse.html