Python の標準ライブラリの urllib.parse.urlparse 関数を使用すると、URL 形式の文字列から ParseResult
オブジェクトを生成することができます。
ParseResult
オブジェクトの各プロパティを参照することで、URL の各パート(スキーム、ドメイン、パス、クエリ文字列など)を取り出すことができます。
from urllib.parse import urlparse
url = "https://example.com/p/abcdefg/?foo=1&bar=2#top"
parsed_url = urlparse(url) # ParseResult オブジェクトを生成する
print(parsed_url.scheme) # => https
print(parsed_url.netloc) # => example.com
print(parsed_url.path) # => /p/abcdefg/
print(parsed_url.query) # => foo=1&bar=2
print(parsed_url.fragment) # => top