URLで指定したファイルをWeb上から取得し、ローカルに保存する方法について説明します。Web上のファイルを扱うときは、Pythonの標準ライラブリにあるurllibモジュールを使うと便利です。
Web上のファイルをローカルディレクトリに保存する
Web上からファイルをダウンロードしローカルに保存するには、urllibモジュールのurlretrieve()を使います。urlretrieve()の書式は次の通りです。
1 |
urllib.urlretrieve('ダウンロードするファイルのURL', '保存先のパス') |
次のサンプルは、URLで指定したWeb上のファイルを読み込み、ローカルディレクトリに名前をつけて保存するサンプルプログラムです。今回はPythonの公式ドキュメントファイルを読み込んでみます。
1 2 3 4 5 6 |
# -*- coding: utf-8 -*- import urllib url = "https://docs.python.org/2.7/" # 読み込むファイルのURL urllib.urlretrieve(url, './hoge/python.html') # 指定したURLのファイルを指定したローカルパスに名前を付けて保存する |
上のプログラムを実行すると、hogeディレクトリにpython.htmlというファイルが作成されます。また、urlretrieve()の第二引数を省略すると、自動的に一時ファイル置き場にファイルが作成され、ダウンロードしたファイルは適当な名前で保存されます。