XMLを扱うにはいくつかのライブラリが用意されていますが、今回はPythonの標準ライブラリにあるElementTreeを使ってXMLファイルを読み込む方法について説明します。
XMLファイルを読み込む
今回は以下のようなsample.xmlを読み込んでみます。
1 2 3 4 5 |
<fruits> <item001>apple</item001> <item002>orange</item002> <item003>banana</item003> </fruits> |
ElementTreeはXMLを操作するためのライブラリで、import文で読み込むことによって利用することができます。
1 2 3 4 5 6 7 8 9 |
# -*- coding: utf-8 -*- from xml.etree import ElementTree x = 'sample.xml' # 読み込むxmlファイルのパスを変数に記憶させる tree = ElementTree.parse(x) # xmlファイルを読み込む root = tree.getroot() # ルートを取得する print root.tag # fruit print root.findtext('item002') # orange |
ファイルの読み込みには、ElementTree.parse()を使います。引数には読み込むXMLファイルのパスを指定します。
getroot()を使ってルート要素を取得できます。ルートから辿って、子要素にアクセスすることができます。上のプログラムでは、root.tag()で読み込んだXMLのルートノードのタグ名を表示し、root.findtext()で指定したタグのテキスト内容を表示しています。