PythonでElementTreeを使ってXMLファイルを読み込む方法

XMLを扱うにはいくつかのライブラリが用意されていますが、今回はPythonの標準ライブラリにあるElementTreeを使ってXMLファイルを読み込む方法について説明します。

XMLファイルを読み込む

今回は以下のようなsample.xmlを読み込んでみます。

<fruits>
    <item001>apple</item001>
    <item002>orange</item002>
    <item003>banana</item003>
</fruits>

ElementTreeはXMLを操作するためのライブラリで、import文で読み込むことによって利用することができます。

# -*- coding: utf-8 -*-

from xml.etree import ElementTree

x = 'sample.xml'               # 読み込むxmlファイルのパスを変数に記憶させる
tree = ElementTree.parse(x)    # xmlファイルを読み込む
root = tree.getroot()          # ルートを取得する
print root.tag                 # fruit
print root.findtext('item002') # orange

ファイルの読み込みには、ElementTree.parse()を使います。引数には読み込むXMLファイルのパスを指定します。

getroot()を使ってルート要素を取得できます。ルートから辿って、子要素にアクセスすることができます。上のプログラムでは、root.tag()で読み込んだXMLのルートノードのタグ名を表示し、root.findtext()で指定したタグのテキスト内容を表示しています。


イベント

2017/12/05(火)
Design Thinking Square

購読

平日・毎朝更新中