半角スペースや全角スペースのマッチングは正規表現ではどのように記述すればよいのでしょうか。今回は具体的な記述方法について詳しく説明します。
スペースを表す正規表現
半角スペース、全角スペース、空白文字の正規表現の記述方法について説明します。
半角スペース
半角スペースは通常の文字と同様に扱うことができます。たとえば、メタ文字と組み合わせて「 +」のように記述することも可能です。この正規表現は空白文字の1回以上の繰り返しを意味します。
全角スペース
全角スペースもまた漢字やひらがななどの全角文字と同様に文字として扱われます。そのため、前述の例と同様に「 +」などと記述すれば検索が可能です。
空白文字の場合
空白文字とは「半角スペース・タブ文字・改行・改ページ」のことを意味します。正規表現に「\s」を指定するとすべての空白文字にマッチします。ただし、全角スペースは含まれないので注意が必要です(※文字コードがUTF-8の場合はマッチします)。
また、「\S」のようにSを大文字で指定すると逆に空白文字以外にマッチします。
半角・全角スペース
メタ文字と組み合わせて「( | )」と記述すると半角スペースまたは全角スペースでマッチングを行うことができます。「(\s| )」のように空白文字と全角スペースを組み合わせることで、空白文字と全角スペースにマッチする正規表現を記述することができます。
まとめ
半角スペースも全角スペースもエスケープの必要はないので、アルファベットや数字などの文字と同じように扱うことができます。また、空白文字を意味する正規表現「\s」は、便利ですのでぜひ覚えておきましょう。