クイックスタート
チュートリアル
ツールと言語
リファレンス
書籍レビュー
正規表現リファレンス
はじめに
目次
クイックリファレンス
文字
基本機能
文字クラス
短縮記法
アンカー
単語境界
量指定子
Unicode
キャプチャグループと後方参照
名前付きグループと後方参照
特殊グループ
モード修飾子
再帰とバランスグループ
置換リファレンス
文字
一致したテキストと後方参照
コンテキストと大文字小文字変換
条件分岐
このサイトの詳細
はじめに
正規表現クイックスタート
正規表現チュートリアル
置換文字列チュートリアル
アプリケーションと言語
正規表現の例
正規表現リファレンス
置換文字列リファレンス
書籍レビュー
印刷可能なPDF
このサイトについて
RSSフィードとブログ
RegexBuddy—Better than a regular expression reference!

正規表現Unicode構文リファレンス

このリファレンスページでは、文字クラス以外で使用されるUnicodeトークンの機能について説明します。\Xを除くすべては、文字クラス内でも使用できます。文字クラス内では、これらのトークンは通常一致する文字を文字クラスに追加します。

機能構文説明JGsoft .NET Java Perl PCRE PCRE2 PHP Delphi R JavaScript VBScript XRegExp Python Ruby std::regex Boost Tcl ARE POSIX BRE POSIX ERE GNU BRE GNU ERE Oracle XML XPath
書記素 \X \X

単一のUnicode書記素に一致します。結合文字を使用して単一のコードポイントまたは複数のコードポイントとしてエンコードされているかどうかは関係ありません。書記素は、日常的な「文字」の概念に最もよく似ています。

\X一致するàU+0061 U+0300としてエンコードされた、àU+00E0としてエンコードされた、©など。 はいいいえ9はい5.0はい5.0.5はいはいいいえいいえいいえいいえ2.0いいえECMA
拡張
egrep
awk
いいえいいえいいえいいえいいえいいえいいえいいえ
コードポイント \uFFFFFFFFは4桁の16進数 特定のUnicodeコードポイントに一致します。 \u00E0一致するàU+00E0のみとしてエンコードされます。\u00A9一致する© はいはいはいいいえいいえいいえいいえいいえいいえはいはいはい3.3
2.4文字列
1.9ECMAいいえはいいいえいいえいいえいいえいいえいいえいいえ
コードポイント \u{FFFF}FFFFは1〜4桁の16進数 特定のUnicodeコードポイントに一致します。 \u{E0}一致するàU+00E0のみとしてエンコードされます。\u{A9}一致する© V2いいえいいえいいえいいえいいえ7.0.0文字列いいえいいえいいえいいえ3いいえ1.9いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
コードポイント \xFFFFFFFFは4桁の16進数 特定のUnicodeコードポイントに一致します。 \x00E0一致するàU+00E0のみとしてエンコードされます。\x00A9一致する© いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ文字列いいえ8.4–8.5いいえいいえいいえいいえいいえいいえいいえ
コードポイント \x{FFFF}FFFFは1〜4桁の16進数 特定のUnicodeコードポイントに一致します。 \x{E0}一致するàU+00E0のみとしてエンコードされます。\x{A9}一致する© はいいいえ7はいはいはいはいはいはいいいえいいえいいえいいえいいえいいえECMA
拡張
egrep
awk
いいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeカテゴリ \pLLはUnicodeカテゴリ 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 \pL一致するàU+00E0としてエンコードされた;\pS一致する© はいいいえはいはい5.0はい5.0.5はいはいいいえいいえ3いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeカテゴリ \PLLはUnicodeカテゴリ 指定されたUnicodeカテゴリに*ない*単一のUnicodeコードポイントに一致します。 \PS一致するàU+00E0としてエンコードされた;\PL一致する© はいいいえはいはい5.0はい5.0.5はいはいいいえいいえ3いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeカテゴリ \p{L}LはUnicodeカテゴリ 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 \p{L}一致するàU+00E0としてエンコードされた;\p{S}一致する© はいはいはいはい5.0はい5.0.5はいはいいいえいいえはいいいえ1.9いいえいいえいいえいいえいいえいいえいいえいいえはいはい
Unicodeカテゴリ \p{IsL}LはUnicodeカテゴリ 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 \p{IsL}一致するàU+00E0としてエンコードされた;\p{IsS}一致する© はいいいえはいはいいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeカテゴリ \p{Category} 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 \p{Letter}一致するàU+00E0としてエンコードされた;\p{Symbol}一致する© はいいいえいいえはいいいえいいえいいえいいえいいえいいえいいえはいいいえ1.9いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeカテゴリ \p{IsCategory} 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 \p{IsLetter}一致するàU+00E0としてエンコードされた;\p{IsSymbol}一致する© はいいいえいいえはいいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeスクリプト \p{Script} 指定されたUnicodeスクリプトの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのスクリプトの一部です。スクリプトには、割り当てられていないコードポイントは含まれません。 \p{Greek}一致するΩ はいいいえいいえはい6.5はい5.1.3はいはいいいえいいえはいいいえ1.9いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeスクリプト \p{IsScript} 指定されたUnicodeスクリプトの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのスクリプトの一部です。スクリプトには、割り当てられていないコードポイントは含まれません。 \p{IsGreek}一致するΩ はいいいえ7はいいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeブロック \p{Block} 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 \p{Arrows}U+2190からU+21FFまでのコードポイントのいずれかと一致します(から) はいいいえいいえはいいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeブロック まで) 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 \p{InBlock}U+2190からU+21FFまでのコードポイントのいずれかと一致します(から) はいいいえはいはいいいえいいえいいえいいえいいえいいえいいえ\p{InArrows}いいえ2.0いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeブロック 2–4 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 \p{IsBlock}U+2190からU+21FFまでのコードポイントのいずれかと一致します(から) はいはいいいえはいいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえはいはい
\p{IsArrows} 否定されたUnicodeプロパティ \P{Property} \P{L}一致する© はいはいはいはい5.0はい5.0.5はいはいいいえいいえはいいいえ1.9いいえECMA
拡張
egrep
awk
いいえいいえいいえいいえいいえいいえはいはい
\p{IsArrows} \p{^Property} \P{Property} \p{^L}一致する© はいいいえいいえはい5.0はい5.0.5はいはいいいえいいえはいいいえ1.9いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
Unicodeプロパティ \P{^Property} 指定されたプロパティ(カテゴリ、スクリプト、またはブロック)を*持つ*単一のUnicodeコードポイントに一致します。二重否定は肯定として解釈されます。 \P{^L}一致するq V2いいえいいえはい5.0はい5.0.5はいはいいいえいいえいいえいいえ1.9いいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
機能構文説明JGsoft .NET Java Perl PCRE PCRE2 PHP Delphi R JavaScript VBScript XRegExp Python Ruby std::regex Boost Tcl ARE POSIX BRE POSIX ERE GNU BRE GNU ERE Oracle XML XPath