正規表現リファレンス |
はじめに |
目次 |
クイックリファレンス |
文字 |
基本機能 |
文字クラス |
短縮記法 |
アンカー |
単語境界 |
量指定子 |
Unicode |
キャプチャグループと後方参照 |
名前付きグループと後方参照 |
特殊グループ |
モード修飾子 |
再帰とバランスグループ |
置換リファレンス |
文字 |
一致したテキストと後方参照 |
コンテキストと大文字小文字変換 |
条件分岐 |
このサイトの詳細 |
はじめに |
正規表現クイックスタート |
正規表現チュートリアル |
置換文字列チュートリアル |
アプリケーションと言語 |
正規表現の例 |
正規表現リファレンス |
置換文字列リファレンス |
書籍レビュー |
印刷可能なPDF |
このサイトについて |
RSSフィードとブログ |
このリファレンスページでは、文字クラス以外で使用されるUnicodeトークンの機能について説明します。\Xを除くすべては、文字クラス内でも使用できます。文字クラス内では、これらのトークンは通常一致する文字を文字クラスに追加します。
機能 | 構文 | 説明 | 例 | JGsoft | .NET | Java | Perl | PCRE | PCRE2 | PHP | Delphi | R | JavaScript | VBScript | XRegExp | Python | Ruby | std::regex | Boost | Tcl ARE | POSIX BRE | POSIX ERE | GNU BRE | GNU ERE | Oracle | XML | XPath |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
書記素 | \X | \X 単一のUnicode書記素に一致します。結合文字を使用して単一のコードポイントまたは複数のコードポイントとしてエンコードされているかどうかは関係ありません。書記素は、日常的な「文字」の概念に最もよく似ています。 |
\X一致するàU+0061 U+0300としてエンコードされた、àU+00E0としてエンコードされた、©など。 | はい | いいえ | 9 | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | いいえ | いいえ | 2.0 | いいえ | ECMA 拡張 egrep awk | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
コードポイント | \uFFFFFFFFは4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \u00E0一致するàU+00E0のみとしてエンコードされます。\u00A9一致する© | はい | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい | はい | 3.3 2.4文字列 | 1.9 | ECMA | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
コードポイント | \u{FFFF}FFFFは1〜4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \u{E0}一致するàU+00E0のみとしてエンコードされます。\u{A9}一致する© | V2 | いいえ | いいえ | いいえ | いいえ | いいえ | 7.0.0文字列 | いいえ | いいえ | いいえ | いいえ | 3 | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
コードポイント | \xFFFFFFFFは4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \x00E0一致するàU+00E0のみとしてエンコードされます。\x00A9一致する© | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | 文字列 | いいえ | 8.4–8.5 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
コードポイント | \x{FFFF}FFFFは1〜4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \x{E0}一致するàU+00E0のみとしてエンコードされます。\x{A9}一致する© | はい | いいえ | 7 | はい | はい | はい | はい | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | ECMA 拡張 egrep awk | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeカテゴリ | \pLLはUnicodeカテゴリ | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \pL一致するàU+00E0としてエンコードされた;\pS一致する© | はい | いいえ | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | 3 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeカテゴリ | \PLLはUnicodeカテゴリ | 指定されたUnicodeカテゴリに*ない*単一のUnicodeコードポイントに一致します。 | \PS一致するàU+00E0としてエンコードされた;\PL一致する© | はい | いいえ | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | 3 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeカテゴリ | \p{L}LはUnicodeカテゴリ | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{L}一致するàU+00E0としてエンコードされた;\p{S}一致する© | はい | はい | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい |
Unicodeカテゴリ | \p{IsL}LはUnicodeカテゴリ | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{IsL}一致するàU+00E0としてエンコードされた;\p{IsS}一致する© | はい | いいえ | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeカテゴリ | \p{Category} | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{Letter}一致するàU+00E0としてエンコードされた;\p{Symbol}一致する© | はい | いいえ | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeカテゴリ | \p{IsCategory} | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{IsLetter}一致するàU+00E0としてエンコードされた;\p{IsSymbol}一致する© | はい | いいえ | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeスクリプト | \p{Script} | 指定されたUnicodeスクリプトの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのスクリプトの一部です。スクリプトには、割り当てられていないコードポイントは含まれません。 | \p{Greek}一致するΩ | はい | いいえ | いいえ | はい | 6.5 | はい | 5.1.3 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeスクリプト | \p{IsScript} | 指定されたUnicodeスクリプトの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのスクリプトの一部です。スクリプトには、割り当てられていないコードポイントは含まれません。 | \p{IsGreek}一致するΩ | はい | いいえ | 7 | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeブロック | \p{Block} | 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 | \p{Arrows}U+2190からU+21FFまでのコードポイントのいずれかと一致します(←から⇿) | はい | いいえ | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeブロック | まで) | 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 | \p{InBlock}U+2190からU+21FFまでのコードポイントのいずれかと一致します(←から⇿) | はい | いいえ | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | \p{InArrows} | いいえ | 2.0 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeブロック | 2–4 | 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 | \p{IsBlock}U+2190からU+21FFまでのコードポイントのいずれかと一致します(←から⇿) | はい | はい | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい |
\p{IsArrows} | 否定されたUnicodeプロパティ | \P{Property} | \P{L}一致する© | はい | はい | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | ECMA 拡張 egrep awk | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい |
\p{IsArrows} | \p{^Property} | \P{Property} | \p{^L}一致する© | はい | いいえ | いいえ | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
Unicodeプロパティ | \P{^Property} | 指定されたプロパティ(カテゴリ、スクリプト、またはブロック)を*持つ*単一のUnicodeコードポイントに一致します。二重否定は肯定として解釈されます。 | \P{^L}一致するq | V2 | いいえ | いいえ | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | いいえ | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
機能 | 構文 | 説明 | 例 | JGsoft | .NET | Java | Perl | PCRE | PCRE2 | PHP | Delphi | R | JavaScript | VBScript | XRegExp | Python | Ruby | std::regex | Boost | Tcl ARE | POSIX BRE | POSIX ERE | GNU BRE | GNU ERE | Oracle | XML | XPath |
| クイックスタート | チュートリアル | ツールと言語 | 例 | リファレンス | 書籍レビュー |
| はじめに | 目次 | クイックリファレンス | 文字 | 基本機能 | 文字クラス | 短縮記法 | アンカー | 単語境界 | 量指定子 | Unicode | キャプチャグループと後方参照 | 名前付きグループと後方参照 | 特殊グループ | モード修飾子 | 再帰とバランスグループ |
| 文字 | 一致したテキストと後方参照 | コンテキストと大文字小文字変換 | 条件分岐 |
ページURL: https://regular-expressions.dokyumento.jp/refunicode.html
ページ最終更新日: 2021年8月13日
サイト最終更新日: 2024年3月15日
著作権 © 2003-2024 Jan Goyvaerts. All rights reserved.