| 正規表現リファレンス |
| はじめに |
| 目次 |
| クイックリファレンス |
| 文字 |
| 基本機能 |
| 文字クラス |
| 短縮記法 |
| アンカー |
| 単語境界 |
| 量指定子 |
| Unicode |
| キャプチャグループと後方参照 |
| 名前付きグループと後方参照 |
| 特殊グループ |
| モード修飾子 |
| 再帰とバランスグループ |
| 置換リファレンス |
| 文字 |
| 一致したテキストと後方参照 |
| コンテキストと大文字小文字変換 |
| 条件分岐 |
| このサイトの詳細 |
| はじめに |
| 正規表現クイックスタート |
| 正規表現チュートリアル |
| 置換文字列チュートリアル |
| アプリケーションと言語 |
| 正規表現の例 |
| 正規表現リファレンス |
| 置換文字列リファレンス |
| 書籍レビュー |
| 印刷可能なPDF |
| このサイトについて |
| RSSフィードとブログ |
このリファレンスページでは、文字クラス以外で使用されるUnicodeトークンの機能について説明します。\Xを除くすべては、文字クラス内でも使用できます。文字クラス内では、これらのトークンは通常一致する文字を文字クラスに追加します。
| 機能 | 構文 | 説明 | 例 | JGsoft | .NET | Java | Perl | PCRE | PCRE2 | PHP | Delphi | R | JavaScript | VBScript | XRegExp | Python | Ruby | std::regex | Boost | Tcl ARE | POSIX BRE | POSIX ERE | GNU BRE | GNU ERE | Oracle | XML | XPath |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 書記素 | \X | \X 単一のUnicode書記素に一致します。結合文字を使用して単一のコードポイントまたは複数のコードポイントとしてエンコードされているかどうかは関係ありません。書記素は、日常的な「文字」の概念に最もよく似ています。 |
\X一致するàU+0061 U+0300としてエンコードされた、àU+00E0としてエンコードされた、©など。 | はい | いいえ | 9 | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | いいえ | いいえ | 2.0 | いいえ | ECMA 拡張 egrep awk | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| コードポイント | \uFFFFFFFFは4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \u00E0一致するàU+00E0のみとしてエンコードされます。\u00A9一致する© | はい | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい | はい | 3.3 2.4文字列 | 1.9 | ECMA | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| コードポイント | \u{FFFF}FFFFは1〜4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \u{E0}一致するàU+00E0のみとしてエンコードされます。\u{A9}一致する© | V2 | いいえ | いいえ | いいえ | いいえ | いいえ | 7.0.0文字列 | いいえ | いいえ | いいえ | いいえ | 3 | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| コードポイント | \xFFFFFFFFは4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \x00E0一致するàU+00E0のみとしてエンコードされます。\x00A9一致する© | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | 文字列 | いいえ | 8.4–8.5 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| コードポイント | \x{FFFF}FFFFは1〜4桁の16進数 | 特定のUnicodeコードポイントに一致します。 | \x{E0}一致するàU+00E0のみとしてエンコードされます。\x{A9}一致する© | はい | いいえ | 7 | はい | はい | はい | はい | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | ECMA 拡張 egrep awk | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeカテゴリ | \pLLはUnicodeカテゴリ | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \pL一致するàU+00E0としてエンコードされた;\pS一致する© | はい | いいえ | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | 3 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeカテゴリ | \PLLはUnicodeカテゴリ | 指定されたUnicodeカテゴリに*ない*単一のUnicodeコードポイントに一致します。 | \PS一致するàU+00E0としてエンコードされた;\PL一致する© | はい | いいえ | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | 3 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeカテゴリ | \p{L}LはUnicodeカテゴリ | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{L}一致するàU+00E0としてエンコードされた;\p{S}一致する© | はい | はい | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい |
| Unicodeカテゴリ | \p{IsL}LはUnicodeカテゴリ | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{IsL}一致するàU+00E0としてエンコードされた;\p{IsS}一致する© | はい | いいえ | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeカテゴリ | \p{Category} | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{Letter}一致するàU+00E0としてエンコードされた;\p{Symbol}一致する© | はい | いいえ | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeカテゴリ | \p{IsCategory} | 指定されたUnicodeカテゴリの単一のUnicodeコードポイントに一致します。 | \p{IsLetter}一致するàU+00E0としてエンコードされた;\p{IsSymbol}一致する© | はい | いいえ | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeスクリプト | \p{Script} | 指定されたUnicodeスクリプトの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのスクリプトの一部です。スクリプトには、割り当てられていないコードポイントは含まれません。 | \p{Greek}一致するΩ | はい | いいえ | いいえ | はい | 6.5 | はい | 5.1.3 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeスクリプト | \p{IsScript} | 指定されたUnicodeスクリプトの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのスクリプトの一部です。スクリプトには、割り当てられていないコードポイントは含まれません。 | \p{IsGreek}一致するΩ | はい | いいえ | 7 | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeブロック | \p{Block} | 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 | \p{Arrows}U+2190からU+21FFまでのコードポイントのいずれかと一致します(←から⇿) | はい | いいえ | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeブロック | まで) | 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 | \p{InBlock}U+2190からU+21FFまでのコードポイントのいずれかと一致します(←から⇿) | はい | いいえ | はい | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | \p{InArrows} | いいえ | 2.0 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeブロック | 2–4 | 指定されたUnicodeブロックの一部である単一のUnicodeコードポイントに一致します。各Unicodeコードポイントは、正確に1つのブロックの一部です。ブロックには、割り当てられていないコードポイントが含まれる場合があります。 | \p{IsBlock}U+2190からU+21FFまでのコードポイントのいずれかと一致します(←から⇿) | はい | はい | いいえ | はい | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい |
| \p{IsArrows} | 否定されたUnicodeプロパティ | \P{Property} | \P{L}一致する© | はい | はい | はい | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | ECMA 拡張 egrep awk | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | はい | はい |
| \p{IsArrows} | \p{^Property} | \P{Property} | \p{^L}一致する© | はい | いいえ | いいえ | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | はい | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| Unicodeプロパティ | \P{^Property} | 指定されたプロパティ(カテゴリ、スクリプト、またはブロック)を*持つ*単一のUnicodeコードポイントに一致します。二重否定は肯定として解釈されます。 | \P{^L}一致するq | V2 | いいえ | いいえ | はい | 5.0 | はい | 5.0.5 | はい | はい | いいえ | いいえ | いいえ | いいえ | 1.9 | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ | いいえ |
| 機能 | 構文 | 説明 | 例 | JGsoft | .NET | Java | Perl | PCRE | PCRE2 | PHP | Delphi | R | JavaScript | VBScript | XRegExp | Python | Ruby | std::regex | Boost | Tcl ARE | POSIX BRE | POSIX ERE | GNU BRE | GNU ERE | Oracle | XML | XPath |
| クイックスタート | チュートリアル | ツールと言語 | 例 | リファレンス | 書籍レビュー |
| はじめに | 目次 | クイックリファレンス | 文字 | 基本機能 | 文字クラス | 短縮記法 | アンカー | 単語境界 | 量指定子 | Unicode | キャプチャグループと後方参照 | 名前付きグループと後方参照 | 特殊グループ | モード修飾子 | 再帰とバランスグループ |
| 文字 | 一致したテキストと後方参照 | コンテキストと大文字小文字変換 | 条件分岐 |
ページURL: https://regular-expressions.dokyumento.jp/refunicode.html
ページ最終更新日: 2021年8月13日
サイト最終更新日: 2024年3月15日
著作権 © 2003-2024 Jan Goyvaerts. All rights reserved.