From: "NARUSE, Yui" Date: 2009-10-06T14:19:32+09:00 Subject: [ruby-dev:39438] Re: [Bug #1787] URI ライブラリの正規表現パターン 成瀬です。 [[:alnum:]] のような、POSIX 文字クラスは、先日の話では、 以下の通り Unicode 準拠とするという話になりました。 2009/08/16 23:09, Yukihiro Matsumoto wrote: > In message "Re: [ruby-dev:39088] [Bug #1787] URI ライブラリの正規表現パターン" > on Sun, 16 Aug 2009 22:46:45 +0900, Yui NARUSE writes: > > |POSIX文字クラスはどうします?今はUnicodeの場合はUnicode意識になっていますが >まつもとさん > > [[:alnum:]]とかですか。Unicode意識でよいんじゃないでしょうか。 一方で、Perl 5.11.0 でもこのスレッドと同旨の変更を行っているんですが、 こちらでは POSIX もオリジナルの定義に戻っています。 というわけで、Perl 5.11 に合わせませて、ASCII の範囲のみにしませんか。 参考: POSIX Esc Class New-Property ! Old-Property ----------------------------------------------+------------- alnum [0-9A-Za-z] IsPosixAlnum ! IsAlnum alpha [A-Za-z] IsPosixAlpha ! IsAlpha ascii [\000-\177] IsASCII = IsASCII blank [\011 ] IsPosixBlank ! cntrl [\0-\37\177] IsPosixCntrl ! IsCntrl digit \d [0-9] IsPosixDigit ! IsDigit graph [!-~] IsPosixGraph ! IsGraph lower [a-z] IsPosixLower ! IsLower print [ -~] IsPosixPrint ! IsPrint punct [!-/:-@[-`{-~] IsPosixPunct ! IsPunct space [\11-\15 ] IsPosixSpace ! IsSpace \s [\11\12\14\15 ] IsPerlSpace ! IsSpacePerl upper [A-Z] IsPosixUpper ! IsUpper word \w [0-9A-Z_a-z] IsPerlWord ! IsWord xdigit [0-9A-Fa-f] IsXDigit = IsXDigit http://cpansearch.perl.org/src/JESSE/perl-5.11.0/pod/perl5110delta.pod -- NARUSE, Yui