[ruby-list:49463] Re: 正規表現の文字クラス[:alpha:]のマルチバイトキャラクタに対する挙動について

From: Nakamatsu Shinji <snaka.gml@...>
Date: 2013-06-11 17:05:02 UTC
List: ruby-list #49463
5.5 さん、NARUSE さん

詳しい解説ありがとうございました。
おかげ様で正規表現において[:alnum:](のような POSIX bracket expression)に対して
マッチする文字が検査対象の文字列のエンコーディングによって全然異なる仕様である
ということが理解できました。

個人的にはUnicode文字列に対する POSIX bracket expression の挙動はあまり好ましくない
ので避けるのが良いと思いました。

ありがとうございました。



2013年6月9日 23:12 5.5 <5.5@moji.gr.jp>:

> 5.5 です。
>
> (13/06/09 22:50), NARUSE, Yui wrote:
> > 一応、Rubyの正規表現は https://github.com/ruby/ruby/blob/trunk/doc/re.rdocに書いてある……はずです。
>
> おお,詳しいですね。実行効率の章なんかもある。
>
> > 抜けもれ等ありましたら指摘頂ければ誰かが取り込むと思います。
>
> ぱっと見ただけでも,\P{ } が抜けています。
> …って,ここに書くんじゃなくて,GitHub に書かないといけないんです
> よね。
> …って,Issues 無いし!
>
> --
> 5.5@moji.gr.jp
>
>


-- 
snaka
http://d.hatena.ne.jp/snaka72/
http://iddy.jp/profile/snaka/

In This Thread

Prev Next