ruby-dev

成瀬です。

Tanaka Akira wrote:
> In article <499B4E60.9000703@airemix.jp>,
>   "NARUSE, Yui" <naruse@airemix.jp> writes:
> 
>> そしてまず、直接的な問題としては、例えば、
>>> Regexp.new(/a/u.source) == /a/u
>> => false
>> と、Regexp#source と Regexp#new で戻らない点があります。
> 
> 戻すためには options も指定してください。
> 
> そして、これで戻ることからわかるように、任意のエンコーディン
> グで fixed_encoding にすることも実は可能です。
> 
> 16 というのを直接書くというのは変ではありますが、
> Regexp::FIXEDENCODING という定数を作ることは簡単です。

ふむ、なるほど。
変かどうかよりもこれが Ruby 1.9 の仕様の一部なのかが気になりますが、
いつでも実装可能なことはわかりました。
必要ならば定数を作った方がいいのでしょうね。

> また、//i についてはどうでしょうか。
> 
> /fi/ui は "\uFB01" とマッチします。
> というのは U+FB01 は fi の合字だからですが、
> /fi/ei と EUC-JP を明示したときにも "\uFB01" にマッチすべき
> なんでしょうか。

うーん、それってレイヤーが違うような気がします。

例えば、
  /ss/ui =~ "\u00df".encode("iso-8859-1")
はマッチしてもいいと思いますが、
# Unicode の U+0000 から U+00FF までは ISO-8859-1 と一致するはずだし
ignorecase の挙動に関してはエンコーディングとは
別のレイヤーで処理するべきかと感じます。
# やるかは別として、Regexp::IGNORECASE_COMBINE を作りつつ、
# エンコーディングごとにデフォルトを変えるとか

ちょっとずれますが、
  /\s/ =~ "\u3000" #=> 0
  /\s/e =~ "\u3000".encode("euc-jp") #=> nil
とか。

>> そして、すでに 1.8 用に書かれた /a/u 等もわざわざ UTF-8 等に限定する意図は
>> なかったのではないかと思います。
> 
> そうは思いません。

例えば以下のようになるわけで、あまり強い意味を持たせるのはどうなんですかねぇ。

% ruby_1_8 -Ku -e'p /a/s =~ "a\xE3\x81\x82"'
0
% ruby_1_9_1 -Ku -e'p /a/s =~ "a\xE3\x81\x82"'
-e:1:in `<main>': incompatible encoding regexp match (Windows-31J regexp with UTF-8 string) (Encoding::CompatibilityError)


>> 現状、できごころで /u を付けてしまった正規表現リテラルから、
>> /u を削るという不毛な作業が行われていますが、本当にそれは必要なんでしょうか。
> 
> この作業ってどこで起きてるんですか?
> 
> //n についてはたしかにあいまいな使いかたが多かったと思います。
> だから、警告に弱めたのですが、それ以外は明確だったように感じ
> ています。

「明確だった」使い方とは、例えば
> /\xB9\xA5/ =~ "\xA5\xB9\xA5\xC8"
=> 1
> /#{"\xB9\xA5"}/e =~ "\xA5\xB9\xA5\xC8"
=> nil
とか
> /#{"\\\\"}/s =~ "\x95\x5C"
=> nil
> /#{"\\\\"}/ =~ "\x95\x5C"
=> 1
でしょうか。
どちらもバイト構造に起因する誤マッチを防ぐためのものに見えます。
この種のバイト構造に起因する誤マッチは、Ruby 1.9 ではわざわざ
fixed_encoding を付けなくても回避できるので、これの防止では不要に思えます。

他に何かマッチ対象のエンコーディングを絞りたいような利用例ってありましたっけ。

-- 
NARUSE, Yui  <naruse@airemix.jp>

Thread

Prev Next

In This Thread

Prev Next

[#37868] [Bug #1087] Failure: test_ipv6_address_predicates(TestSocketAddrInfo) — Kazuhiro NISHIYAMA <redmine@...>

[#37874] Symbol as String for C — arton <artonx@...>

[#37880] [FEATURE:trunk] Readline.completion_proc = nil を許可する。 — Takao Kouji <kouji@...7.net>

[#37882] test_etc.rb の修正提案 — Tomoyuki Chikanaga <chikanag@...>

[#37884] [Bug #1097] Ruby 1.9.1 における sqlite3-ruby のインストール時のエラー — Jun Kudo <redmine@...>

[#37887] [Bug #1097](Rejected) Ruby 1.9.1 における sqlite3-ruby のインストール時のエラー — Usaku NAKAMURA <redmine@...>

[#37888] [Bug #1097] Ruby 1.9.1 における sqlite3-ruby のインストール時のエラー — Jun Kudo <redmine@...>

[#37891] Ruby 1.9.1-p0 on NetBSD — Takahiro Kambe <taca@...>

[#37892] 配列の重複検出用Hashの使いまわし — wanabe <s.wanabe@...>

[#37896] [Bug #1104] TZ and Time.now — Nobuhiro IMAI <redmine@...>

[#37898] [Bug #1105] Ruby1.9でのrescue節の例外ハンドラのマッチの処理 — Tatsuji Kawai <redmine@...>

[#37906] Buffering or OpenSSL::Buffering — Kazuhiro NISHIYAMA <zn@...>

[#37910] [Bug:1.9] lack consistency in hash iteration — Yusuke ENDOH <mame@...>

[#37918] [BUG: 1.9] encoding warning — SASADA Koichi <ko1@...>

[#37919] RDoc::Markup::ToHtmlCrossref dosen't recognize filepath including '-' — Tomoyuki Chikanaga <chikanag@...>

[#37920] [Bug #1111] -E and -K on shbang — Usaku NAKAMURA <redmine@...>

[#37921] [Feature:trunk] with_index_from — Yusuke ENDOH <mame@...>

[#37926] [Bug #1115] $SAFE=1でのrequireがSecurityErrorになる — Kazuhiro NISHIYAMA <redmine@...>

[#37930] -r時のdefault_external — "U.Nakamura" <usa@...>

[#37934] [BUG] rb_thread_create_timer_thread: return non-zero (11) — Tanaka Akira <akr@...>

[#37935] test_imaps_post_connection_check test failure — Tanaka Akira <akr@...>

[#37936] zombie processes by drb tests — Tanaka Akira <akr@...>

[#37939] io.set_encoding("UTF-8", "UTF-8") でエラー — Hiroshi Ichikawa <gimite@...>

[#37940] [Bug #1129] IO.binread(Pathname(...)) dumps core — Sakuro OZAWA <redmine@...>

[#37947] Re: [ruby-list:45859] Re: patch for Complex#sqrt in lib/cmath.rb of ruby-1.9.1-p0 — Tadayoshi Funaba <tadf@...>

[#37950] [Bug:1.9] compile error on win32ole with Mingw of MacPorts — 中田 伸悦 <nobu@...>

[#37952] [Feature #1133] Pathname.binread — Sakuro OZAWA <redmine@...>

[#37956] proposal: Module#method_adding — SASADA Koichi <ko1@...>

[#37959] [Bug:trunk] I can modify literals — Yusuke ENDOH <mame@...>

[#37960] [Bug #1138] rdoc of taint/untrust — Kazuhiro NISHIYAMA <redmine@...>

[#37967] [Bug #1143] ruby 1.9.1p0でensure節が実行されない — Jirou Iizuka <redmine@...>

[#37968] 1.9.1-p0 の Net::HTTP#get の第 2 引数 — zunda <zunda616e@...>

[#37970] [Bug #1146] TestSocket#test_udp_server hangs when configure --with-lookup-order-hack=INET — Kazuhiro NISHIYAMA <redmine@...>

[#37975] [Bug #1148] CGI::prettyの正規表現の改良 — Takeyuki Fujioka <redmine@...>

[#37977] trunk が compile error します — nagachika <nagachika00@...>

[#37979] [Bug #1150] calling instance_eval in extended library cause exception — Akio Tajima <redmine@...>

[#37980] Re: [ruby-changes:10687] Ruby:r22250 (trunk): * iseq.c (simple_default_value): allow plain strings as default — SASADA Koichi <ko1@...>

[#37991] Fiber#alive?メソッドの戻り値がboolになりません — cyross@...

[#37993] Re: [ruby-core:22028] Re: 1.8.7 Specifics — Urabe Shyouhei <shyouhei@...>

[#37995] Add POSTARG support to rb_scan_args() — Akinori MUSHA <akinori.musha@...>

[#37997] [Feature:1.9] Enumerable#uniq — Nobuyoshi Nakada <nobu@...>

[#37998] [Feature:1.9] {Array,Enumerable}#uniq_by, #uniq_by! — Nobuyoshi Nakada <nobu@...>

[#37999] [Feature:1.9] Etc.each_passwd, each_group — Nobuyoshi Nakada <nobu@...>

[#38005] Is URI.decode() broken? — MOROHASHI Kyosuke <moronatural@...>

[#38007] [Feature #1159] StringScanner に文字ベースでのインデックスを返すメソッドがほしい — Akira Matsuda <redmine@...>

[#38018] circular require in openssl — Tanaka Akira <akr@...>

[#38020] [Bug #1163] gem_prelude raise NoMethodError if require uninsalled gem with version. — Kyosuke MOROHASHI <redmine@...>

[#38021] 無名クラス中で定義された定数の扱いに付いて — MOROHASHI Kyosuke <moronatural@...>

[#38022] ENCODING_FIXED と ENCODING_NONE の廃止 — "NARUSE, Yui" <naruse@...>

[#38035] Stack Caching を有効にした時のビルドについて — nagachika <nagachika00@...>

[#38044] [Bug #1168] wrong result of File.extname for path contains a space just before the extension — Nobuyoshi Nakada <redmine@...>

[#38048] Add option hash support to rb_scan_args() — "Akinori MUSHA" <knu@...>

[#38049] [Bug #1175] File.expand_path("~user") dose not work — Tomoyuki Chikanaga <redmine@...>

[#38050] indentation check and coverage for toplevel do not work — Yusuke ENDOH <mame@...>

[#38052] mkmf.rb の C++ 対応 — "KISHIMOTO, Makoto" <ksmakoto@...4u.or.jp>

[#38054] build breakage with NO_WAITPID macro — shinichiro.h <shinichiro.hamaji@...>

[#38055] signal is ignored after Process.daemon — Yusuke ENDOH <mame@...>

[#38058] was: Re: [ruby-list:45877] Re: ruby1.8 と ruby1.9 の instance_eval の挙動の違いについて — SASADA Koichi <ko1@...>

[#38060] [Bug:1.9] thread switch when heavy load — Tanaka Akira <akr@...>

[#38063] [Bug #1191] Net::IMAP.encode_utf7 bug? — Kengo Matsuyama <redmine@...>

[#38065] Re: [ruby-cvs:29711] Ruby:r22493 (trunk): * lib/pathname.rb (Pathname#binread): added. — Tanaka Akira <akr@...>

[#38067] Re: [ruby-cvs:29304] Ruby:r22086 (trunk): * ruby.c (process_options): set initial default_external before -r. — "Yugui (Yuki Sonoda)" <yugui@...>

[#38070] [Bug #1196] 正規表現の \s と [\s] が異なる — Masahiro Tomita <redmine@...>

[#38075] [Bug #1198] corrupted iteratoin during "enum_for :inject" — Shyouhei Urabe <redmine@...>

[#38079] [Bug:trunk] duplicate when clauses raise strange exception — Yusuke ENDOH <mame@...>

[#38080] [Feature:trunk] nested loop construct — Yukihiro Matsumoto <matz@...>

[#38086] [Bug: 1.8] generator causes abort — SASADA Koichi <ko1@...>

[#38087] [Bug #1215] irb doesn't finish evaluate on !false => false — Nobuhiro IMAI <redmine@...>

[#38091] mswin32's nan_test is broken by r22579 — "U.Nakamura" <usa@...>

[#38096] 多重代入やメソッド引数の展開でto_aが呼ばれます — nagachika <nagachika00@...>

[#38097] [Bug #1221] [PATCH] load がディレクトリを読み込もうとしてエラー — maiha maiha <redmine@...>

[#38098] ブロック引数と括弧・引数なしsuper — Shugo Maeda <shugo@...>

[#38101] [Bug #1221](Closed) [PATCH] load がディレクトリを読み込もうとしてエラー — Nobuyoshi Nakada <redmine@...>

[#38105] ruby in non-existing directory — Tanaka Akira <akr@...>

[#38106] test/ruby/test_m17n.rb dumps core — Yukihiro Matsumoto <matz@...>

[ruby-dev:38108] Re: ENCODING_FIXED と ENCODING_NONE の廃止

Thread

In This Thread

[#37950] [Bug:1.9] compile error on win32ole with Mingw of MacPorts — 中田伸悦 <nobu@...>