[#45530] [ruby-trunk - Feature #6311][Open] memmem()によるrb_memsearch()の高速化 — "Glass_saga (Masaki Matsushita)" <glass.saga@...>

12 messages 2012/04/17

[#45554] [ruby-trunk - Bug #6344][Open] 1.9.3 p125, p194 ruby causes SEGV with test_massign.rb on ppc/ppc64 — "mtasaka (Mamoru Tasaka)" <mtasaka@...>

14 messages 2012/04/23

[ruby-dev:45594] [ruby-trunk - Bug #6380][Open] 正規表現検索で大文字/小文字の対応がおかしいものがある

From: "5.5 (5 5)" <redmine@...>
Date: 2012-04-29 17:04:50 UTC
List: ruby-dev #45594
Issue #6380 has been reported by 5.5 (5 5).

----------------------------------------
Bug #6380: 正規表現検索で大文字/小文字の対応がおかしいものがある
https://bugs.ruby-lang.org/issues/6380

Author: 5.5 (5 5)
Status: Open
Priority: Normal
Assignee: 
Category: M17N
Target version: 1.9.3
ruby -v: ruby 1.9.3p202 (2012-04-27 revision 35484) [x86_64-darwin10.8.0]


=begin
Unicode のコードチャート
* http://www.unicode.org/charts/PDF/U0180.pdf
* http://www.unicode.org/charts/PDF/U0250.pdf
によれば,
* U+0241 LATIN CAPITAL LETTER GLOTTAL STOP
* U+0242 LATIN SMALL LETTER GLOTTAL STOP
が大文字/小文字の関係にあり,
* U+0294 LATIN LETTER GLOTTAL STOP
は「caseless」です。しかし,正規表現検索で i オプションを使うと,U+0241 と U+0294 が大文字/小文字の関係にあるかのような動作になります。

 a="\u{241}" # => "Ɂ"
 b="\u{242}" # => "ɂ"
 c="\u{294}" # => "ʔ"
 str=a+b+c
 
 puts str.gsub(/#{a}/i, "-") # => nil
 puts str.gsub(/#{b}/i, "-") # => nil
 puts str.gsub(/#{c}/i, "-") # => nil
 # >> -ɂ-
 # >> Ɂ-ʔ
 # >> -ɂ-
=end



-- 
http://bugs.ruby-lang.org/

In This Thread

Prev Next