[#37050] [Feature #735] Date#inspect — "rubikitch ." <redmine@...>

Feature #735: Date#inspect

14 messages 2008/11/09

[#37075] [Feature #747] /\A/u ignores BOM — Shyouhei Urabe <redmine@...>

Feature #747: /\A/u ignores BOM

14 messages 2008/11/12

[#37161] m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...>

Yuguiです。

35 messages 2008/11/24
[#37183] Re: m17n of irb — keiju@... (keiju ISHITSUKA) 2008/11/25

けいじゅ@いしつかです.

[#37203] Re: m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...> 2008/11/26

keiju ISHITSUKA さんは書きました:

[#37292] Re: m17n of irb — Yukihiro Matsumoto <matz@...> 2008/12/06

まつもと ゆきひろです

[#37293] Re: m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...> 2008/12/07

Yuguiです。

[#37298] Re: m17n of irb — Yukihiro Matsumoto <matz@...> 2008/12/07

まつもと ゆきひろです

[#37210] RSS::Maker.create(version) — "Akinori MUSHA" <knu@...>

 RSS::Maker で、 "2.0" 等の文字列でフィードのフォーマットを渡す

15 messages 2008/11/27

[#37213] Re: [ruby-cvs:27586] Ruby:r20368 (trunk): * ext/bigdecimal/bigdecimal.c (BigDecimal_div2): should return — Tadayoshi Funaba <tadf@...>

> * ext/bigdecimal/bigdecimal.c (BigDecimal_div2): should return

8 messages 2008/11/27

[ruby-dev:37086] Re: [Feature #747] /\A/u ignores BOM

From: 小西 弘将 <konishih@...6.so-net.ne.jp>
Date: 2008-11-13 08:32:25 UTC
List: ruby-dev #37086
小西弘将です。

[ruby-dev:32981]の方も読んでみて、今の状況がよくわからなかったので質問さ
せてください。現時点でRuby-1.9系は2BYTE Unicodeの文字列を読み込んだ場
合、どのような内部表現となるのでしょうか。

1. 内部表現はUTF-16になる。(読み込み時のエンディアン指定が適切に行われて
いる仮定の下で、UTF-16LEもUTF16-BEも内部表現は同じバイナリ列になるという
ことです)

2. Ruby-1.8系と同じく、文字列はバイト列であり、バイト単位で読み込まれた
ものが内部表現に一致する。

3. それ以外

3は、全く想像がつきませんが、1の立場をとるのであればBOMは内部表現として
不要ですし、逆に2.の立場であれば、必要ですのでBOMが内部表現に入っていな
いのは不自然に映ります。

その上で2.の場合に正規表現をする意味を問うた場合、現在提起されている問題
が起こるのではないでしょうか?
私は、BOMとはバイト単位のメディアに2バイトの文字を書き込むところのエン
コーディングと、PC上で16ビット単位で文字を扱うための架け橋にすぎないと思
います。
個人的には、2のスタンスでも、正規表現など文字列として処理する場合には、
一回UTF-16などに変換してから扱うようにするのがよいように思えます。
あまり考えにくいですけど、そのまま扱う必要があるようなニーズについては、
ユーザーが個々に対応する問題のように感じます。

In This Thread