[#37050] [Feature #735] Date#inspect — "rubikitch ." <redmine@...>

Feature #735: Date#inspect

14 messages 2008/11/09

[#37075] [Feature #747] /\A/u ignores BOM — Shyouhei Urabe <redmine@...>

Feature #747: /\A/u ignores BOM

14 messages 2008/11/12

[#37161] m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...>

Yuguiです。

35 messages 2008/11/24
[#37183] Re: m17n of irb — keiju@... (keiju ISHITSUKA) 2008/11/25

けいじゅ@いしつかです.

[#37203] Re: m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...> 2008/11/26

keiju ISHITSUKA さんは書きました:

[#37292] Re: m17n of irb — Yukihiro Matsumoto <matz@...> 2008/12/06

まつもと ゆきひろです

[#37293] Re: m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...> 2008/12/07

Yuguiです。

[#37298] Re: m17n of irb — Yukihiro Matsumoto <matz@...> 2008/12/07

まつもと ゆきひろです

[#37210] RSS::Maker.create(version) — "Akinori MUSHA" <knu@...>

 RSS::Maker で、 "2.0" 等の文字列でフィードのフォーマットを渡す

15 messages 2008/11/27

[#37213] Re: [ruby-cvs:27586] Ruby:r20368 (trunk): * ext/bigdecimal/bigdecimal.c (BigDecimal_div2): should return — Tadayoshi Funaba <tadf@...>

> * ext/bigdecimal/bigdecimal.c (BigDecimal_div2): should return

8 messages 2008/11/27

[ruby-dev:37087] Re: [Feature #747] /\A/u ignores BOM

From: "U.Nakamura" <usa@...>
Date: 2008-11-13 08:58:23 UTC
List: ruby-dev #37087
こんにちは、なかむら(う)です。

In message "[ruby-dev:37086] Re: [Feature #747] /\A/u ignores BOM"
    on Nov.13,2008 17:32:25, <konishih@fd6.so-net.ne.jp> wrote:
> [ruby-dev:32981]の方も読んでみて、今の状況がよくわからなかったので質問さ
> せてください。現時点でRuby-1.9系は2BYTE Unicodeの文字列を読み込んだ場
> 合、どのような内部表現となるのでしょうか。

すみません、2BYTE Unicodeってなんでしょう?

A:
仮にUCS-2を(リトルエンディアンなりビッグエンディアンなりで)そ
のまま吐き出したもの、のことだとすると、そのようなエンコーデ
ィングはRubyではサポートされないので、単なるバイナリ列として
扱うしかありません。
そういう意味では「2.」です。

B:
とはいえ、おそらくそのようなデータはUTF-16LEなりUTF-16BEなり
として解釈可能でしょうから、ユーザがそのように指定すればその
ように解釈されて読み込まれます。
その際、読み込まれた文字列の内部形式はやっぱりユーザ指定によ
るのでどうなるかはスクリプト依存ですが、無変換で読み込まれた
ならば、内部形式自体はそのままです。
ただし、1.9のStringは自分のエンコーディングを知っていますから、
上記Aの場合と異なり、「単なるバイナリ列」ではありません。


> 3は、全く想像がつきませんが、1の立場をとるのであればBOMは内部表現として
> 不要ですし、逆に2.の立場であれば、必要ですのでBOMが内部表現に入っていな
> いのは不自然に映ります。

というわけで、元のデータの意味とその読ませ方によります。
Aの場合はBOM(に限らず全てのデータ)を特別扱いする理由は存在し
ません。
Bの場合はエンコーディングは判明しているのでBOMは不要ですね(あ
ってはいけないという意味ではない)。


それでは。
-- 
U.Nakamura <usa@garbagecollect.jp>


In This Thread