[#37050] [Feature #735] Date#inspect — "rubikitch ." <redmine@...>

Feature #735: Date#inspect

14 messages 2008/11/09

[#37075] [Feature #747] /\A/u ignores BOM — Shyouhei Urabe <redmine@...>

Feature #747: /\A/u ignores BOM

14 messages 2008/11/12

[#37161] m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...>

Yuguiです。

35 messages 2008/11/24
[#37183] Re: m17n of irb — keiju@... (keiju ISHITSUKA) 2008/11/25

けいじゅ@いしつかです.

[#37203] Re: m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...> 2008/11/26

keiju ISHITSUKA さんは書きました:

[#37292] Re: m17n of irb — Yukihiro Matsumoto <matz@...> 2008/12/06

まつもと ゆきひろです

[#37293] Re: m17n of irb — "Yugui (Yuki Sonoda)" <yugui@...> 2008/12/07

Yuguiです。

[#37298] Re: m17n of irb — Yukihiro Matsumoto <matz@...> 2008/12/07

まつもと ゆきひろです

[#37210] RSS::Maker.create(version) — "Akinori MUSHA" <knu@...>

 RSS::Maker で、 "2.0" 等の文字列でフィードのフォーマットを渡す

15 messages 2008/11/27

[#37213] Re: [ruby-cvs:27586] Ruby:r20368 (trunk): * ext/bigdecimal/bigdecimal.c (BigDecimal_div2): should return — Tadayoshi Funaba <tadf@...>

> * ext/bigdecimal/bigdecimal.c (BigDecimal_div2): should return

8 messages 2008/11/27

[ruby-dev:37081] Re: [Feature #747] /\A/u ignores BOM

From: "U.Nakamura" <usa@...>
Date: 2008-11-12 12:44:53 UTC
List: ruby-dev #37081
こんにちは、なかむら(う)です。

In message "[ruby-dev:37077] Re: [Feature #747] /\A/u ignores BOM"
    on Nov.12,2008 18:40:30, <tietew@tietew.net> wrote:
> > /\A/uがBOMにヒットしないのが嬉しくないです。普通、BOMはあるとすれば文字列の先頭に付いていることが多いので、/\A/uがBOMにヒットするのが自然だと思います。
> 
> http://www.ietf.org/rfc/rfc3629.txt
> RFC 3629 を読むと、内部処理には U+FEFF を特別扱いしないことを推奨してい
> るように思いますが、どうなんでしょう。

というわけで、以前の議論で結論が出ずに見送りになりましたが、
やはりBOMを理解するopenが必要なんじゃないでしょうか。

なお以前の議論の際の結論自体は[ruby-dev:32981]にまとめてあり
ますが、あの時は書き込み時にBOMをどう扱えばいいのか判断できな
かったのが見送りの主原因でした。
今回は、書き込みは現状どおりとして、読み込み時のみBOMを取り扱
うという案を提案してみます。
# なお1.9.1に入れることは想定していません。


* 対象となるのは"r"のみ。"r+"、"w+"、"a+"は対応しない。

* "r"時のエンコーディング名指定として、"utf-7-bom"、"utf-8-bom"、
  "utf-16le-bom"、"utf-16be-bom"、"utf-32le-bom"、"utf-32be-bom"
  をサポートする。
  これらが指定されたとき、BOMがあるかどうか判断できるまでファ
  イル先頭を読み、BOMがあればそのBOMに従ったエンコーディング
  が指定されたとみなして、読んだBOMは捨てる。
  BOMがなければ既に読んだ分をungetbyteした上で"-bom"なしのエ
  ンコーディングが指定されたとみなす。

* 他は現状を変更しない。つまり例えば"w:utf-8-bom"などの指定は
  Unsupported encodingとして無視される。

※UTF-7にBOMがあるのかどうかよくわからないんですが、絶対にな
  いんだったら上記からutf-7-bomは取り除きます。


それでは。
-- 
U.Nakamura <usa@garbagecollect.jp>


In This Thread