[#41278] [BUG:1.9] BINARY should not be ASCII-compatible — Yugui <yugui@...>

WXVndWkbJEIkRyQ5ISMbKEIKCgo+IBskQiRHISIkKiQqJGAkTSQzJDMkXiRHJE41RE9AJEclKyVQ

15 messages 2010/05/11

[#41407] [Bug #3339] win32ole test failure — Usaku NAKAMURA <redmine@...>

Bug #3339: win32ole test failure

20 messages 2010/05/25
[#41411] Re: [Bug #3339] win32ole test failure — Masaki Suketa <masaki.suketa@...> 2010/05/25

助田です。

[#41412] Re: [Bug #3339] win32ole test failure — "U.Nakamura" <usa@...> 2010/05/25

こんにちは、なかむら(う)です。

[ruby-dev:41468] Re: [Bug #3360](Closed) rdoc fails when including BOM

From: "NARUSE, Yui" <naruse@...>
Date: 2010-05-29 17:54:45 UTC
List: ruby-dev #41468
成瀬です。

(2010/05/30 1:11), Nobuyoshi Nakada wrote:
> At Sun, 30 May 2010 00:36:49 +0900,
> whiteleaf wrote in [ruby-dev:41460]:
>> --charset オプションは「html の charset を指定する」という解釈ですと、
>> encode しないほうが正しい挙動といえなくもないですが、やっぱり
>> 2つ以上の異なるエンコーディングのファイルを対象にする場合は
>> charset と中身のエンコーディングは揃えてほしいところです。
> 
> そのへんが確信がなかったこともあり、別のissueと考えてそのままに
> しました。

そろえて欲しいという動機は理解できます。

HTML の charset と、Ruby での encoding が一致するとは限らないんですよね。
cf. Windows-31J, CP51932, Windows-1252

>> それと遠藤さんのパッチですと、
>> ASCII-8BIT のデータを encode してしまう可能性がある(Encoding::UndefinedConversionError)
>> ので、force_encoding をした場合のみ encode するべきです。
>> (私のパッチではそう処理していたはずです)
> 
> BOMもmagic commentもない場合は、US-ASCIIとして処理すべきでしょう。

rdoc が書かれているのが ruby スクリプトならばそれは US-ASCII のはずです。
が、それを UTF-8 として扱っても別に支障はありません。

rdoc が書かれているのが rdoc 専用ファイルだったり、別の何かへの埋め込みデータの場合、
それは rdoc やそのフォーマットの事情に依存します。それは Ruby M17N の判断する事柄では
ありません。それらが UTF-8 であるべきだと判断するならばこれも問題ありません。

-- 
NARUSE, Yui  <naruse@airemix.jp>

In This Thread

Prev Next