[#44289] [Ruby 1.9 - Feature #5128][Open] 日本語ドキュメントをUTF-8に — Shyouhei Urabe <shyouhei@...>

34 messages 2011/08/01
[#44293] [Ruby 1.9 - Feature #5128] 日本語ドキュメントをUTF-8に — Nobuyoshi Nakada <nobu@...> 2011/08/01

[#44295] Re: [ruby-dev:44293] [Ruby 1.9 - Feature #5128] 日本語ドキュメントをUTF-8に — Urabe Shyouhei <shyouhei@...> 2011/08/01

(08/01/2011 11:52 AM), Nobuyoshi Nakada wrote:

[#44299] Re: [Ruby 1.9 - Feature #5128] 日本語ドキュメントをUTF-8に — Nobuyoshi Nakada <nobu@...> 2011/08/01

なかだです。

[#44418] [Ruby 1.9 - Feature #5128] 日本語ドキュメントをUTF-8に — Ayumu AIZAWA <ayumu.aizawa@...> 2011/08/24

[#44431] Re: [ruby-dev:44418] [Ruby 1.9 - Feature #5128] 日本語ドキュメントをUTF-8に — KOSAKI Motohiro <kosaki.motohiro@...> 2011/08/27

> あいざわです

[#44443] Re: [Ruby 1.9 - Feature #5128] 日本語ドキュメントをUTF-8に — Ayumu Aizawa <ayumu.aizawa@...> 2011/09/01

あいざわです

[#44315] [Ruby 1.9 - Bug #5139][Open] sigsegv のスタックオーバフロー — Tomoyuki Chikanaga <nagachika00@...>

18 messages 2011/08/02

[#44329] [Ruby 1.9 - Bug #5151][Open] test/socket/test_socket.rb fail when udp connection failed — Ayumu AIZAWA <ayumu.aizawa@...>

16 messages 2011/08/02

[#44368] [Ruby 1.9 - Feature #5180][Open] net/http の接続時に用いる IP アドレスの指定 — Yui NARUSE <naruse@...>

15 messages 2011/08/10

[#44413] [Ruby 1.9 - Bug #5217][Open] lineno is broken when source code has about 7000 lines — Yusuke Endoh <mame@...>

11 messages 2011/08/23

[ruby-dev:44298] Re: [Ruby 1.9 - Feature #5128][Open] 日本語ドキュメントをUTF-8に

From: Ayumu Aizawa <ayumu.aizawa@...>
Date: 2011-08-01 03:51:23 UTC
List: ruby-dev #44298
pull request を送ったあいざわです。

文字化けは残念だなぁとおもって軽い気持ちで送ってみたのですが、改めて調べてみると nkf --guess で非ASCIIと
判定されるファイルがたくさんありますね。なかにはテストの都合などで敢えてそうしているものもあるんでしょうか。。。

個人的には明らかにドキュメントであるようなファイルについてはUTF-8に統一で良いとおもっています。

以下調査結果です。

- 非ASCII、非BINARYのファイル 189コ
$ git ls-files | xargs nkf --guess | grep -v 'ASCII' | grep -v 'BINARY' | wc -l
189
-- 189のうち、EUC-JPと判定されるもの 120コ
$ git ls-files | xargs nkf --guess | grep -v 'ASCII' | grep -v
'BINARY' | grep 'EUC-JP' | wc -l
120
-- 189のうち、Shit_JISと判定されるもの 33 コ
y$ git ls-files | xargs nkf --guess | grep -v 'ASCII' | grep -v
'BINARY' | grep 'Shift_JIS' | wc -l
33
-- 189のうち、UTF-8と判定されるもの 30 コ
$ git ls-files | xargs nkf --guess | grep -v 'ASCII' | grep -v
'BINARY' | grep 'UTF-8' | wc -l
30
-- それ以外
y$ git ls-files | xargs nkf --guess | grep -v 'ASCII' | grep -v
'BINARY' | grep -v 'EUC-JP' | grep -v 'Shift_JIS' | grep -v 'UTF-8'
COPYING.ja:ISO-2022-JP
ext/nkf/nkf-utf8/nkf.c:ISO-2022-JP
lib/irb/slex.rb:ISO-2022-JP
test/rexml/data/t63-1.xml:UTF-16
test/rexml/data/t63-2.svg:UTF-16
test/rexml/data/ticket_110_utf16.xml:UTF-16

In This Thread