[#28446] named capture and /g, /G option — "K.Kosako" <sndgk393@...>

Ruby 1.9に、

30 messages 2006/03/21
[#28449] Re: named capture and /g, /G option — "K.Kosako" <sndgk393@...> 2006/03/21

> Ruby 1.9に、

[#28452] Re: named capture and /g, /G option — Yukihiro Matsumoto <matz@...> 2006/03/21

まつもと ゆきひろです

[#28453] Re: named capture and /g, /G option — "K.Kosako" <sndgk393@...> 2006/03/21

Yukihiro Matsumoto wrote:

[ruby-dev:28438] Re: [案内] レガシーエンコーディングの変換機能の開発

From: "NARUSE, Yui" <naruse@...>
Date: 2006-03-15 14:15:35 UTC
List: ruby-dev #28438
成瀬です。

MORIYAMA Masayuki wrote:
> ミラクル・リナックスの森山です。
>   o CP932           シフトJIS符号化方式  (Windows Codepage 932)
>   o CP51932         日本語EUC符号化方式  (Windows Codepage 51932)
>   o eucJP-ms        日本語EUC符号化方式  (TOG/JVC eucJP-open)
>   o ISO-2022-JP-MS  7ビットJIS符号化方式 (Windows Codepage 50221+UDC)
> Ruby では、NKF モジュールで、すでに cp932, cp51932, eucJP-ms への対応
> が進んでいますので、ISO-2022-JP-MS の追加を行う事になります。

現在の状況ですが、
1.8.4 は nkf 2.0.5 ベース、1.9は 2.0.5 2005-07-22 版ベースです。

1.8.4 においては、
* JIS X 0212 への対応が有効となっていない
というバグがあり、nkf 側で用いているマッピングテストでは、
* CP932 -> Unicode で7文字  Unicode -> CP932 で80文字
* CP51932 -> Unicode で6文字  Unicode -> CP51932 で80文字
* eucJP-ms -> Unicode で6179文字  Unicode -> eucJP-ms で6161文字
の「間違い」が残っています。
http://nkf.sourceforge.jp/ucm/


今後は、
CP932/CP51932/eucJP-ms への対応が行われた nkf は、
nkf 2.0.6 としてリリースされる予定です。

現在 beta1 がリリースされています。
http://sourceforge.jp/projects/nkf/

nkf 2.0.6 がリリースされ次第、1.8 と 1.9 両方で取り込みます。

ISO-2022-JP-MSについてはこれから調べます。


以上、とりあえず。

-- 
NARUSE, Yui  <naruse@airemix.com>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA

In This Thread