[#32498] Re: [ruby-cvs:21399] Ruby:r14162 (trunk): * parse.y (expr): redefinable not (!) operator. — SASADA Koichi <ko1@...>

 ささだです.

9 messages 2007/12/09

[#32512] Re: [ruby-cvs:21409] Ruby:r14172 (trunk): * transcode.c: new file to provide encoding conversion features. — Nobuyoshi Nakada <nobu@...>

なかだです。

33 messages 2007/12/10
[#32520] Re: [ruby-cvs:21409] Ruby:r14172 (trunk): * transcode.c: new file to provide encoding conversion features. — Martin Duerst <duerst@...> 2007/12/10

中田さん、こんにちは。

[#32527] Re: [ruby-cvs:21409] Ruby:r14172 (trunk): * transcode.c: new file to provide encoding conversion features. — Nobuyoshi Nakada <nobu@...> 2007/12/10

なかだです。

[#32535] Re: [ruby-cvs:21409] Ruby:r14172 (trunk): * transcode.c: new file to provide encoding conversion features. — Yukihiro Matsumoto <matz@...> 2007/12/11

まつもと ゆきひろです

[#32537] Re: [ruby-cvs:21409] Ruby:r14172 (trunk): * transcode.c: new file to provide encoding conversion features. — Martin Duerst <duerst@...> 2007/12/11

At 15:33 07/12/11, Yukihiro Matsumoto wrote:

[#32538] Re: [ruby-cvs:21409] Ruby:r14172 (trunk): * transcode.c: new file to provide encoding conversion features. — Yukihiro Matsumoto <matz@...> 2007/12/11

まつもと ゆきひろです

[#32539] Re: [ruby-cvs:21409] Ruby:r14172 (trunk): * transcode.c: new file to provide encoding conversion features. — Nobuyoshi Nakada <nobu@...> 2007/12/11

なかだです。

[#32550] Binary String — Hidetoshi NAGAI <nagai@...>

永井@知能.九工大です.

204 messages 2007/12/12
[#32551] Re: Binary String — Yukihiro Matsumoto <matz@...> 2007/12/12

まつもと ゆきひろです

[#32552] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2007/12/12

永井@知能.九工大です.

[#32553] Re: Binary String — Yukihiro Matsumoto <matz@...> 2007/12/12

まつもと ゆきひろです

[#32560] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2007/12/12

永井@知能.九工大です.

[#32561] Re: Binary String — Nobuyoshi Nakada <nobu@...> 2007/12/12

なかだです。

[#33018] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/11

永井@知能.九工大です.

[#33019] Re: Binary String — Tanaka Akira <akr@...> 2008/01/11

In article <20080111.171950.78716471.nagai@ai.kyutech.ac.jp>,

[#33024] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/11

永井@知能.九工大です.

[#33027] Re: Binary String — Tanaka Akira <akr@...> 2008/01/11

In article <20080111.184442.74744388.nagai@ai.kyutech.ac.jp>,

[#33041] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/11

永井@知能.九工大です.

[#33047] Re: Binary String — Tanaka Akira <akr@...> 2008/01/11

In article <20080112.004750.74741782.nagai@ai.kyutech.ac.jp>,

[#33055] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/12

永井@知能.九工大です.

[#33080] Re: Binary String — Tanaka Akira <akr@...> 2008/01/13

In article <20080112.100830.112615025.nagai@ai.kyutech.ac.jp>,

[#33104] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/14

永井@知能.九工大です.

[#33108] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/15

成瀬です。

[#33121] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/15

永井@知能.九工大です.

[#33123] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/15

成瀬です。

[#33127] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/16

永井@知能.九工大です.

[#33138] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/16

成瀬です。

[#33147] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/17

永井@知能.九工大です.

[#33152] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/17

成瀬です。

[#33153] Re: Binary String — 遊楽庵 <yu_raku_an@...> 2008/01/17

遊楽庵です。

[#33154] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/17

成瀬です。

[#33157] Re: Binary String — Yukihiro Matsumoto <matz@...> 2008/01/17

まつもと ゆきひろです

[#33330] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/23

成瀬です。

[#33336] Re: Binary String — Tanaka Akira <akr@...> 2008/01/23

In article <47975933.8010907@airemix.com>,

[#33337] Re: Binary String — Yukihiro Matsumoto <matz@...> 2008/01/23

まつもと ゆきひろです

[#33346] Re: Binary String — "U.Nakamura" <usa@...> 2008/01/24

こんにちは、なかむら(う)です。

[#33348] Re: Binary String — Yukihiro Matsumoto <matz@...> 2008/01/24

まつもと ゆきひろです

[#33352] Re: Binary String — "U.Nakamura" <usa@...> 2008/01/24

こんにちは、なかむら(う)です。

[#33353] Re: Binary String — Yukihiro Matsumoto <matz@...> 2008/01/24

まつもと ゆきひろです

[#33122] Re: Binary String — Tanaka Akira <akr@...> 2008/01/15

In article <20080115.024201.41653719.nagai@ai.kyutech.ac.jp>,

[#33126] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/16

永井@知能.九工大です.

[#33151] Re: Binary String — Tanaka Akira <akr@...> 2008/01/17

In article <20080116.102057.41656941.nagai@ai.kyutech.ac.jp>,

[#33160] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/17

永井@知能.九工大です.

[#33165] Re: Binary String — Tanaka Akira <akr@...> 2008/01/18

In article <20080117.233832.74721189.nagai@ai.kyutech.ac.jp>,

[#33188] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/19

永井@知能.九工大です.

[#33193] Re: Binary String — Yukihiro Matsumoto <matz@...> 2008/01/19

まつもと ゆきひろです

[#33202] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/19

永井@知能.九工大です.

[#33230] Re: Binary String — Yukihiro Matsumoto <matz@...> 2008/01/20

まつもと ゆきひろです

[#33236] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/21

永井@知能.九工大です.

[#33238] Re: Binary String — SASADA Koichi <ko1@...> 2008/01/21

 m17n には近づかないようにしているささだです。

[#33241] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/21

成瀬です。

[#33248] Re: Binary String — Yukihiro Matsumoto <matz@...> 2008/01/21

まつもと ゆきひろです

[#33281] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/22

永井@知能.九工大です.

[#33285] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/22

成瀬です。

[#33318] Re: Binary String — Hidetoshi NAGAI <nagai@...> 2008/01/23

永井@知能.九工大です.

[#33186] Ruby1.9 String バイト列へのインデックス アクセス — "Hisanori Kiryu" <hkiryu@...> 2008/01/19

長文失礼します。

[#33192] Re: Ruby1.9 String バイト列へのインデックス アクセス — Yukihiro Matsumoto <matz@...> 2008/01/19

まつもと ゆきひろです

[#33195] Re: Ruby1.9 String バイト列へのインデックス アクセス — rubikitch@... 2008/01/19

From: Yukihiro Matsumoto <matz@ruby-lang.org>

[#33199] Re: Ruby1.9 String バイト列へのインデックス アクセス — "NARUSE, Yui" <naruse@...> 2008/01/19

成瀬です。

[#33020] Re: Binary String — "NARUSE, Yui" <naruse@...> 2008/01/11

成瀬です。

[#32610] 1.9.1 issues left (as of 12/15) — Yukihiro Matsumoto <matz@...>

まつもと ゆきひろです

14 messages 2007/12/15

[#32715] issues left as of 12/25 2:00am JST — Yukihiro Matsumoto <matz@...>

まつもと ゆきひろです

41 messages 2007/12/24
[#32738] issues left as of 12/25 noon JST — Yukihiro Matsumoto <matz@...> 2007/12/25

まつもと ゆきひろです

[#32739] Re: issues left as of 12/25 noon JST — Yukihiro Matsumoto <matz@...> 2007/12/25

まつもと ゆきひろです

[#32791] Re: [ruby-list:44387] [ANN] Ruby 1.9.0 is released — SASADA Koichi <ko1@...>

 ささだです。

21 messages 2007/12/25

[#32823] class TimeSpan — "NARUSE, Yui" <naruse@...>

成瀬です。

18 messages 2007/12/27

[#32843] Windowでのデフォルトエンコーディング — KIMURA Koichi <kimura.koichi@...>

木村です。

30 messages 2007/12/28
[#32845] Re: Windowでのデフォルトエンコーディング — "U.Nakamura" <usa@...> 2007/12/28

こんにちは、なかむら(う)です。

[#32851] Re: Window でのデフォルトエンコーディング — Martin Duerst <duerst@...> 2007/12/28

At 13:55 07/12/28, U.Nakamura wrote:

[#32853] Re: Windowでのデフォルトエンコーディング — "NARUSE, Yui" <naruse@...> 2007/12/28

U.Nakamura wrote:

[#32857] Re: Windowでのデフォルトエンコーディング — "U.Nakamura" <usa@...> 2007/12/28

こんにちは、なかむら(う)です。

[#32852] Resolv::DNS#getaddresses doesn't return IPv6 address — "NARUSE, Yui" <naruse@...>

成瀬です。

17 messages 2007/12/28
[#32923] Re: Resolv::DNS#getaddresses doesn't return IPv6 address — Takahiro Kambe <taca@...> 2008/01/05

こんにちは。

[#32924] Re: Resolv::DNS#getaddresses doesn't return IPv6 address — "NARUSE, Yui" <naruse@...> 2008/01/05

成瀬です。

[#32925] Re: Resolv::DNS#getaddresses doesn't return IPv6 address — Takahiro Kambe <taca@...> 2008/01/05

In message <477EF0C9.4060103@airemix.com>

[#32929] Re: Resolv::DNS#getaddresses doesn't return IPv6 address — "NARUSE, Yui" <naruse@...> 2008/01/05

成瀬です

[ruby-dev:32702] Re: ISO-2022-JP output for transcode

From: Martin Duerst <duerst@...>
Date: 2007-12-24 07:29:03 UTC
List: ruby-dev #32702
成瀬さん、こんにちは。

At 15:30 07/12/24, NARUSE, Yui wrote:
>成瀬です。
>
>ISO-2022-JP の入力を加えたパッチです。これもまだすべて transcode.c に
>つっこんでいます。
>
>Martin Duerst wrote:
>> At 13:04 07/12/24, Nobuyoshi Nakada wrote:
>>> At Mon, 24 Dec 2007 10:10:28 +0900,
>>> NARUSE, Yui wrote in [ruby-dev:32695]:
>>>> transcode を ISO-2022-JP の出力に対応させるパッチを書いてみました。同様
>>>> に preprocessor で入力にも対応できますし、ISO-2022-JP 以外の ISO/IEC
>>>> 2022 シリーズにも対応できるようになっています。
>>> できれば、transcode_data_japanese.cのほうにお願いしたいです。
>> 
>> これは自動的に作成しているので、余り好ましくないです。でも
>> (下のようにたいてありますように) 未だ変更する予定なので、
>> こちらでもいいです。
>
>transcode_data_japanese.c は自動生成な気がした

まさにそうです。

>のと、transcode.c の構造体
>に依存しているので、下手に分けずにとりあえず transcode.c に入れておきま
>した。
>transcoding と transcoder を transcode_data.h いれればいいのですかね。作
>業しつつとりあえずこの状態で投稿しておきます。

以前に中田さんに書きましたが、transcode_data.h はデータファイル
と transcode.c の間のものだけです。将来にはこれと別途に transcode.h
を作る予定です。

>>>> とりあえずクリ
>>>> スマスリリースに入れる程度の品質は出ると思いますがいかがでしょう。
>> 
>> リリースにいれていいですが、明日とか明後日当たりで HEAD でまだ取り出し、
>> 違う方針でよかったらいいですよ。
>
>とりあえず 1.9.1 でも ISO-2022-JP が動いてほしかったからなので、それで結
>構です。
>
>>>  # transcode_data_one_byte.cという名前はわかりにくいので、
>>>  # japanese.cと同じ伝でいえばeuropean.cかなぁと思ったりしますが。
>> 
>> こちらでもそう思いましたが、iso-8859-6 はアラビア語で、iso-8859-8
>> はヘブライ語で、iso-8859-11 はタイ語で、どちらともヨーロッパと
>> 縁が薄いです。しばらくそのままいいではないでしょうか。
>
>iso_8859.c じゃないかなぁと。

以前は transcode_data_iso_8859.c でしたが、将来に例えば
windows-... とか追加する予定なので、名前を変えました。

>>> * MAX_TRANSCODERSの制限をなくす
>>>  # というか、このパッチだとオーバーしてませんか?
>> 
>> 外してもいいですが、余り大きな変更はしない方がいいと思います。
>
>オーバーしていますね。

一番簡単なのは MAX_TRANSCODERS を合わせすということです。
手作業なのでちょっとこわいけど。

>>> * transcode_data_*.cを拡張ライブラリ形式にする。
>>>  必要な構造体とプロトタイプをヘッダに入れて、各transcoderでは
>>>  Init関数を追加することになります。
>> 
>> こちらでは次のように考えました:
>> - transcoder の登録を transcode.c に残す。
>> - 登録の際、ファイル名も登録する。
>>   (例:
>>        register_transcoder("ISO-8859-1",  "UTF-8", &rb_from_ISO_8859_1, 2, 0);
>>    の変わり
>>        register_transcoder("ISO-8859-1",  "UTF-8", &rb_from_ISO_8859_1, 
>2, 0, "transcode_data_one_byte");
>> - transcoder が呼ばれたら、データのファイルをロードする。
>
>一応参考までに他の実装ですが、
>Citrus iconv は 文字コードの一覧を
># EUC
>EUC-CN                          EUC/EUC-CN.esdb
>EUC-JP                          EUC/EUC-JP.esdb
>EUC-JP-MS                       EUC/EUC-JP-MS.esdb
>EUC-KR                          EUC/EUC-KR.esdb
>EUC-TW                          EUC/EUC-TW.esdb
>という形で持っておいて、呼ばれたら読みに行っていたような。

似たような構造みたいですね。こちらで考えているデータ構造だと
日本語の文字コード同士では共通するデータがいっぱいありますので、
同じファイルにすることになります。

>Perl/Encode は拡張ライブラリ方式でした。ある拡張ライブラリを読み込むと、
>それが対応している文字コードの変換がサポートされます。そして、デフォルト
>で読み込む、文字コード変換拡張ライブラリをいくつか登録されていました。
>(デフォルトで読み込む文字コード変換ライブラリはユーザが後で追加可能)

中田さんと考えたのは require は必要ないようにしたいということです。
勿論将来的にユーザーが自分で追加したいときはあるだろうからこれにも
対応したいですが、先ずはリリースの後に文字コードの数を増やすことです。

>Martin さんが考えていらっしゃるのはおそらく Citrus に近い方式で、なかだ
>さんが考えていらっしゃるのは Perl/Encode に近い方式でしょうか。Citrus 方
>式だと各変換を最適化しやすく、Perl/Encode はモジュールの追加がしやすかっ
>たように記憶しています。

こちらでは「各変換」よりも「似たような変換同士」の最適化に力を入れようと
思っています。

宜しくお願いします。   Martin.


#-#-#  Martin J. Du"rst, Assoc. Professor, Aoyama Gakuin University
#-#-#  http://www.sw.it.aoyama.ac.jp       mailto:duerst@it.aoyama.ac.jp     


In This Thread