[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>

なかだです。

18 messages 2000/11/01
[#11358] Re: [PATCH] an analogue of `long long' — matz@... (Yukihiro Matsumoto) 2000/11/01

まつもと ゆきひろです

[#11364] Re: [PATCH] an analogue of `long long' — EGUCHI Osamu <eguchi@...> 2000/11/02

えぐち@エスアンドイー です。

[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>

[ruby-dev:11428] からの続きですが、threadは切りました。

14 messages 2000/11/08
[#11442] Re: class Character (was: Ruby I18N) — TAKAHASHI Masayoshi <maki@...> 2000/11/08

高橋征義です。用語について。

[#11443] Re: class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...> 2000/11/08

At Wed, 8 Nov 2000 20:44:55 +0900,

[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>

岡と申します。

22 messages 2000/11/15
[#11523] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11528] Re: A problem of Socket methods on Windows — matz@... (Yukihiro Matsumoto) 2000/11/15

まつもと ゆきひろです

[#11532] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11534] Re: A problem of Socket methods on Windows — OKA Toshiyuki <oka@...> 2000/11/15

岡です。

[#11535] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11538] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>

In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,

22 messages 2000/11/28
[#11663] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/11/28

まつもと ゆきひろです

[#11664] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/28

In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,

[#11665] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/28

In article <hvor93w5wb8.fsf@coulee.m17n.org>,

[#11669] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/29

In article <hvoofz05uwz.fsf@coulee.m17n.org>,

[#11672] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/11/29

まつもと ゆきひろです

[#11675] Re: IO (Re: fork problem?) — Koji Arai <JCA02266@...> 2000/11/30

新井です。

[#11677] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/12/01

まつもと ゆきひろです

[ruby-dev:11371] Re: Ruby I18N

From: " たけ (tk)" <ggb03124@...>
Date: 2000-11-02 14:53:29 UTC
List: ruby-dev #11371
たけ(tk)です。

Yukihiro Matsumoto さん曰く。
》元の文字コードはなにか(つまりどう処理するか)という情報は文字
》列、正規表現それぞれに個別に持ってもらうことになるでしょう。
》文字コードが合わない文字列同士は処理できないことにしようと思
》います。

 文字列や正規表現の内部構造と処理方法は次のような感じになると考えていい
のでしょうか?。

  ┌────────┬──────────┬───────────
 │データバッファの│文字コード系の種類の│実際のデータ・・・
 │長さ      │IDもしくはポインタ│(生のまま)
  └────────┴──────────┴───────────

 それで、実際の処理は、文字コード系に応じた「一文字取りだしルーティン」
とか「比較ルーティン」とかを呼び出して行う。

 * または、文字コード系ごとに「String クラスのサブクラス」とする。

 −−

 しかしそれだと、

 (1) 文字コード系がステートフルや可変長であっても、構わないことにな
る。(文字列の一部をカットするのも文字コード系毎のルーティンを呼び出すこ
とになるので問題がなくなる。また、入出力も文字コード系毎のルーティンを使
うとすると、その処理系でステートレスに変換して収納しても構わないことにな
る)。

 (2) 取り出した文字の個々の文字コード(Fixnum)にも「文字コード系の
種類」のデータが付加されていなければならない。(そうでないと、一文字を取
り出した後で「文字コード系が違うので処理を拒否する」ということが出来なく
なる)。

 (3) それぞれの文字コード毎のルーティンで「他の文字コード系から自分
の文字コード系への変換」ルーティンを用意すると、文字コード系が異なってい
ても処理が可能になる。(coerce の文字列への適用?)。

 −−

 以下のあたりをつらつら読んでいました。

http://www.horagai.com/www/moji/
http://www.horagai.com/www/moji/2000a.htm

http://x.jepa.or.jp/jepax/index.html

http://hp.vector.co.jp/authors/VA002891/TMEDIT/TMF_SMJK.TXT

http://cvs.m17n.org/UTF-2000/

たけ(tk) ggb03124@nifty.ne.jp
http://member.nifty.ne.jp/take_tk

In This Thread