[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>

なかだです。

18 messages 2000/11/01
[#11358] Re: [PATCH] an analogue of `long long' — matz@... (Yukihiro Matsumoto) 2000/11/01

まつもと ゆきひろです

[#11364] Re: [PATCH] an analogue of `long long' — EGUCHI Osamu <eguchi@...> 2000/11/02

えぐち@エスアンドイー です。

[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>

[ruby-dev:11428] からの続きですが、threadは切りました。

14 messages 2000/11/08
[#11442] Re: class Character (was: Ruby I18N) — TAKAHASHI Masayoshi <maki@...> 2000/11/08

高橋征義です。用語について。

[#11443] Re: class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...> 2000/11/08

At Wed, 8 Nov 2000 20:44:55 +0900,

[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>

岡と申します。

22 messages 2000/11/15
[#11523] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11528] Re: A problem of Socket methods on Windows — matz@... (Yukihiro Matsumoto) 2000/11/15

まつもと ゆきひろです

[#11532] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11534] Re: A problem of Socket methods on Windows — OKA Toshiyuki <oka@...> 2000/11/15

岡です。

[#11535] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11538] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>

In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,

22 messages 2000/11/28
[#11663] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/11/28

まつもと ゆきひろです

[#11664] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/28

In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,

[#11665] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/28

In article <hvor93w5wb8.fsf@coulee.m17n.org>,

[#11669] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/29

In article <hvoofz05uwz.fsf@coulee.m17n.org>,

[#11672] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/11/29

まつもと ゆきひろです

[#11675] Re: IO (Re: fork problem?) — Koji Arai <JCA02266@...> 2000/11/30

新井です。

[#11677] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/12/01

まつもと ゆきひろです

[ruby-dev:11373] Re: Ruby I18N

From: matz@... (Yukihiro Matsumoto)
Date: 2000-11-02 15:45:29 UTC
List: ruby-dev #11373
まつもと ゆきひろです

In message "[ruby-dev:11371] Re: Ruby I18N"
    on 00/11/02, " たけ (tk)" <ggb03124@nifty.ne.jp> writes:

| 文字列や正規表現の内部構造と処理方法は次のような感じになると考えていい
|のでしょうか?。
|
|  ┌────────┬──────────┬───────────
| │データバッファの│文字コード系の種類の│実際のデータ・・・
| │長さ      │IDもしくはポインタ│(生のまま)
|  └────────┴──────────┴───────────

そうですね。実装はどうなるかはともかくこのような情報を持つで
しょう。

| それで、実際の処理は、文字コード系に応じた「一文字取りだしルーティン」
|とか「比較ルーティン」とかを呼び出して行う。
|
| * または、文字コード系ごとに「String クラスのサブクラス」とする。
|
| −−
|
| しかしそれだと、
|
| (1) 文字コード系がステートフルや可変長であっても、構わないことにな
|る。(文字列の一部をカットするのも文字コード系毎のルーティンを呼び出すこ
|とになるので問題がなくなる。また、入出力も文字コード系毎のルーティンを使
|うとすると、その処理系でステートレスに変換して収納しても構わないことにな
|る)。

「可変長」についてはその通りです。というか、マルチバイト文字
コード系はすべて可変長ですよね。

ステートフルな文字コード系については以前にもちょっと考えたこ
とがあったのですが、やはり現実的には無理じゃないかと思います。
各アクセス毎に頭からスキャンすれば別ですが。

また、「その処理系でステートレスに変換して収納しても構わない
ことになる」ことについては、今回は「文字コード系の変換を行わ
ない」ことが前提になっているため「構わない」とは言えないと思
います。

| (2) 取り出した文字の個々の文字コード(Fixnum)にも「文字コード系の
|種類」のデータが付加されていなければならない。(そうでないと、一文字を取
|り出した後で「文字コード系が違うので処理を拒否する」ということが出来なく
|なる)。

現時点では「拒否できなくても構わない」と思ってます。

コード系の違う文字列同士の処理を拒否するのは、処理が現実的に
不可能であるからで、コード系の違う文字の混在まで拒否するのは
やりすぎではないかと思います。でないと、たとえば、EUC-JPのあ
る文字(Fixnum)に対応するSJISの文字を得て、SJIS文字列に埋め込
むといった処理が現実的にできなくなります。

| (3) それぞれの文字コード毎のルーティンで「他の文字コード系から自分
|の文字コード系への変換」ルーティンを用意すると、文字コード系が異なってい
|ても処理が可能になる。(coerce の文字列への適用?)。

文字コード系毎に用意すべき処理はまだ明らかになってませんから、
このことは可能かもしれません。

| 以下のあたりをつらつら読んでいました。

後で見てみます。
                                まつもと ゆきひろ /:|)

In This Thread