[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
>From: matz@zetabits.com (Yukihiro Matsumoto)
まつもと ゆきひろです
[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>
[ruby-dev:11428] からの続きですが、threadは切りました。
高橋征義です。用語について。
At Wed, 8 Nov 2000 20:44:55 +0900,
高橋征義です。
At Thu, 9 Nov 2000 13:30:34 +0900,
まつもと ゆきひろです
[#11447] gets は secure? — Kazuhiro NISHIYAMA <zn@...>
出力がInsecureなのに入力はsecureなのでしょうか?
[#11467] debug write in regex.c? — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11500] rb_to_integer/rb_to_int — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>
岡と申します。
なかだです。
まつもと ゆきひろです
なかだです。
岡です。
なかだです。
なかだです。
岡です。
なかだです。
[#11569] blocking on socket? — Shugo Maeda <shugo@...>
前田です。
[#11591] object.c パッチ — Kazuhiro NISHIYAMA <zn@...>
使われてなかったnil_plusの削除とOBJ_INFECTへの変更です。
[#11611] return value of waitpid2 — Koji Arai <JCA02266@...>
新井です。
まつもと ゆきひろです
荒井です。いや、新井です。(よくあることさ)
まつもと ゆきひろです
新井です。
新井です。
[#11618] Re: class variable — "Koji Arai" <jca02266@...>
新井です
なかだです。
まつもと ゆきひろです
> まつもと ゆきひろです
まつもと ゆきひろです
まつもと ゆきひろです
新井です。
[#11641] eval too slow — Wakou Aoyama <wakou@...>
青山です。
[#11650] conflict of NODE_DREGX_ONCE — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>
In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,
In article <hvor93w5wb8.fsf@coulee.m17n.org>,
In article <hvoofz05uwz.fsf@coulee.m17n.org>,
まつもと ゆきひろです
新井です。
まつもと ゆきひろです
In article <E141eaC-0003w0-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E142ZqF-0004rX-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143Zem-000271-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143amj-00028V-00@ev.netlab.zetabits.co.jp>,
[ruby-dev:11373] Re: Ruby I18N
まつもと ゆきひろです
In message "[ruby-dev:11371] Re: Ruby I18N"
on 00/11/02, " たけ (tk)" <ggb03124@nifty.ne.jp> writes:
| 文字列や正規表現の内部構造と処理方法は次のような感じになると考えていい
|のでしょうか?。
|
| ┌────────┬──────────┬───────────
| │データバッファの│文字コード系の種類の│実際のデータ・・・
| │長さ │IDもしくはポインタ│(生のまま)
| └────────┴──────────┴───────────
そうですね。実装はどうなるかはともかくこのような情報を持つで
しょう。
| それで、実際の処理は、文字コード系に応じた「一文字取りだしルーティン」
|とか「比較ルーティン」とかを呼び出して行う。
|
| * または、文字コード系ごとに「String クラスのサブクラス」とする。
|
| −−
|
| しかしそれだと、
|
| (1) 文字コード系がステートフルや可変長であっても、構わないことにな
|る。(文字列の一部をカットするのも文字コード系毎のルーティンを呼び出すこ
|とになるので問題がなくなる。また、入出力も文字コード系毎のルーティンを使
|うとすると、その処理系でステートレスに変換して収納しても構わないことにな
|る)。
「可変長」についてはその通りです。というか、マルチバイト文字
コード系はすべて可変長ですよね。
ステートフルな文字コード系については以前にもちょっと考えたこ
とがあったのですが、やはり現実的には無理じゃないかと思います。
各アクセス毎に頭からスキャンすれば別ですが。
また、「その処理系でステートレスに変換して収納しても構わない
ことになる」ことについては、今回は「文字コード系の変換を行わ
ない」ことが前提になっているため「構わない」とは言えないと思
います。
| (2) 取り出した文字の個々の文字コード(Fixnum)にも「文字コード系の
|種類」のデータが付加されていなければならない。(そうでないと、一文字を取
|り出した後で「文字コード系が違うので処理を拒否する」ということが出来なく
|なる)。
現時点では「拒否できなくても構わない」と思ってます。
コード系の違う文字列同士の処理を拒否するのは、処理が現実的に
不可能であるからで、コード系の違う文字の混在まで拒否するのは
やりすぎではないかと思います。でないと、たとえば、EUC-JPのあ
る文字(Fixnum)に対応するSJISの文字を得て、SJIS文字列に埋め込
むといった処理が現実的にできなくなります。
| (3) それぞれの文字コード毎のルーティンで「他の文字コード系から自分
|の文字コード系への変換」ルーティンを用意すると、文字コード系が異なってい
|ても処理が可能になる。(coerce の文字列への適用?)。
文字コード系毎に用意すべき処理はまだ明らかになってませんから、
このことは可能かもしれません。
| 以下のあたりをつらつら読んでいました。
後で見てみます。
まつもと ゆきひろ /:|)