[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
>From: matz@zetabits.com (Yukihiro Matsumoto)
まつもと ゆきひろです
[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>
[ruby-dev:11428] からの続きですが、threadは切りました。
高橋征義です。用語について。
At Wed, 8 Nov 2000 20:44:55 +0900,
高橋征義です。
At Thu, 9 Nov 2000 13:30:34 +0900,
まつもと ゆきひろです
[#11447] gets は secure? — Kazuhiro NISHIYAMA <zn@...>
出力がInsecureなのに入力はsecureなのでしょうか?
[#11467] debug write in regex.c? — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11500] rb_to_integer/rb_to_int — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>
岡と申します。
なかだです。
まつもと ゆきひろです
なかだです。
岡です。
なかだです。
なかだです。
岡です。
なかだです。
[#11569] blocking on socket? — Shugo Maeda <shugo@...>
前田です。
[#11591] object.c パッチ — Kazuhiro NISHIYAMA <zn@...>
使われてなかったnil_plusの削除とOBJ_INFECTへの変更です。
[#11611] return value of waitpid2 — Koji Arai <JCA02266@...>
新井です。
まつもと ゆきひろです
荒井です。いや、新井です。(よくあることさ)
まつもと ゆきひろです
新井です。
新井です。
[#11618] Re: class variable — "Koji Arai" <jca02266@...>
新井です
なかだです。
まつもと ゆきひろです
> まつもと ゆきひろです
まつもと ゆきひろです
まつもと ゆきひろです
新井です。
[#11641] eval too slow — Wakou Aoyama <wakou@...>
青山です。
[#11650] conflict of NODE_DREGX_ONCE — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>
In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,
In article <hvor93w5wb8.fsf@coulee.m17n.org>,
In article <hvoofz05uwz.fsf@coulee.m17n.org>,
まつもと ゆきひろです
新井です。
まつもと ゆきひろです
In article <E141eaC-0003w0-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E142ZqF-0004rX-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143Zem-000271-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143amj-00028V-00@ev.netlab.zetabits.co.jp>,
[ruby-dev:11491] Re: class Character (was: Ruby I18N)
まつもと ゆきひろです
In message "[ruby-dev:11490] Re: class Character (was: Ruby I18N)"
on 00/11/13, Tanaka Akira <akr@m17n.org> writes:
|EUC-JP と Shift_JIS において、コードポイントはどのように割り当てるつも
|りでしょうか?
現時点ではシングルバイトなものはそのまま、マルチバイトなもの
は (byte1<<16) | byte2 で得られたものとしようと考えてます。
ですから、結果として
|具体的にいえば、仮に、String::XXX#[] が n 番目のコードポイントを返すも
|のであるとすれば、EUC-JP な "あ"[0] と Shift_JIS な "あ"[0] の値は等し
|いのか異なるのか、ということです。
は異なるものとなるでしょう。あくまでも結果として、ですが。
で、そのコードポイントが自分のコード系を知っているかどうかは
未定です。
|まぁ、ひとつの立場ではあります。だれもが文字とコードポイントと整数の違
|いを理解してくれればうまくいきます。でもそれは無理だと歴史が証明してい
|る気がします。
なるほどねえ。
|例えば、C でバイトと文字が両方とも char であることを信じているプログラ
|ム(と信じている人の意識)を変えることは現在進行形な苦難の道なわけです。
|
|同様に、コードポイントと文字は Fixnum であることを信じているプログラム
|(と信じている人の意識)を変えることは苦難の道になるのではないかなぁ、と。
|
|変える必要がある状況というのは、たとえば、合成文字のように Fixnum には
|収められないものを文字として扱いたくなったときなどです。合成文字を扱う
|コードをアプリケーション毎に入れていくか、文字列側に入れてアプリケーショ
|ン側の不都合を一つ一つ潰していくかという選択肢はありますが、どちらにし
|てもあまり楽しい作業ではないと思います。
|
|文字クラスを入れようという提案は、文字そのものを与えることによって上記
|の信仰を防ごうという背景があります。EUC-JP と Shift_JIS のコードポイン
|ト割当の話も、信仰を防ぐという背景は同じです。やりかたはずいぶんと違い
|ますが。
|
|そう信仰されてもべつに構わない、でしょうか?
これについては現在の私は、まだ結論を持ってないです。「別に構
わないじゃない」という思いも正直あるのですが、ほぼ間違いなく
将来後悔しそう...
|あと、合成文字のような面倒な問題は扱わない、というのは Unicode よりも
|低い目標です。日本語については文字の数が多いという点を除けば処理は非常
|に簡単なので問題ないでしょうが。それ以外の問題は扱わない、というのは
|「まぁ、日本語のことしか知らないとこうなるよな」といわれてもしかたがな
|い選択でしょう。それだったらまじめに Unicode を実装した方がましだと思
|います。
|
|Unicode は世界中の文字コードを集めて、その上での処理(アルゴリズム)を決
|めています。表示するには、比較するには、合成文字を扱うには、文字の並び
|が逆だったらどうするか、とか。もちろんこれは Unicode 流のやりかたであっ
|てそれが常に正しいという話ではありませんが、それなりには処理できるかも
|しれません。もし、Unicode 「も」扱えるようにするのなら、これらの処理が
|適切に収まるべき場所を用意する必要がありますが...
これらの処理の処理の居場所は文字列(Stringとかそのサブクラス)
にあるんじゃないかと思ってるんですが、そう思うのはただ単に私
がUnicode の勉強をサボってるからですかねえ。
まつもと ゆきひろ /:|)