[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
>From: matz@zetabits.com (Yukihiro Matsumoto)
まつもと ゆきひろです
[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>
[ruby-dev:11428] からの続きですが、threadは切りました。
高橋征義です。用語について。
At Wed, 8 Nov 2000 20:44:55 +0900,
高橋征義です。
At Thu, 9 Nov 2000 13:30:34 +0900,
まつもと ゆきひろです
[#11447] gets は secure? — Kazuhiro NISHIYAMA <zn@...>
出力がInsecureなのに入力はsecureなのでしょうか?
[#11467] debug write in regex.c? — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11500] rb_to_integer/rb_to_int — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>
岡と申します。
なかだです。
まつもと ゆきひろです
なかだです。
岡です。
なかだです。
なかだです。
岡です。
なかだです。
[#11569] blocking on socket? — Shugo Maeda <shugo@...>
前田です。
[#11591] object.c パッチ — Kazuhiro NISHIYAMA <zn@...>
使われてなかったnil_plusの削除とOBJ_INFECTへの変更です。
[#11611] return value of waitpid2 — Koji Arai <JCA02266@...>
新井です。
まつもと ゆきひろです
荒井です。いや、新井です。(よくあることさ)
まつもと ゆきひろです
新井です。
新井です。
[#11618] Re: class variable — "Koji Arai" <jca02266@...>
新井です
なかだです。
まつもと ゆきひろです
> まつもと ゆきひろです
まつもと ゆきひろです
まつもと ゆきひろです
新井です。
[#11641] eval too slow — Wakou Aoyama <wakou@...>
青山です。
[#11650] conflict of NODE_DREGX_ONCE — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>
In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,
In article <hvor93w5wb8.fsf@coulee.m17n.org>,
In article <hvoofz05uwz.fsf@coulee.m17n.org>,
まつもと ゆきひろです
新井です。
まつもと ゆきひろです
In article <E141eaC-0003w0-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E142ZqF-0004rX-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143Zem-000271-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143amj-00028V-00@ev.netlab.zetabits.co.jp>,
[ruby-dev:11490] Re: class Character (was: Ruby I18N)
In article <E13v0l1-0004yL-00@ev.netlab.zetabits.co.jp>, matz@zetabits.com (Yukihiro Matsumoto) writes: > ですから、今後とも提案、助言は歓迎します。 ふむ。では少し違う側面から。 EUC-JP と Shift_JIS において、コードポイントはどのように割り当てるつも りでしょうか? 具体的にいえば、仮に、String::XXX#[] が n 番目のコードポイントを返すも のであるとすれば、EUC-JP な "あ"[0] と Shift_JIS な "あ"[0] の値は等し いのか異なるのか、ということです。 たぶん、UTF-8 な "あ"[0] とは異なるものになるでしょうから、私としては ぜひとも異なるものにして欲しいと思っています。 これを同じものにしてしまうのは、日本語圏内における新たな文字コードを設 計することそのものです。文字コードを新しく作ることはしないと書いていた ような気がするので、そうはしないのであろうと期待していますけれど。 それに、ISO-2022-JP (を適当に変換して stateless にしたもの)な文字列を 扱おうと思えば、JIS X 0208 1978 をどうするかも問題になりますしね。 > というか、標準で提供する文字列処理から「文字」を切り離してし > まうことを考えています。つまり、バイト列またはコードポイント > 列だけを扱うというスタンスです。そうすると文字列処理は数値の > 並びの処理に還元されるので。これが「それなり」ってことなのか > しら? まぁ、ひとつの立場ではあります。だれもが文字とコードポイントと整数の違 いを理解してくれればうまくいきます。でもそれは無理だと歴史が証明してい る気がします。 例えば、C でバイトと文字が両方とも char であることを信じているプログラ ム(と信じている人の意識)を変えることは現在進行形な苦難の道なわけです。 同様に、コードポイントと文字は Fixnum であることを信じているプログラム (と信じている人の意識)を変えることは苦難の道になるのではないかなぁ、と。 変える必要がある状況というのは、たとえば、合成文字のように Fixnum には 収められないものを文字として扱いたくなったときなどです。合成文字を扱う コードをアプリケーション毎に入れていくか、文字列側に入れてアプリケーショ ン側の不都合を一つ一つ潰していくかという選択肢はありますが、どちらにし てもあまり楽しい作業ではないと思います。 文字クラスを入れようという提案は、文字そのものを与えることによって上記 の信仰を防ごうという背景があります。EUC-JP と Shift_JIS のコードポイン ト割当の話も、信仰を防ぐという背景は同じです。やりかたはずいぶんと違い ますが。 そう信仰されてもべつに構わない、でしょうか? あと、合成文字のような面倒な問題は扱わない、というのは Unicode よりも 低い目標です。日本語については文字の数が多いという点を除けば処理は非常 に簡単なので問題ないでしょうが。それ以外の問題は扱わない、というのは 「まぁ、日本語のことしか知らないとこうなるよな」といわれてもしかたがな い選択でしょう。それだったらまじめに Unicode を実装した方がましだと思 います。 Unicode は世界中の文字コードを集めて、その上での処理(アルゴリズム)を決 めています。表示するには、比較するには、合成文字を扱うには、文字の並び が逆だったらどうするか、とか。もちろんこれは Unicode 流のやりかたであっ てそれが常に正しいという話ではありませんが、それなりには処理できるかも しれません。もし、Unicode 「も」扱えるようにするのなら、これらの処理が 適切に収まるべき場所を用意する必要がありますが... 私の推測としてはこの調子でいくとわりと中途半端というか、寿命が短いとい うか、不満を解消しにくいものになるんじゃないかなぁ、と思っています。個 人的には多言語処理はめったにしないので、まったく困りませんし、いろんな 立場があっていいという主義なのでそれはそれでいいと思ってはいますが。 -- [田中 哲][たなか あきら][Tanaka Akira] 「くっだらないコト聞いちゃったねー$(C⊇ ごっめーん$(C⊇」 (魔法使い養成専門 マジックスター学院 2, 南澤ミヅキ)