[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
>From: matz@zetabits.com (Yukihiro Matsumoto)
まつもと ゆきひろです
[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>
[ruby-dev:11428] からの続きですが、threadは切りました。
高橋征義です。用語について。
At Wed, 8 Nov 2000 20:44:55 +0900,
高橋征義です。
At Thu, 9 Nov 2000 13:30:34 +0900,
まつもと ゆきひろです
[#11447] gets は secure? — Kazuhiro NISHIYAMA <zn@...>
出力がInsecureなのに入力はsecureなのでしょうか?
[#11467] debug write in regex.c? — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11500] rb_to_integer/rb_to_int — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>
岡と申します。
なかだです。
まつもと ゆきひろです
なかだです。
岡です。
なかだです。
なかだです。
岡です。
なかだです。
[#11569] blocking on socket? — Shugo Maeda <shugo@...>
前田です。
[#11591] object.c パッチ — Kazuhiro NISHIYAMA <zn@...>
使われてなかったnil_plusの削除とOBJ_INFECTへの変更です。
[#11611] return value of waitpid2 — Koji Arai <JCA02266@...>
新井です。
まつもと ゆきひろです
荒井です。いや、新井です。(よくあることさ)
まつもと ゆきひろです
新井です。
新井です。
[#11618] Re: class variable — "Koji Arai" <jca02266@...>
新井です
なかだです。
まつもと ゆきひろです
> まつもと ゆきひろです
まつもと ゆきひろです
まつもと ゆきひろです
新井です。
[#11641] eval too slow — Wakou Aoyama <wakou@...>
青山です。
[#11650] conflict of NODE_DREGX_ONCE — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>
In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,
In article <hvor93w5wb8.fsf@coulee.m17n.org>,
In article <hvoofz05uwz.fsf@coulee.m17n.org>,
まつもと ゆきひろです
新井です。
まつもと ゆきひろです
In article <E141eaC-0003w0-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E142ZqF-0004rX-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143Zem-000271-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143amj-00028V-00@ev.netlab.zetabits.co.jp>,
[ruby-dev:11483] Re: class Character (was: Ruby I18N)
At Sat, 11 Nov 2000 11:56:38 +0900,
TAKAHASHI Masayoshi <maki@open-news.com> wrote:
# 文字列の話
> > 「code point以外を取り出すのが厄介」と言うのがいまいち理解できないのです
> > が… (__; 今の Rubyのままでは code pointしか取り出せないのではないでしょ
> > うか?
>
> すみません、基本的な話で、文字列をcode point単位以外で切り出す
> のが厄介、という話です。
あぁ〜、String::UTF_8#[]とかですか。(もちろんそれが Characterクラスを返
すと仮定してですが…)
> 要するにあるcode pointについて、それが1文字なのか、それとも合成される
> べきものなのかを判断するのが面倒だと。Unicodeなら合成文字かどうかを判
> 断するアルゴリズムがないので、毎回テーブルを参照して合成文字かどうかを
> 判断する必要があるわけですよね? それはちょっとなあ、と。
それは、各 CESの moduleにがんばってもらうしか(^^;
文字の操作のコストは高くてもしかたないんじゃないですかね?
> # 言葉遣いとしてcode pointじゃなくてcode unitの方が適切なのかしらん。
# う〜ん、よく知らない(^^; code unitって UTF-8だと 8bitとか言うあれです
# よね?
# ここから下は文字の話
> > 複数の code pointで一つの文字を表わしている場合は、単純に複数の code
> > pointを返すというのはどうですか?
>
> その方針ではおそらくそうなると思いますが、上記のようにそれを行う
> のにコストがかかる、と。どこで(時間と空間の)コストを負担するかは、
> データの持たせ方によると思いますけど。
高橋さんの書いてる通り、dataの持たせかたでかなり使えると思います。教えて
もらった言葉そのままで恐縮なのですが、文字オブジェクトが instance
variableとして code pointやなんかを持っていればそのオブジェクトを作る時
だけ時間がかかりますがあとは普通の Ruby objectと同じ(くできるはず)です。
> > 田中さんが書いていたけど、code pointとか byte列だとかを隠せる文字がある
> > と便利だと思うんですが…。
>
> というわけで、結局は効率の問題なんでしょうね。
まつもとさんは効率より「文字とは」を問題視してますね(^^;
# 文字を(とりあえず今は)定義できないなら、いろいろな実装を助けるように
# Rubyを実装するのも面白いかも。
# なんか自分が勘違いしてるっぽいので、つっこみお待ちしておりますです。
--
yashi