[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>

なかだです。

18 messages 2000/11/01
[#11358] Re: [PATCH] an analogue of `long long' — matz@... (Yukihiro Matsumoto) 2000/11/01

まつもと ゆきひろです

[#11364] Re: [PATCH] an analogue of `long long' — EGUCHI Osamu <eguchi@...> 2000/11/02

えぐち@エスアンドイー です。

[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>

[ruby-dev:11428] からの続きですが、threadは切りました。

14 messages 2000/11/08
[#11442] Re: class Character (was: Ruby I18N) — TAKAHASHI Masayoshi <maki@...> 2000/11/08

高橋征義です。用語について。

[#11443] Re: class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...> 2000/11/08

At Wed, 8 Nov 2000 20:44:55 +0900,

[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>

岡と申します。

22 messages 2000/11/15
[#11523] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11528] Re: A problem of Socket methods on Windows — matz@... (Yukihiro Matsumoto) 2000/11/15

まつもと ゆきひろです

[#11532] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11534] Re: A problem of Socket methods on Windows — OKA Toshiyuki <oka@...> 2000/11/15

岡です。

[#11535] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11538] Re: A problem of Socket methods on Windows — "Nobuyoshi.Nakada" <nobu.nakada@...> 2000/11/15

なかだです。

[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>

In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,

22 messages 2000/11/28
[#11663] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/11/28

まつもと ゆきひろです

[#11664] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/28

In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,

[#11665] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/28

In article <hvor93w5wb8.fsf@coulee.m17n.org>,

[#11669] Re: IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org> 2000/11/29

In article <hvoofz05uwz.fsf@coulee.m17n.org>,

[#11672] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/11/29

まつもと ゆきひろです

[#11675] Re: IO (Re: fork problem?) — Koji Arai <JCA02266@...> 2000/11/30

新井です。

[#11677] Re: IO (Re: fork problem?) — matz@... (Yukihiro Matsumoto) 2000/12/01

まつもと ゆきひろです

[ruby-dev:11374] Re: Ruby I18N

From: TAKAHASHI Masayoshi <maki@...>
Date: 2000-11-04 14:34:21 UTC
List: ruby-dev #11374
高橋征義です。

matz@zetabits.com (Yukihiro Matsumoto)さん:
> UTR#17はまだちゃんと読んでないんですが、なんとなくうまく説明
> できないような気がします。文字集合から独立したエンコーディン
> グと言う概念がないようなので。

確かにそうですね。
用語も気にはなるのですが、まだあまり重要ではないと思うので置いておいて。

> んでもって、以下のことを考えてるわけです。
> 
>   * スクリプト言語における文字列処理に必要な情報のほとんどは
>     エンコーディングに関する情報のみである。わずかな例外は文
>     字種の判定である。
(略)
> ような気がしてるんですが、気のせいかなあ。

気になる点としては、以下のようなことがあります。

a) 「似たグリフを持つ字」の問題(Unicodeには「〜」に似た文字や「−」に
   似た字が死ぬほどある。これをJIS X 0208などの文字集合と合わせて扱お
   うとすると、文字集合のレベルで異なっていると考えられるので、エン
   コーディングの問題には帰着できない)。それともちろん包摂の問題。
b) 整列の問題(整列をまじめにやろうとすると、Localeに関する情報が
   必要になる)
c) 結合文字の問題(Unicodeではアクサンつき文字を1code pointで表す
   場合と2code pointsで表す場合がある。この場合の「長さ」は
   どうする?)

まあ、この辺りは、

a') エンコーディング変換についてはプラットフォーム依存
b') 整列はあきらめる or エンコーディング依存
c') compose/decomposeは別ライブラリに任せて、文字列クラスとしては
   単純に「length = code point数」とする

と、あっさり逃げるのが無難なのでしょうね。

高橋征義 (TAKAHASHI Masayoshi)       Email:maki@inac.co.jp

In This Thread