[#32945] Shift_JIS variants and UTF-16 support — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

22 messages 2008/01/07
[#32953] Re: Shift_JIS variants and UTF-16 support — Martin Duerst <duerst@...> 2008/01/07

中村さん、こんにちは。

[#32955] Re: Shift_JIS variants and UTF-16 support — Yukihiro Matsumoto <matz@...> 2008/01/07

まつもと ゆきひろです

[#32959] Re: Shift_JIS variants and UTF-16 support — "NARUSE, Yui" <naruse@...> 2008/01/07

成瀬です。

[#32960] Re: Shift_JIS variants and UTF-16 support — Yukihiro Matsumoto <matz@...> 2008/01/07

まつもと ゆきひろです

[#32992] ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — "NARUSE, Yui" <naruse@...>

成瀬です。

18 messages 2008/01/08
[#32994] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Yukihiro Matsumoto <matz@...> 2008/01/09

まつもと ゆきひろです

[#32995] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Martin Duerst <duerst@...> 2008/01/09

At 18:13 08/01/09, Yukihiro Matsumoto wrote:

[#33011] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — "NARUSE, Yui" <naruse@...> 2008/01/11

成瀬です。

[#33012] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Yukihiro Matsumoto <matz@...> 2008/01/11

まつもと ゆきひろです

[#33014] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — "NARUSE, Yui" <naruse@...> 2008/01/11

成瀬です。

[#33015] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Yukihiro Matsumoto <matz@...> 2008/01/11

まつもと ゆきひろです

[#33239] Re: [ruby-cvs:22386] Ruby:r15149 (trunk): * string.c (rb_str_each_char): move forward. — Tanaka Akira <akr@...>

In article <200801210259.m0L2x3CW017171@ci.ruby-lang.org>,

11 messages 2008/01/21
[#33240] Re: [ruby-cvs:22386] Ruby:r15149 (trunk): * string.c (rb_str_each_char): move forward. — Nobuyoshi Nakada <nobu@...> 2008/01/21

なかだです。

[#33303] Time#strftimeのエンコーディング — rubikitch@...

るびきちです。

13 messages 2008/01/23
[#33305] Re: Time#strftimeのエンコーディング — Yukihiro Matsumoto <matz@...> 2008/01/23

まつもと ゆきひろです

[#33368] summary of script encoding — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

22 messages 2008/01/25
[#33375] Re: summary of script encoding — Yukihiro Matsumoto <matz@...> 2008/01/25

まつもと ゆきひろです

[#33376] Re: summary of script encoding — "U.Nakamura" <usa@...> 2008/01/25

こんにちは、なかむら(う)です。

[#33387] HashからStructを作る — rubikitch@...

るびきちです。

19 messages 2008/01/25
[#33455] Re: HashからStructを作る — Yukihiro Matsumoto <matz@...> 2008/01/28

まつもと ゆきひろです

[#33505] Re: HashからStructを作る — rubikitch@... 2008/01/29

From: Yukihiro Matsumoto <matz@ruby-lang.org>

[#33507] Re: HashからStructを作る — Yukihiro Matsumoto <matz@...> 2008/01/29

まつもと ゆきひろです

[#33508] Re: HashからStructを作る — rubikitch@... 2008/01/29

From: Yukihiro Matsumoto <matz@ruby-lang.org>

[#33433] Win32OLE: set encoding to OLE string — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

16 messages 2008/01/28

[#33461] Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...>

=1B$B?9ED$H?=3D$7$^$9!#=1B(B

19 messages 2008/01/28
[#33473] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Nobuyoshi Nakada <nobu@...> 2008/01/28

なかだです。

[#33503] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/29

森田です。

[#33514] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Nobuyoshi Nakada <nobu@...> 2008/01/29

なかだです。

[#33518] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/30

森田です。

[#33545] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Ryutaro Amano <wn9r-amn@...> 2008/01/31

天野竜太郎と申します。

[#33546] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/31

森田です。

[#33547] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Ryutaro Amano <wn9r-amn@...> 2008/01/31

天野です。

[#33551] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/31

森田です。

[#33488] 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...>

永井@知能.九工大です.

20 messages 2008/01/29
[#33491] Re: 現在の script encoding の値を得る方法は? — Yukihiro Matsumoto <matz@...> 2008/01/29

まつもと ゆきひろです

[#33500] Re: 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...> 2008/01/29

永井@知能.九工大です.

[#33501] Re: 現在の script encoding の値を得る方法は? — "NARUSE, Yui" <naruse@...> 2008/01/29

成瀬です。

[#33515] Re: 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...> 2008/01/30

永井@知能.九工大です.

[#33516] Re: 現在の script encoding の値を得る方法は? — "NARUSE, Yui" <naruse@...> 2008/01/30

成瀬です。

[#33519] Re: 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...> 2008/01/30

永井@知能.九工大です.

[#33522] Re: 現在の script encoding の値を得る方法は? — "NARUSE, Yui" <naruse@...> 2008/01/30

成瀬です。

[ruby-dev:33121] Re: Binary String

From: Hidetoshi NAGAI <nagai@...>
Date: 2008-01-15 09:48:40 UTC
List: ruby-dev #33121
永井@知能.九工大です.

From: "NARUSE, Yui" <naruse@airemix.com>
Subject: [ruby-dev:33108] Re: Binary String
Date: Tue, 15 Jan 2008 09:08:04 +0900
Message-ID: <478BF952.9080508@airemix.com>
> > この変換処理の判定をすべてのケースについて記述しようとすると,
> > コードの量が極度に増えてしまう危険性が大きく,
> > 新しい Tcl/Tk の機能/属性に対してもその度に対応作業が
> > 必要になる可能性も高まるため,避ける必要があります.
> 
> ソースをざっと見ただけなので間違っているかもしれませんが、本当にそうです
> か。tk_call_without_enc とかの binary 版を作れば解決したりしませんかね。

ダメだと思います.

ソースをご覧になったのであればご承知とは思いますが,
tk_call_without_enc は,ascii のみと分かっているか,
あるいはすでに UTF-8 (または binary string) に変換済で
それ以上の変換が必要がない場合に使えるものです.
結局はいずれかの段階で,Tk に渡すトークンごとに
どのように変換するかを決めてやる必要があります.
binary なのかを判断してやらねばなりません.

で,***この件単独であれば***,
ASCII-8BIT を binary として扱えというのなら
それでなんとかなると思います.

ですが,

> 違います、magic comment の指定されていないスクリプトの文字列リテラルのエ
> ンコーディングは ASCII-8BIT です。

というようなことがあるもので,どうにも受け入れがたく感じるのです.

この状況は Ruby 1.8 の場合と同様に思えます.
つまり,スクリプトの encoding は不明であるが,
Tk はその環境での encoding の情報を持っているという状況です.
Ruby 1.8 ではこの状況で,encoding 自動変換 + binary 明示という方法で,
encoding 変換をわざわざ明示して書かずともうまく機能しています.

Ruby 1.9 で,magic comment がなければ ASCII-8BIT になり
binary == ASCII-8BIT とするのであるならば,
これまで動いていた Ruby 1.8 のスクリプトに対しては
次のようになると思います.

(1) これまでと同様に動くようにするため,
    Ruby 1.8 と同様に binary を明示する情報を付与する.

    せっかく encoding 情報を持つようになったのに,
    それを利用しないという方法です.
    でも,一般ユーザは ASCII-8BIT を binary として
    使おうとするかもしれません.
    似て異なる情報を持たせねばならないという
    気持ちの悪い状況ではあります.

(2) Ruby 1.8 で動いていた Ruby/Tk のソースは
    文字化けしてしまうのというのを諦めてもらう.

    ソースの互換性を捨ててしまうという対応です.
    動かしたければ,適切な magic comment の付与が必要です.
    このような互換性は捨ててしまうべきという意見もありそうですが,
    私は,不可能でない限りは互換性を極力維持したいと
    考える方ですので,心情としてはかなり辛い選択です.

不明時の encoding である ASCII-8BIT と区別できるような 
binary encoding が存在しさえすれば互換性維持ができると思ってます.
そのために導入をお願いしてきたわけですが,
どうしても binary encoding を加えるつもりはないということであれば,
非常に残念ですが上記の (2) を選択することにします.

# さすがに (1) は将来に大きな禍根を残しそうですので.

というわけで,本当に最後の質問です.
binary encoding 導入,または ASCII-8BIT と UNKNOWN-8BIT の区別は
どうしてもダメですか?
-- 
                                       永井 秀利 (九工大 知能情報)
                                           nagai@ai.kyutech.ac.jp

In This Thread