[#32945] Shift_JIS variants and UTF-16 support — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

22 messages 2008/01/07
[#32953] Re: Shift_JIS variants and UTF-16 support — Martin Duerst <duerst@...> 2008/01/07

中村さん、こんにちは。

[#32955] Re: Shift_JIS variants and UTF-16 support — Yukihiro Matsumoto <matz@...> 2008/01/07

まつもと ゆきひろです

[#32959] Re: Shift_JIS variants and UTF-16 support — "NARUSE, Yui" <naruse@...> 2008/01/07

成瀬です。

[#32960] Re: Shift_JIS variants and UTF-16 support — Yukihiro Matsumoto <matz@...> 2008/01/07

まつもと ゆきひろです

[#32992] ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — "NARUSE, Yui" <naruse@...>

成瀬です。

18 messages 2008/01/08
[#32994] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Yukihiro Matsumoto <matz@...> 2008/01/09

まつもと ゆきひろです

[#32995] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Martin Duerst <duerst@...> 2008/01/09

At 18:13 08/01/09, Yukihiro Matsumoto wrote:

[#33011] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — "NARUSE, Yui" <naruse@...> 2008/01/11

成瀬です。

[#33012] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Yukihiro Matsumoto <matz@...> 2008/01/11

まつもと ゆきひろです

[#33014] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — "NARUSE, Yui" <naruse@...> 2008/01/11

成瀬です。

[#33015] Re: ASCII is alias of US-ASCII; replica of dummy encoding is not a dummy — Yukihiro Matsumoto <matz@...> 2008/01/11

まつもと ゆきひろです

[#33239] Re: [ruby-cvs:22386] Ruby:r15149 (trunk): * string.c (rb_str_each_char): move forward. — Tanaka Akira <akr@...>

In article <200801210259.m0L2x3CW017171@ci.ruby-lang.org>,

11 messages 2008/01/21
[#33240] Re: [ruby-cvs:22386] Ruby:r15149 (trunk): * string.c (rb_str_each_char): move forward. — Nobuyoshi Nakada <nobu@...> 2008/01/21

なかだです。

[#33303] Time#strftimeのエンコーディング — rubikitch@...

るびきちです。

13 messages 2008/01/23
[#33305] Re: Time#strftimeのエンコーディング — Yukihiro Matsumoto <matz@...> 2008/01/23

まつもと ゆきひろです

[#33368] summary of script encoding — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

22 messages 2008/01/25
[#33375] Re: summary of script encoding — Yukihiro Matsumoto <matz@...> 2008/01/25

まつもと ゆきひろです

[#33376] Re: summary of script encoding — "U.Nakamura" <usa@...> 2008/01/25

こんにちは、なかむら(う)です。

[#33387] HashからStructを作る — rubikitch@...

るびきちです。

19 messages 2008/01/25
[#33455] Re: HashからStructを作る — Yukihiro Matsumoto <matz@...> 2008/01/28

まつもと ゆきひろです

[#33505] Re: HashからStructを作る — rubikitch@... 2008/01/29

From: Yukihiro Matsumoto <matz@ruby-lang.org>

[#33507] Re: HashからStructを作る — Yukihiro Matsumoto <matz@...> 2008/01/29

まつもと ゆきひろです

[#33508] Re: HashからStructを作る — rubikitch@... 2008/01/29

From: Yukihiro Matsumoto <matz@ruby-lang.org>

[#33433] Win32OLE: set encoding to OLE string — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

16 messages 2008/01/28

[#33461] Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...>

=1B$B?9ED$H?=3D$7$^$9!#=1B(B

19 messages 2008/01/28
[#33473] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Nobuyoshi Nakada <nobu@...> 2008/01/28

なかだです。

[#33503] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/29

森田です。

[#33514] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Nobuyoshi Nakada <nobu@...> 2008/01/29

なかだです。

[#33518] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/30

森田です。

[#33545] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Ryutaro Amano <wn9r-amn@...> 2008/01/31

天野竜太郎と申します。

[#33546] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/31

森田です。

[#33547] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — Ryutaro Amano <wn9r-amn@...> 2008/01/31

天野です。

[#33551] Re: Failed to make ruby-1.8.6-p111 on MacOSX 10.5(Leopard) — MORITA Hideyuki <h-morita@...> 2008/01/31

森田です。

[#33488] 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...>

永井@知能.九工大です.

20 messages 2008/01/29
[#33491] Re: 現在の script encoding の値を得る方法は? — Yukihiro Matsumoto <matz@...> 2008/01/29

まつもと ゆきひろです

[#33500] Re: 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...> 2008/01/29

永井@知能.九工大です.

[#33501] Re: 現在の script encoding の値を得る方法は? — "NARUSE, Yui" <naruse@...> 2008/01/29

成瀬です。

[#33515] Re: 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...> 2008/01/30

永井@知能.九工大です.

[#33516] Re: 現在の script encoding の値を得る方法は? — "NARUSE, Yui" <naruse@...> 2008/01/30

成瀬です。

[#33519] Re: 現在の script encoding の値を得る方法は? — Hidetoshi NAGAI <nagai@...> 2008/01/30

永井@知能.九工大です.

[#33522] Re: 現在の script encoding の値を得る方法は? — "NARUSE, Yui" <naruse@...> 2008/01/30

成瀬です。

[ruby-dev:33047] Re: Binary String

From: Tanaka Akira <akr@...>
Date: 2008-01-11 16:26:46 UTC
List: ruby-dev #33047
In article <20080112.004750.74741782.nagai@ai.kyutech.ac.jp>,
  Hidetoshi NAGAI <nagai@ai.kyutech.ac.jp> writes:

> であるなら,byte sequence ではない String には
> ASCII-8BIT が付与されてはならないのではないでしょうか.
> その場合,未知のものに Ruby が勝手に付与するなら,
> UNKNOWN-8BIT などにしてもらわないと困ります.
> Ruby によって ASCII-8BIT が勝手に付与される可能性がある限り,
> ASCII-8BIT を信頼して使うことはできません.
> 
> 言い換えると,Ruby/Tk では,現状で ASCII-8BIT となっている場合は
> 上で言う UNKNOWN-8BIT と考えて扱おうとしています.

私は、不適切なものが充分に少なければいいだろうと思っています。

> 不足が存在しなくなれば ASCII-8BIT が勝手に付与されることはないのなら
> それはそれで「あり」なのかもしれませんが,
> それが不足している間はどうなるのでしょうか?
> 今後新たな encoding が増加することはないという保証はあるのでしょうか?
> あるいは,増加した場合は遅滞なく encoding が追加されるなどと
> 保証することができるのでしょうか?

encoding の増加はあるにしてもゆっくりしたものであると想定し
ています。これには理由があります。

1. encoding は国などが制定する規格であること多く、個人が好き
   勝手に定義することはあまりない

2. Unicode の普及により、Unicode 以外の文字コードの規格を作
   る動機は減少している

もちろん保証はできません。どこかの国が、いきなり気が狂ったよ
うにたくさんの文字コード規格を定義し始めないとも限りません。
また、そういうことを行う独立国を作る人がいないとは限りません。
ですが、まずそんなことはないだろうとも思います。

> 現状では
> ------------------------------------------------------------------------
> $ echo $LANG
> ja_JP.eucJP
> $ ruby19 -v 
> ruby 1.9.0 (2008-01-10 revision 0) [i686-linux]
> $ ruby19 -e 'a = "aaa"; e = "漢字"; p [a.encoding, e.encoding, Encoding.default_external]'
> [#<Encoding:ASCII-8BIT>, #<Encoding:ASCII-8BIT>, #<Encoding:EUC-JP>]
> ------------------------------------------------------------------------
> ということになりますが,これは現状が間違っているということでしょうか?

最初の a は ASCII しか含まれていないので ASCII-8BIT となって
いても、変換せずに送ってもなんの問題もないと思います。

次の e は Ruby スクリプトの文字コードは locale に依存せず、
magic comment で記述するという規則だからです。これはスクリプ
ト自体が locale に関係なく動くことが期待されているのが理由で
す。スクリプトに非 ASCII 文字を使うときは magic comment を書
いてください。

ここで永井さんの変換の問題は e だと思いますが、スクリプトを
locale 依存にしたいということですか?

>> ASCII-8BIT を非ASCII文字列に広く用るのは意図されていません。
>> 広く用いられてしまうことを避ける方向へいくのは不可能だと考え
>> ていますか?
>
> Ruby が勝手に付与する可能性がある限りは不可能だと考えています.

可能性が 0 でなければ許せないということですか?

>> ASCII-8BIT を使ってください。
>
> 残念ながら,上記の現状を見る限り,信頼することができません.

示された e という例については Ruby スクリプトの encoding に
関する意図的な規則によるものです。

スクリプトに非 ASCII 文字を書くなら magic comment を書くとい
うのは受け入れられませんか?

tk だけでなく、例えば rdoc でも Ruby スクリプトを処理すると
きに非 ASCII 文字が入っているなら magic comment を書いておい
てもらわないと処理に困るのですが。
-- 
[田中 哲][たなか あきら][Tanaka Akira]

In This Thread