ruby-dev

At 18:12 07/09/28, NARUSE, Yui wrote:
>成瀬です。
>
>Yukihiro Matsumoto wrote:
>> encodeという名前は変換をイメージさせるのでよくないなあと思う
>> ようになりました。しかし、ま、名前は後で変えることにしてコミッ
>> トしてくださいませんか？
>
>変換なしに文字コード名を差し替えるだけの場合は String#encoding= で、
>変換を伴う場合は String#encode というのはどうなのでしょう。

言語学的には筋が通るところがありますが、一般のユーザーには混乱が
予想される。

>Shift_JIS を
>CP932 に差し替えるとか、

その二つの違いは具体的に何でしょうか。ただ後者で MS 特有の
外字が追加されたらバイト列→文字コード着きバイト列と同等なのは
すごく納得します。

しかし、iconv (一部?) みたいに、Shift_JIS の 0x5c を円記号、
CP932 の場合にはバックスラッシュ、という場合にはちょっと
違うのではないかと思います。

>バイト列に文字コードを教える場合に便利そうだなぁと。
>
># 個人的には encode よりも convert の方がしっくりくるのですが

全く同意です。

個人的には三種類のものがあるかと思います。
1) 解釈してないものを解釈する。これは場いつ列に文字コードを教える、
   (上記の条件で) Shift_JIS から CP932 とかが考えられている。
   これは 「interpret_as」とか 「as」みたいな名前がいいのではない
   かと思います。多分ここは逆のケースも入るのではないかと思います。
   (String#interpret_as('UNKNOWN-8BIT') とか; "UNKNOWN-8BIT" については
    http://www.iana.org/assignments/character-sets 参照)
2) 文字コードを無理矢理変えること。これは普通は余り使わない方がいいので、
   長い名前がいいのではないかと思います。例えば「force_encoding」とか
   のようなもの。
 ここまでの問題は、相当の情報がないとなかなか 1) と 2) をよく区別できない。

3) 文字コード情報をベースにコード変換を行う。これは多分
   String#convert と String#convert! ぐらいでいいだろうと思います。

宜しくお願いします。    Martin.



#-#-#  Martin J. Du"rst, Assoc. Professor, Aoyama Gakuin University
#-#-#  http://www.sw.it.aoyama.ac.jp       mailto:duerst@it.aoyama.ac.jp

Thread

Prev Next

In This Thread

Prev Next

[#31690] m17n questions — SASADA Koichi <ko1@...>

[#31692] cannot run test-all — "U.Nakamura" <usa@...>

[#31697] Re: [ruby-list:43970] 次の1.8.6 — Tadayoshi Funaba <tadf@...>

[#31698] Re: [ruby-cvs:20568] Ruby:r13331 (trunk): * eval_jump.ci (rb_f_catch): generate new tag object if no argument is — "U.Nakamura" <usa@...>

[#31702] [ANN] Rubyロゴコンテスト — Shugo Maeda <shugo@...>

[#31709] [BUG] non-initialized struct — Tanaka Akira <akr@...>

[#31710] optimize range space — Tanaka Akira <akr@...>

[#31715] string literal encoding — Nobuyoshi Nakada <nobu@...>

[#31729] packed st_table — Nobuyoshi Nakada <nobu@...>

[#31731] ordered/unordered st_table — Nobuyoshi Nakada <nobu@...>

[#31734] [m17n] String#chop & String#succ — Nobuyoshi Nakada <nobu@...>

[#31736] integer overflow in Array#[] — sheepman <sheepman@...>

[#31737] integer overflow in Array#[]= — sheepman <sheepman@...>

[#31738] integer overflow in Array#fill — sheepman <sheepman@...>

[#31739] integer overflow in String#[]= — sheepman <sheepman@...>

[#31740] FileTest.identical? with IO — sheepman <sheepman@...>

[#31743] deprecating RUBY_VERSION_CODE — Nobuyoshi Nakada <nobu@...>

[#31744] [m17n] String#encode — Nobuyoshi Nakada <nobu@...>

[#31748] typo at Array#cycle documentation — Yugui <yugui@...>

[#31754] Re: [ruby-cvs:20585] Ruby:r13348 (trunk): * array.c (rb_ary_cycle): typo in rdoc. a patch from Yugui — "U.Nakamura" <usa@...>

[#31759] SEGV by modifying __members__ — Tanaka Akira <akr@...>

[#31763] integer overflow in Range#step — sheepman <sheepman@...>

[#31768] shellescape — "Akinori MUSHA" <knu@...>

[#31774] RSTRING(value)->ptr == NULL ? — Tietew <tietew+ruby-dev@...>

[#31775] 1.9 on OpenBSD — SASADA Koichi <ko1@...>

[#31780] "string"[/str/]=:not_string dumps core — Nobuyoshi Nakada <nobu@...>

[#31781] `scan': character encodings differ (ArgumentError) — Kouhei Sutou <kou@...>

[#31786] rstripがstripしすぎる — Kouhei Sutou <kou@...>

[#31787] 文字列のinspect — eklerni <eklerni@...>

[#31798] generator from Enumerable#map — "Yusuke ENDOH" <mame@...>

[#31799] weakref.rbにデバッグ用print — "madoka yamamoto" <yamamotomadoka@...>

[#31802] hash value of { n => n } — "Yusuke ENDOH" <mame@...>

[#31804] TYPE(cl) in rb_obj_is_kind_of — Tanaka Akira <akr@...>

[#31806] rb_str_substr is much slower than rb_str_subpat — Nobuyoshi Nakada <nobu@...>

[#31810] rb_obj_is_kind_of — Tanaka Akira <akr@...>

[#31815] 文字列の式展開 — eklerni <eklerni@...>

[#31816] SEGV by removing undefined method — Tanaka Akira <akr@...>

[#31817] removing undefined method on 1.8 — Tanaka Akira <akr@...>

[#31818] SEGV by attr — Tanaka Akira <akr@...>

[#31819] rb_clear_cache_by_class — Tanaka Akira <akr@...>

[#31820] valgrind set_trace_func — Tanaka Akira <akr@...>

[#31821] unsubscribe — "Angadpreet Chadha" <angadsc@...>

[#31831] trunk で現状セルフビルドができません — "きむらこういち" <hogemuta@...>

[#31835] Kernel#` is blocked with Ruby/GLib2 on Intel Mac — Kouhei Sutou <kou@...>

[#31840] valgrind fiber — Tanaka Akira <akr@...>

[#31842] 拡張ライブラリ内での SIGVTALRM — とみたまさひろ <tommy@...>

[#31848] huge `if' dumps core — "Yusuke ENDOH" <mame@...>

[#31849] Exception `ArgumentError' at (null):0 - NULL pointer given — Tanaka Akira <akr@...>

[#31850] meta programming might dump core — "Yusuke ENDOH" <mame@...>

[#31852] Re: [ ruby-Bugs-14195 ] Array instance method include? speed can be increased — Urabe Shyouhei <shyouhei@...>

[#31853] optimize T_OBJECT space — Tanaka Akira <akr@...>

[#31854] Symbol.all_symbols — eklerni <eklerni@...>

[#31866] reading a pipe by multiple threads — Tanaka Akira <akr@...>

[#31870] marshal_dumpで不正なデータが書き出される — kumaryu <kumaryu@...>

[#31871] Process::WNOHANG — Tanaka Akira <akr@...>

[#31887] ruby 1.9 で ruby 1.9 はコンパイルできなかった — Martin Duerst <duerst@...>

[#31896] URI::LDAPS — Kouhei Sutou <kou@...>

[#31898] memory consumption on ext/dl build — Tanaka Akira <akr@...>

[#31900] platform-independent per-process initialization — Nobuyoshi Nakada <nobu@...>

[#31909] ipaddr — Kazuhiro NISHIYAMA <zn@...>

[#31911] eval("", TOPLEVEL_BINDING) and ObjectSpace._id2ref — Tanaka Akira <akr@...>

[#31912] exit status of ruby -v — Tanaka Akira <akr@...>

[#31913] SEGV: Fiber.new{ callcc{|c| @c = c } }.resume — Tanaka Akira <akr@...>

[#31914] m17nの全貌に関する何か — Masayoshi Takahashi <maki@...>

[ruby-dev:31894] Re: [m17n] String#encode

Thread

In This Thread

[#31759] SEGV by modifying members — Tanaka Akira <akr@...>