ruby-list

成瀬です。

Kouya wrote:
> strscanのリファレンスマニュアルを書いています。
> 
> 添付したサンプルがruby 1.9 では動かないのですが、
> 1.9では何か変更する必要があるのでしょうか。
> よろしくお願いします。
> 
> 
> サンプル
> 
> require 'strscan'
> 
>       $KCODE = "e"
>       s = StringScanner.new("るびい") # 文字コードはEUC-JPとします
>       $KCODE = 'n'                    # 単なるバイト列として認識されます
> p      s.getch                         # => "\244"
> p      s.getch                         # => "\353"
>       $KCODE = "e"                    # EUC-JPの文字列として認識されます
> p      s.getch                         # => "び"
> p      s.getch                         # => "い"
> p      s.getch                         # => nil
> 
> 以下出力
> 
> ruby 1.8.6 (2007-09-24 patchlevel 111) [i686-darwin9.2.0]
> "\244"
> "\353"
> "び"
> "い"
> nil
> 
> ruby 1.9.0 (2008-10-05 revision 18293) [i386-darwin9.5.0]
> s1_euc.rb:5: invalid multibyte char (US-ASCII)
> s1_euc.rb:5: invalid multibyte char (US-ASCII)
> s1_euc.rb:5: syntax error, unexpected $end, expecting ')'
>       s = StringScanner.new("るびい") # 文字コードはEUC-JPとします

1.9 のテストありがとうございます。

まず、1.9 では $KCODE は廃止になっています。
なので、$KCODE は効果を持ちません。

次に、英数記号以外、ひらがなや漢字などをスクリプト内に書く場合は、
$KCODE でなく、magic comment を用います。
今回の invalid multibyte char というエラーは、
magic comment による指定がないため、スクリプトが、
US-ASCII で書かれているとみなされたために出ています。

この辺はるりまの多言語の所にあるのでご参照＆わかりづらい部分を見つけたら
教えてください。
http://doc.loveruby.net/refm/api/view/spec/m17n

さて、encoding は $KCODE でなく、それぞれの String が持っています。
ある encoding の文字列を得る方法はいくつかあるのですが、
リテラルは "\u{308B 3073 304}" というように Unicode エスケープを用いて書き、
これを String#encode を用いて変換するのが楽かと思います。
utf8 = "\u{308B 3073 3044}"
eucjp = utf8.encode("EUC-JP")
sjis = utf8.encode("Shift_JIS")
という感じですね。

-- 
NARUSE, Yui  <naruse@airemix.jp>

Thread

Prev Next

In This Thread

Prev Next

[#45523] vrubyのtabPanelについて質問です。 — "Miyamoto Hiroaki" <miyamoto.hiroak@...>

[#45524] [ANN] Rubyist Magazine 0024 — "Tadasuke Kuge" <kuge.tadasuke@...>

[#45527] Windows版のrubyで行末に \d をつけない方法もしくはbynary出力 — しん <dezawa@...>

[#45531] [ANN] Ruby 1.9.0-5リリース — "Yugui (Yuki Sonoda)" <yugui@...>

[#45532] [ANN] Ruby-1.9.0-5 Win32用パッケージ — arton <artonx@...>

[#45533] strscanのgetchのサンプルスクリプトでエラーがでる。 — Kouya <kouyataifu4@...>

[#45537] 正規表現：２進数の認識 — 上間 健 <tntn@...>

[#45542] Rumix 0.1 リリース — rubyist@...

[#45543] 社内公募：ソフトウェア・エンジニア — Gary Smith <gsmith@...>

[#45544] 今週号の「アエラ」で — Shin-ichiro HARA <sinara@...>

[#45545] 自作のプログラムにrubyをstaticに組み込みたい — "takeru sasaki" <sasaki.takeru@...>

[#45546] [ANN] Ruby-LAPACK-0.1 new release — "Seiya Nishizawa" <seiya@...>

[#45547] openssl がインストールされない — "Hideo Konami" <konami@...>

[#45551] オブジェクト指向スクリプト言語 Ruby( アスキー出版）内容と今の Ruby では、かなり違いますか？ — tanaka hideo <tanaka_hideo@...>

[#45557] Ruby Lightning Talk再募集(関西Ruby会議 01) — tagahiro@...4u.or.jp

[#45558] Ruby Lightning Talk再募集(関西Ruby会議 01) — tagahiro@...4u.or.jp

[#45559] [ANN] LL温泉2008 大分(湯布院) 開催のお知らせ — "masayoshi takahashi" <maki@...>

[#45564] Re: Welcome to our (ruby mailing list) You are added automatically — 桐明 孝司 <kiriake@...>

[#45565] [ANN] オープンセミナー2008＠岡山 開催のお知らせ — Kazuhiro Yoshida <moriq@...>

[#45566] SNMP Libraryのerror_status=1(tooBig)について — "徳島学" <manabu.tokushima@...>

[#45569] 九州 Ruby 会議 01 〜 プレゼンテーション募集 — Hidetoshi NAGAI <nagai@...>

[#45572] 簡潔なHASH値のインクリメント — IIDAYUICHI <y_iida@...>

[#45579] Re: 簡潔なHASH値のインクリメント — "sato.naoyuki" <sato.naoyuki@...>

[#45586] 「Ruby Lightning Talk 」の講演者再々募集のお知らせ(関西Ruby会議 01) — tagahiro@...4u.or.jp

[#45587] ActiveScriptRubyのヘッダファイル — "AOKI Shigeru" <saoki@...>

[#45591] Ruby国際標準の草案作成 — Shugo Maeda <shugo@...>

[#45593] Mac OS X でコンパイルした Ruby は遅い? — HIGAKI Masaru (ひがき まさる) <mash@...>

[#45595] Ruby Lighitning Talk 応募締め切りのお知らせ — tagahiro@...4u.or.jp

[#45596] [ANN] Ruby 1.9.1 preview 1リリース — "Yugui (Yuki Sonoda)" <yugui@...>

[#45597] 関西Ruby会議０１レポーター再募集 — tagahiro@...4u.or.jp

[#45599] 「Rubyリファレンスマニュアル刷新計画」2008-10分のスナップショットリリース — okkez <okkez000@...>

[#45600] Railsのヨドバシカメラのサイトが「動かないコンピューター」状態？ — yodobashitimeout@...

[#45601] ANN: Ruby-1.9.1-preview1 Win32インストールパッケージ — arton <artonx@...>

[#45604] Fwd: [rails-tokyo:465] Re: 11月度のRails勉強会について — "榊祐介" <sakaki@...>

[#45606] [ANN] nokogiri 1.0.0 リリース — Aaron Patterson <aaron@...>

[ruby-list:45534] Re: strscanのgetchのサンプルスクリプトでエラーがでる。

Thread

In This Thread

[#45537] 正規表現：２進数の認識 — 上間健 <tntn@...>

[#45551] オブジェクト指向スクリプト言語 Ruby( アスキー出版）内容と今の Ruby では、かなり違いますか？　 — tanaka hideo <tanaka_hideo@...>

[#45564] Re: Welcome to our (ruby mailing list) You are added automatically — 桐明　孝司 <kiriake@...>

[#45565] [ANN] オープンセミナー2008＠岡山開催のお知らせ — Kazuhiro Yoshida <moriq@...>

[#45569] 九州 Ruby 会議 01 〜プレゼンテーション募集 — Hidetoshi NAGAI <nagai@...>

[#45593] Mac OS X でコンパイルした Ruby は遅い? — HIGAKI Masaru (ひがきまさる) <mash@...>