ruby-list

はじめまして。横塚と申します。
昨年の11月からRubyの勉強を始めた新参者です。
よろしく、お願い致します。

題名の通り、Ruby 1.9で、バイト長の部分文字列を作りたくて悩んでます。
どなたか、良い知恵が有りましたら、ご教示下さいませ。

もし、このMLはそのような場では無いということでしたら、申し訳ありません。
読み捨てて下さい。

さて、やりたいことは、SJIS漢字とASCIIの混在した文字列から、
先頭の72バイトを抜き出したいということです。

target = data[0,72] ; 

では、72バイトではなく、72文字が転送されてしまうので、もちろんダメでした。

最初に書いたコードは

target = "" ; 
for i in 0..71 do 
	target = target + data.getbyte(i).chr ; 
end

なのですが、一旦getbyteしてしまうと、それを連結したものもASCIIと強制的に看做され、
その後にtargetに対して、SJISコードの正規表現を使うと
incompatible encoding regexp match (Windows-31J regexp with ASCII-8BIT string)
というエラーになってしまいます。

次に

target = "" ; 
for i in 0..data.size-1 do 
	if target.bytesize >= 72 then 
		break ; 
	end 
	target = target + data[i,1] ; 
end 

というコードを書いてみたのですが、なにせ遅い。
このコードを10万回回したら、5秒以上も掛かってしまいました。

少しでも早くしようと、間違いなく72バイトに収まっている文字は先に一気に代入しようと

num_of_kanji = data.bytesize - data.size ; 
minmum_length = 72 - num_of_kanji ; 
target = data[0, minmum_length] ; 
for i in minmum_length..71 do
	if target.bytesize >= 72 then 
		break ; 
	end 
	target = target + data[i,1] 
end 

というコードを書いて、10万回のループが0.2秒くらいにはなったのですが、
いかんせん、コードが汚い。

どなたか、もっと綺麗なコードで出来るというお知恵をお貸し下さいませ。
よろしくお願い致します。

--
Daisuke Yokotsuka

--
Daisuke Yokotsuka

Thread

Prev Next

In This Thread

Prev Next

[#49105] [ANN]Ruby 1.9.3-p362 MSI — arton <artonx@...>

[#49110] 非公式Rubyマスコット「るびくる」による、Sequel解説記事パート1〜2公開 — info@...

[#49119] Ruby/Tk カーソル位置の移動方法について — masa masa <masamasa.ruby@...>

[#49121] Re: [ruby-dev:46847] [ANN] ruby 2.0.0-rc1 released — Yusuke Endoh <mame@...>

[#49122] [ANN] ruby 2.0.0-rc1 released — Yusuke Endoh <mame@...>

[#49126] pure ruby のコードで日本語の文字コードを推測したい。 — ytakagi <ytakagi@...5.dion.ne.jp>

[#49128] [ANN] gettext 2.3.7 — Haruka Yoshihara <yoshihara@...>

[#49129] Net::Protocol#each_crlf_lineの正規表現にある n option は必要でしょうか — dezawa <dezawa@...>

[#49131] [ANN] Ruby生誕20周年記念パーティのお知らせ — Kakutani Shintaro <shintaro@...>

[#49138] [ANN] Ruby 1.9.3 patchlevel 374 — "U.Nakamura" <usa@...>

[#49139] [ANN] ぐんまRuby会議01の参加申し込みを開始しました — Yuichi NANSAI <nansai@...>

[#49140] [ANN]Ruby-2.0.0-rc1, Ruby-1.9.3-p374 Windows用インストーラパッケージ — arton <artonx@...>

[#49143] [ANN] test-unit 2.5.4 — Kenji Okimoto <okimoto@...>

[#49144] [FYI] クックパッド株式会社エンジニア採用説明会@札幌のご案内 — Kenta Murata <muraken@...>

[#49145] [ANN] Ruby-GNOME2 1.2.0 — Kouhei Sutou <kou@...>

[#49146] [ANN] 東京Ruby会議10 3日目を2013/02/10(日)の晩に開催します — KOSHIBA Toshiaki <koshiba@...8.so-net.ne.jp>

[#49147] [ANN] rroonga 2.1.3 — Haruka Yoshihara <yoshihara@...>

[#49148] Ruby 1.9で、バイト長の部分文字列を作りたくて悩んでます — Daisuke Yokotsuka <yokots_d@...3-net.ne.jp>

[#49164] [ANN] Ruby-GNOME2 1.2.1 — Kouhei Sutou <kou@...>

[#49165] [ANN] Milkode 0.9.7 — ongaeshi <ongaeshi0621@...>

[#49166] Enumerator#+ — 小田 利通 <oda@...>

[ruby-list:49148] Ruby 1.9で、バイト長の部分文字列を作りたくて悩んでます

Thread

In This Thread

[#49119] Ruby/Tk　カーソル位置の移動方法について — masa masa <masamasa.ruby@...>

[#49166] Enumerator#+ — 小田利通 <oda@...>