ruby-list

ここは jruby の話題も ok なんでしょうか？

jruby 1.7.2 (ruby 1.9.3p327) を使用しています。

jruby の nkf ライブラリは不完全とされていますので、
日本語の文字コードの推測を、ぜひ pure ruby のコードで
行いたいのです。

いまのところ、
http://0xcc.net/blog/archives/000005.html
のページなどを参考にして、
下記のようなコードを試しにこのあいだ書いてみました。

手元ではまあまあいいようにも感じていますが、
こんな感じでいいのかどうかも、いまいち確信がもてません。

pure ruby のコードでの、日本語の文字コード推測
の決定版を確定していただけませんか？

メーリングリストの趣旨に外れていないようでしたら、
どうかよろしくお願いします。


require 'iconv'

class Iconv
Preference = ["iso-2022-jp", 'euc-jp', 'utf-8', 'shift_jis', 'windows-31j']
def self.encname_guess(str)

return "us-ascii" if /\A[\r\n\t\x20-\x7e]*\Z/n.match(str) rescue{}

Preference.each {|name|
begin
return name if Iconv.conv("UTF-8", name, str)
rescue Iconv::IllegalSequence
end
}

return 'unable to convert to UTF-8'
#raise 'unable to convert to UTF-8'
end
end

=begin
# example
# encname_guess.rb より上記スクリプトを読み込み。

require 'encname_guess'

result_encname = Iconv.encname_guess(target_str)

# result_encnameは、
# "us-ascii", "iso-2022-jp", 'euc-jp', 'utf-8', 'shift_jis', 'windows-31j'
# のいずれか。
=end

Thread

Prev Next

In This Thread

Prev Next

[#49105] [ANN]Ruby 1.9.3-p362 MSI — arton <artonx@...>

[#49110] 非公式Rubyマスコット「るびくる」による、Sequel解説記事パート1〜2公開 — info@...

[#49119] Ruby/Tk カーソル位置の移動方法について — masa masa <masamasa.ruby@...>

[#49121] Re: [ruby-dev:46847] [ANN] ruby 2.0.0-rc1 released — Yusuke Endoh <mame@...>

[#49122] [ANN] ruby 2.0.0-rc1 released — Yusuke Endoh <mame@...>

[#49126] pure ruby のコードで日本語の文字コードを推測したい。 — ytakagi <ytakagi@...5.dion.ne.jp>

[#49128] [ANN] gettext 2.3.7 — Haruka Yoshihara <yoshihara@...>

[#49129] Net::Protocol#each_crlf_lineの正規表現にある n option は必要でしょうか — dezawa <dezawa@...>

[#49131] [ANN] Ruby生誕20周年記念パーティのお知らせ — Kakutani Shintaro <shintaro@...>

[#49138] [ANN] Ruby 1.9.3 patchlevel 374 — "U.Nakamura" <usa@...>

[#49139] [ANN] ぐんまRuby会議01の参加申し込みを開始しました — Yuichi NANSAI <nansai@...>

[#49140] [ANN]Ruby-2.0.0-rc1, Ruby-1.9.3-p374 Windows用インストーラパッケージ — arton <artonx@...>

[#49143] [ANN] test-unit 2.5.4 — Kenji Okimoto <okimoto@...>

[#49144] [FYI] クックパッド株式会社エンジニア採用説明会@札幌のご案内 — Kenta Murata <muraken@...>

[#49145] [ANN] Ruby-GNOME2 1.2.0 — Kouhei Sutou <kou@...>

[#49146] [ANN] 東京Ruby会議10 3日目を2013/02/10(日)の晩に開催します — KOSHIBA Toshiaki <koshiba@...8.so-net.ne.jp>

[#49147] [ANN] rroonga 2.1.3 — Haruka Yoshihara <yoshihara@...>

[#49148] Ruby 1.9で、バイト長の部分文字列を作りたくて悩んでます — Daisuke Yokotsuka <yokots_d@...3-net.ne.jp>

[#49164] [ANN] Ruby-GNOME2 1.2.1 — Kouhei Sutou <kou@...>

[#49165] [ANN] Milkode 0.9.7 — ongaeshi <ongaeshi0621@...>

[#49166] Enumerator#+ — 小田 利通 <oda@...>

[ruby-list:49126] pure ruby のコードで日本語の文字コードを推測したい。

Thread

In This Thread

[#49119] Ruby/Tk　カーソル位置の移動方法について — masa masa <masamasa.ruby@...>

[#49166] Enumerator#+ — 小田利通 <oda@...>