[#45609] ruby 1.8.6のNKFにおける漢字変換の不具合について — 京和 崇行 <kyowa_t@...>
初めましてこんにちは。カカクコムの京和と申します。
14 messages
2008/11/04
[#45610] Re: ruby 1.8.6のNKFにおける漢字変換の不具合について
— rubikitch@...
2008/11/04
From: 京和 崇行 <kyowa_t@kakaku.com>
[#45636] [ANN] nokogiri 1.0.5 リリース — Aaron Patterson <aaron@...>
こんにちは!アーロンです。
6 messages
2008/11/13
[#45651] require 'postgres' とするとエラーになる — "Nobuyuki Inaba" <nobuyuki.inaba@...>
稲葉と申します。
6 messages
2008/11/27
[ruby-list:45618] Re: ruby 1.8.6のNKFにおける漢字変換の不具合について
From:
"NARUSE, Yui" <naruse@...>
Date:
2008-11-06 13:46:50 UTC
List:
ruby-list #45618
成瀬です。 京和 崇行 wrote: > カカクコム 京和です。 > >> 「nkfだと確かEUCから判定する」ですが、この辺も 2.0.7 の前後でいじってます。 > おお、そうなのですか。 > 理解できるか分かりませんが、ソースもちょこっと読んでみようと思います。 難しいことはやってないんですが、歴史的経緯からスパゲッティなので、 その辺がむしろきついかもしれませぬ。。。 >> 不定だから〜というのはよくあるんですが、 >> 経験的に本当に不定なケースはあまりないように感じます。 >> HTML だとか HTTP の charset だとか。 >> 推測するにカカクコムさんだと Web 系でしょうから、 >> 送信元のフォームがある HTML の文字コード決めうちでいいんじゃないですかね。 > そうですね。出来るだけUTF-8で統一しているのですが、モバイル版だったり > APIサイトからリクエストが来る場合などもあるので、実際には > UTF-8以外でのリクエストもしばしば来るというのが実情だったりします。 > まぁこの辺りは設計次第なので、決めうちでもありと言えばありですね。 もちろん部分的に文字コードが違う分はあるでしょうし、 そのために NKF を呼んでいると思うのですが、 ドコモ向けのモバイルだったら Shift_JIS 決めうちだとか、 API だったらリクエストごとに文字コードを明示していたりと、 その部分ごとにおいては、入力の文字コードは特定可能じゃないですかね。 -- NARUSE, Yui <naruse@airemix.jp>