[#45609] ruby 1.8.6のNKFにおける漢字変換の不具合について — 京和 崇行 <kyowa_t@...>

初めましてこんにちは。カカクコムの京和と申します。

14 messages 2008/11/04

[ruby-list:45610] Re: ruby 1.8.6のNKFにおける漢字変換の不具合について

From: rubikitch@...
Date: 2008-11-04 09:36:03 UTC
List: ruby-list #45610
From: 京和 崇行 <kyowa_t@kakaku.com>
Subject: [ruby-list:45609] ruby 1.8.6のNKFにおける漢字変換の不具合について
Date: Tue, 4 Nov 2008 17:12:08 +0900

るびきちです。

> ruby 1.8.6のNKFモジュールではJIS第二水準(?)の
> 漢字変換に不具合があるようです。

nkfで入力文字コードを指定しないと、文字コードを推測します。
nkfのバージョンが2.0.8になって推測のアルゴリズムが変わったのでしょう。
入力が短いと誤認識があるのはある意味当然だと思います。
前のバージョンでも他の特定の入力では誤認識するでしょう。
入力文字コードがわかっている場合は明示するべきです。

NKF.nkf "-Ww", "餃子"            # => "餃子"

句読点があると誤認識しないようです。

NKF::VERSION # => "2.0.8 (2007-01-28)" 
NKF.nkf "-w", "餃子、"            # => "餃子、"
NKF.nkf "-w", "餃子。"            # => "餃子。"

--
rubikitch
Blog: http://d.hatena.ne.jp/rubikitch/
Site: http://www.rubyist.net/~rubikitch/

In This Thread