[#36058] Windows で Thread — rio-t@...
こんにちは、高石です。
14 messages
2002/10/01
[#36059] Re: Windows で Thread
— "U.Nakamura" <usa@...>
2002/10/01
こんにちは、なかむら(う)です。
[#36060] Re: Windows で Thread
— rio-t@...
2002/10/01
こんにちは、高石です。
[#36061] Re: Windows で Thread
— Tietew <tietew-ml-ruby-list@...>
2002/10/01
[#36069] 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...>
松永です。
26 messages
2002/10/02
[#36072] Re: 日本語に混じった URL を抜き出したい
— keiichi matsunaga <ma2@...>
2002/10/02
松永です。
[#36073] Re: 日本語に混じった URL を抜き出したい
— SAITO Shukaku <shukaku@...>
2002/10/02
At Wed, 2 Oct 2002 13:51:42 +0900,
[#36074] Re: 日本語に混じった URL を抜き出したい
— Tatsuhiko Miyagawa <miyagawa@...>
2002/10/02
宮川です。
[#36106] Ruby Weekly News mail archive on blade? — Tanaka Akira <akr@...17n.org>
ふと気がついたんですが、Ruby Weekly News は blade には archive されな
7 messages
2002/10/05
[#36114] RubyのXML対応に関する質問 — Shibukawa Yoshiki <yoshiki@...>
渋川です。
5 messages
2002/10/06
[#36117] 閉じたbinding — Takashi Tsugoh <tks@...>
こんばんは、Tsugohです。
7 messages
2002/10/06
[#36140] rindaで例外を通知する方法? — SAITO Shukaku <shukaku@...>
rindaとwebrickを使ってweb用アプリケーション(と言うのかな?)を作っていま
8 messages
2002/10/11
[#36161] gc_sweepでアボート — 原田 潤 <j-harada@...4u.or.jp>
原田と申します。
10 messages
2002/10/17
[#36178] utf-8 対応 nkf 拡張モジュールについて — たむらけんいち <sgs02516@...>
たむらです。御相談。
9 messages
2002/10/20
[#36186] csvweb.cgi error — TAKAHASHI Masayoshi <maki@...>
高橋征義です。
5 messages
2002/10/21
[#36188] Re: 日本語の字を書くGUIプログラム — Philip Mak <pmak0@...>
--- Philip Mak <pmak0@yahoo.com> wrote:
4 messages
2002/10/21
[#36192] RUBY_PLATFORM にはどんなものがある? — Take_tk <ggb03124@...>
たけ(tk)です
5 messages
2002/10/23
[#36205] [ANN] Ruby/Qte 0.2 — HIDAKA Takahiro <cv8t-hdk@...>
ひだかです。
10 messages
2002/10/27
[#36217] Re: Ruby/Qte 0.2
— SAITO Shukaku <shukaku@...>
2002/10/28
At Sun, 27 Oct 2002 14:03:33 +0900,
[#36226] Re: Ruby/Qte 0.2
— HIDAKA Takahiro <cv8t-hdk@...>
2002/10/29
ひだかです。
[ruby-list:36178] utf-8 対応 nkf 拡張モジュールについて
From:
たむらけんいち <sgs02516@...>
Date:
2002-10-20 16:03:47 UTC
List:
ruby-list #36178
たむらです。御相談。
えっと、rubyの標準拡張モジュールである nkf ですが、
1.7の nkf.c を includeして利用してます。
nkf自体は、Versrion1.9だったのですが、最近動きがあります。
http://www01.tcp-ip.or.jp/~furukawa/nkf_utf8/ にて、utf-8対応が発表され
もともとの nkf開発者である kono さんが、betaとして取り込み、現在、
http://sourceforge.jp/projects/nkf/ が開発の場になってるようです。
たむらの取組みはこちら。
http://tamura.tdiary.net/namazu.rb?query=nkf+utf-8&submit=Search%21&whence=0&max=20&result=normal&sort=field%3Auri%3Aascending
最新のソースコードは
http://www.ruby-lang.org/~tamura/ruby/unkf-20020919.tar.bz2
で、ruby-1.7対応や、標準nkfとの同居を考慮して、unkfという名前にしてます。
出来れば、ruby本体に入れてもらえばと思うのですが。
ただし、問題点として、
* そもそも nkfが UTFに対応して、うれしいのか。
uconv/iconvもあるし。まぁサイズ的なメリットはあるかも。
* 現在の文字コード判定 NKF::guess に UTFを追加するのか。
nkfの作り的な問題ですが、判定ルーチンだけを関数で持ってません。
現在の rb_nkf_guess()は
/*
* Character code detection - Algorithm described in:
* Ken Lunde. `Understanding Japanese Information Processing'
* Sebastopol, CA: O'Reilly & Associates.
*/
と自前でコードを持ってます。JVim〜RubyWinからUTF-8も含む判定ルーチンを
組み込んだりしましたが、認識率に問題あります。(ある程度は仕方ないですが)
rubyから利用できるものたちのテストを MoonWolf氏がやってくれました。
http://rwiki.jin.gr.jp/cgi-bin/rw-cgi.rb?cmd=view;name=MoonWolf
* nkf-2xが、beta扱い
最近は落ち着いてますが。
ご意見よろしく。
--
たむら (http://tamura.tdiary.net)