[#44189] [ANN] Rails勉強会@東京 第24回のお知らせ — "MOROHASHI Kyosuke" <moronatural@...>
各位
1 message
2007/11/08
[#44190] Ruby/KAKASIのインストールに失敗する — <boku.charhan@...>
お忙しいところ失礼します、WINDOWS XPを使っているんですが
8 messages
2007/11/08
[#44197] Re: Ruby/KAKASIのインストールに失敗する
— Nobuyoshi Nakada <nobu@...>
2007/11/09
なかだです。
[#44192] [ANN]Ruby勉強会@新潟 第1回のお知らせ — "Masatoshi Itagaki" <masatoshi@...>
各地でRuby勉強会が開催されるようになっていますが、新潟でも開催しようと
6 messages
2007/11/08
[#44207] REXML で UTF16 のファイルが読み込めない — <rook401@...>
REXML で UTF16 のファイルを読み込もうとするとエラーになります。
5 messages
2007/11/12
[#44208] はじめまして — "Ohto, Yasunori" <Yasunori.Ohto@...>
はじめまして
8 messages
2007/11/12
[#44224] WinXPでのCursesプログラム — "Masao Ochi" <ochi@...>
初めて投稿させていただきます。越智と申します。
5 messages
2007/11/15
[#44237] Float を利用するRubyプログラム — SASADA Koichi <ko1@...>
ささだです.
16 messages
2007/11/17
[#44241] Re: Float を利用するRubyプログラム
— SASADA Koichi <ko1@...>
2007/11/19
ささだです.
[#44245] Re: Float を利用する Ruby プログラム
— NISHIMATSU Takeshi <t_nissie@...>
2007/11/19
西松と申します。
[#44246] 数学関数が足りない (Re: Re: Float を利用する Ruby プログラム)
— Nobuyoshi Nakada <nobu@...>
2007/11/19
なかだです。
[#44250] Re: 数学関数が足りない (Re: Re: Float を利用する Ruby プログラム)
— NISHIMATSU Takeshi <t_nissie@...>
2007/11/19
西松です。
[#44268] Complex#cproj patch for ruby-1.9/lib/complex.rb
— NISHIMATSU Takeshi <t_nissie@...>
2007/11/21
西松と申します。
[#44263] RUBY FORUM 2008のお知らせ — "TAISEI OKAZAKI" <okazaki@...>
度々のお知らせ失礼いたします。
4 messages
2007/11/21
[#44286] TmailをgemでWindowsにインストールしようとするとエラーになる — "garyo hosu" <garyohosu@...>
いつもお世話になっております。garyoです。
7 messages
2007/11/30
[#44287] Re: TmailをgemでWindowsにインストールしようとするとエラーになる
— rubikitch@...
2007/11/30
From: "garyo hosu" <garyohosu@gmail.com>
[ruby-list:44260] Re: Rubyにおける日本語の正規表現のマッチングにつきまして
From:
"Hiromitsu Matsuura" <urax@...6.so-net.ne.jp>
Date:
2007-11-21 01:25:51 UTC
List:
ruby-list #44260
おはようございます。
るびきちさん、hataniさん
サンプルもつけていただいてありがとうございました。
サンプルを実行させていただいたところ、正しく動作いたしました。
ほんとにありがとうございました。
1点後学の為に教えてください。
現在、Fedora 8で開発をしておりまして、デフォルトのファイル作成がUTF-8
のようなので、UTF-8でマッチングをしようとしておりました。
るびきちさんにご指摘いただいたNKFのオプションを-u => -wに変更してみたのですが、
こちらはまだ動作せずにいます。
重ね重ねで申し訳ありませんが、教えていただけたら助かります。
よろしくお願いします。
===============================================================
require 'net/http'
require "nkf"
host = 'yahoo.co.jp'
h = Net::HTTP.new(host, 80)
while htmlfile = DATA.gets
htmlfile = htmlfile.chomp
resp, data = h.get("/" + htmlfile, nil)
data.each do |i|
i=NKF.nkf("-w -xm0", i)
if /'買う'/u =~ i
puts i
end
end
end
__END__
index.html
===============================================================
Hiromitsu Matsuura
----- Original Message -----
From: "hantani" <hantani@miyoshi.elec.co.jp>
To: "ruby mailing list" <ruby-list@ruby-lang.org>
Sent: Wednesday, November 21, 2007 9:05 AM
Subject: [ruby-list:44258] Re: Rubyにおける日本語の正規表現のマッチングにつきまして
> uraxさん、おはようございます。
> hantaniです。
>
> yahoo.co.jpはEUCみたいなのでkconvでEUCに変換してみました。
> #出力はsjisにしています
> -----------------------------------------
> require 'net/http'
> require "nkf"
> require "kconv"
>
> host = 'yahoo.co.jp'
> h = Net::HTTP.new(host, 80)
>
> str="買う".toeuc
>
> while htmlfile = DATA.gets
> htmlfile = htmlfile.chomp
> resp, data = h.get("/" + htmlfile, nil)
> data.each do |i| #i=NKF.nkf("-u -xm0", i)
> if /#{str}/u =~ i
> puts i.tosjis
> end
> end
> end
> __END__
> index.html
> -----------------------------------------
>
> Hiromitsu Matsuura さんは書きました:
>> はじめて投稿させていただきます。
>> uraxと申します。
>>
>> Rubyで日本語の正規表現のマッチングを行おうと思っています。
>> やろうとしていることは、htmlファイルを取得して、その中に指定した日本語が
>> ある場合のみ特定の処理をしようというものです。
>>
>> 試しに、yahoo.co.jp/index.htmlのファイルを取得して、'買う'という言葉が出
>> た行だけ表示しようと
>> 以下のようなコードを書いてみたのですが、何も表示されずに思ったとおりに動
>> 作しませんでした。
>>
>> ただ、'買う'という部分を別のアルファベット等に変えた場合には、動作するので
>>
>> 日本語の処理が間違っているのかなと考えています。
>>
>> 初歩的な質問で申し訳ないのですが、何か情報がありましたら教えていただけな
>> いでしょうか。
>> お手数をおかけしますが、よろしくお願いします。
>>
>> ==================================================================
>> require 'net/http'
>> require "nkf"
>>
>> host = 'yahoo.co.jp'
>> h = Net::HTTP.new(host, 80)
>>
>> while htmlfile = DATA.gets
>> htmlfile = htmlfile.chomp
>> resp, data = h.get("/" + htmlfile, nil)
>> data.each do |i| i=NKF.nkf("-u -xm0", i)
>> if /買う/u =~ i
>> puts i
>> end
>> end
>> end
>> __END__
>> index.html
>>
>> ==================================================================
>>
>>
>>
>>
>>
>
>