[#42454] 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...>

出沢です

22 messages 2006/06/22
[#42455] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — rubikitch <rubikitch@...> 2006/06/22

From: しん <dezawa@aliadne.net>

[#42456] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...> 2006/06/23

出沢です

[#42458] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — rubikitch <rubikitch@...> 2006/06/23

From: しん <dezawa@aliadne.net>

[#42459] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...> 2006/06/23

出沢です

[#42460] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — rubikitch <rubikitch@...> 2006/06/23

From: しん <dezawa@aliadne.net>

[#42461] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...> 2006/06/23

出沢です。

[ruby-list:42464] Re: 多量の正規表現との効率的なマッチのアイデアを、、

From: しん <dezawa@...>
Date: 2006-06-23 06:40:30 UTC
List: ruby-list #42464
出沢@金太郎の古里に住んでいます です

From: Momotaro Nishiumi <info@momo-lab.net>
Subject: [ruby-list:42463] Re: 多量の正規表現との効率的なマッチのアイデアを、、
Date: Fri, 23 Jun 2006 15:23:50 +0900

> ももたろです。
> >   while input.gets
> >     cat,url=$_.chop.split
> >     myreg.each{|catreg|         # このあたりが
> >       url =~ catreg[1] || next  # もっと美しくならんか
> >       cat = catreg[0]           # 馬鹿サーチではなく
> >       break                     # もっと効率良くならないか
> >     }                           # というのが、今回の「思い」です。
> >   
> >     count[cat] = (count[cat]||=0)+1
> >   end
> Regexp.unionを使うとか。

unionはしらなかったのですが、こつこつつないでマッチをとる ということも
考えました。
諦めたのは、二つありまして
 1。何番目の正規表現にマッチしたのか、がわからないと
    その正規表現に対応する、分類番号を手にするのが困難。
 2。m1 w3b.mydomain と m2 mydomain の区別、優先づけやっかいそう、、、

という点です。

In This Thread