[#42454] 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...>

出沢です

22 messages 2006/06/22
[#42455] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — rubikitch <rubikitch@...> 2006/06/22

From: しん <dezawa@aliadne.net>

[#42456] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...> 2006/06/23

出沢です

[#42458] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — rubikitch <rubikitch@...> 2006/06/23

From: しん <dezawa@aliadne.net>

[#42459] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...> 2006/06/23

出沢です

[#42460] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — rubikitch <rubikitch@...> 2006/06/23

From: しん <dezawa@aliadne.net>

[#42461] Re: 多量の正規表現との効率的なマッチのアイデアを、、 — しん <dezawa@...> 2006/06/23

出沢です。

[ruby-list:42498] Re: 多量の正規表現との効率的なマッチのアイデアを、、

From: Itou-T15@...
Date: 2006-06-28 05:23:17 UTC
List: ruby-list #42498
伊藤T15です
データ量が1GBに近づいたら、また考えればと 思います

入力行のグループ項とURL項の関係がわかると、高効率な方法もあるかも。

1. グループ項 <= f(URL) ならば
URLごとにカウントして 、カウント後、
URLによってグループ項を書き換えして、
同一グループのカウントを合計する。

2.URLとグループの関連が無いなら
二段HASH [URL][(仮)グループ] でカウントし、その後
URLによってグループを書き換え
最後に同一グループでカウントを合計する。

どちらでも、正規表現との比較は、全レコードではなく
異なりURL の数に減少します?。


In This Thread

Prev Next