[#36069] 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...>

 松永です。

26 messages 2002/10/02
[#36072] Re: 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...> 2002/10/02

 松永です。

[#36073] Re: 日本語に混じった URL を抜き出したい — SAITO Shukaku <shukaku@...> 2002/10/02

At Wed, 2 Oct 2002 13:51:42 +0900,

[ruby-list:36089] Re: 日本語に混じった URL を抜き出したい

From: Tatsuhiko Miyagawa <miyagawa@...>
Date: 2002-10-02 08:52:41 UTC
List: ruby-list #36089
At Wed, 2 Oct 2002 16:16:35 +0900,
keiichi matsunaga wrote:
> 
> |Perl の話で恐縮ですが URI::Find というモジュールがあります。
> |http://search.cpan.org/author/ROSCH/URI-Find-0.13/
> |
> |URI::Find::Schemeless っていうので、scheme がないURIも推測しようと苦心
> |してるみたいです。
> 
>   なるほど。これは面白そうですが,ここだけ perl で書くわけにはいかない
> し.. 情報ありがとうございました。

Ruby に直すのもそんなに難しくないのではないでしょうか。
callback 呼び出すインタフェースなので、iterator 使うとRuby的ですね。

ちなみにこれ、com|net|org みたいな TLD の正規表現にもマッチさせてるみたいです。
ってことは command.com とかにマッチしちゃいますね ;)

-- 
Tatsuhiko Miyagawa <miyagawa@edge.co.jp>

In This Thread