[#36069] 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...>

 松永です。

26 messages 2002/10/02
[#36072] Re: 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...> 2002/10/02

 松永です。

[#36073] Re: 日本語に混じった URL を抜き出したい — SAITO Shukaku <shukaku@...> 2002/10/02

At Wed, 2 Oct 2002 13:51:42 +0900,

[ruby-list:36081] Re: 日本語に混じった URL を抜き出したい

From: WATANABE Hirofumi <eban@...>
Date: 2002-10-02 07:40:51 UTC
List: ruby-list #36081
わたなべです。

keiichi matsunaga <ma2@lifemedia.co.jp> writes:

>   抜き出しに失敗したあとどうするかって話もありますよね。
>  "(http://hoge.jp)" みたいなカッコ入りURLなどという例もあり,これはUR
> I.extractすると "http://hoge.jp)"と後ろのカッコまで抽出されてしまいま
> す。これはまずいと分かったところで,リカバリはムズカシイです。そういう
> 場合は文字列で示して,人間の認識能力に頼るのでしょうか。

% ruby -v -ruri -e 'p URI.extract("(http://hoge.jp)")'
ruby 1.6.7 (2002-03-01) [i686-linux]
["http://hoge.jp"]

問題ないようです。Windowsで実行できるrubyもいろいろあります
が、具体的にはどれでしょう?

-- 
わたなべひろふみ

In This Thread