[#36069] 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...>

 松永です。

26 messages 2002/10/02
[#36072] Re: 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...> 2002/10/02

 松永です。

[#36073] Re: 日本語に混じった URL を抜き出したい — SAITO Shukaku <shukaku@...> 2002/10/02

At Wed, 2 Oct 2002 13:51:42 +0900,

[ruby-list:36073] Re: 日本語に混じった URL を抜き出したい

From: SAITO Shukaku <shukaku@...>
Date: 2002-10-02 05:08:34 UTC
List: ruby-list #36073
At Wed, 2 Oct 2002 13:51:42 +0900,
keiichi matsunaga wrote:
>  ちょっと本筋とははずれますが,自由入力されたメッセージ中から URL を
> 抜き出そうとすると「http://」が無いケースが往々にして存在します。その
> 場合のうまい抽出方法となると,何かあるんでしょうかね? 単なる英単語と
> 誤認しないように「www」とかを調べて確度をあげるのかなあ。 

どうやるんでしょうね?自分でもしばしば"www.google.com"だけを書いたりしま
すし、"auction.yahoo.co.jp"のように"www"を伴わない場合もありますし。うー
む、抜き出したURLの候補にnslookupとかpingでも実行しますかね?^^;

///// ------------------------------------------------------------------
-O-O-    斉藤 秀格 (SAITO Shukaku) @ PUGH (Palm Users Group in Hokkaido)
  _      mailto:shukaku@sai10.nu    (ぱふ)   http://www.pugh.palm-j.com/

In This Thread