[#36058] Windows で Thread — rio-t@...
こんにちは、高石です。
14 messages
2002/10/01
[#36059] Re: Windows で Thread
— "U.Nakamura" <usa@...>
2002/10/01
こんにちは、なかむら(う)です。
[#36060] Re: Windows で Thread
— rio-t@...
2002/10/01
こんにちは、高石です。
[#36061] Re: Windows で Thread
— Tietew <tietew-ml-ruby-list@...>
2002/10/01
[#36069] 日本語に混じった URL を抜き出したい — keiichi matsunaga <ma2@...>
松永です。
26 messages
2002/10/02
[#36072] Re: 日本語に混じった URL を抜き出したい
— keiichi matsunaga <ma2@...>
2002/10/02
松永です。
[#36073] Re: 日本語に混じった URL を抜き出したい
— SAITO Shukaku <shukaku@...>
2002/10/02
At Wed, 2 Oct 2002 13:51:42 +0900,
[#36074] Re: 日本語に混じった URL を抜き出したい
— Tatsuhiko Miyagawa <miyagawa@...>
2002/10/02
宮川です。
[#36106] Ruby Weekly News mail archive on blade? — Tanaka Akira <akr@...17n.org>
ふと気がついたんですが、Ruby Weekly News は blade には archive されな
7 messages
2002/10/05
[#36114] RubyのXML対応に関する質問 — Shibukawa Yoshiki <yoshiki@...>
渋川です。
5 messages
2002/10/06
[#36117] 閉じたbinding — Takashi Tsugoh <tks@...>
こんばんは、Tsugohです。
7 messages
2002/10/06
[#36140] rindaで例外を通知する方法? — SAITO Shukaku <shukaku@...>
rindaとwebrickを使ってweb用アプリケーション(と言うのかな?)を作っていま
8 messages
2002/10/11
[#36161] gc_sweepでアボート — 原田 潤 <j-harada@...4u.or.jp>
原田と申します。
10 messages
2002/10/17
[#36178] utf-8 対応 nkf 拡張モジュールについて — たむらけんいち <sgs02516@...>
たむらです。御相談。
9 messages
2002/10/20
[#36186] csvweb.cgi error — TAKAHASHI Masayoshi <maki@...>
高橋征義です。
5 messages
2002/10/21
[#36188] Re: 日本語の字を書くGUIプログラム — Philip Mak <pmak0@...>
--- Philip Mak <pmak0@yahoo.com> wrote:
4 messages
2002/10/21
[#36192] RUBY_PLATFORM にはどんなものがある? — Take_tk <ggb03124@...>
たけ(tk)です
5 messages
2002/10/23
[#36205] [ANN] Ruby/Qte 0.2 — HIDAKA Takahiro <cv8t-hdk@...>
ひだかです。
10 messages
2002/10/27
[#36217] Re: Ruby/Qte 0.2
— SAITO Shukaku <shukaku@...>
2002/10/28
At Sun, 27 Oct 2002 14:03:33 +0900,
[#36226] Re: Ruby/Qte 0.2
— HIDAKA Takahiro <cv8t-hdk@...>
2002/10/29
ひだかです。
[ruby-list:36079] Re: 日本語に混じった URLを抜き出したい
From:
WATANABE Hirofumi <eban@...>
Date:
2002-10-02 07:35:54 UTC
List:
ruby-list #36079
わたなべです。 keiichi matsunaga <ma2@lifemedia.co.jp> writes: > |日本語に特化してるわけではありませんが、URI.extractとか。 特化というより、Regexp.newで'N'を指定してるので対応してない と言ったほうがいいかもしれません。 > ちょっと妙なことが1つ。 > > str = "スhttp://hoge.jp" > URI.extract(str) > > とすると,"Xhttp://hoge.jp"と抽出してしまいますね。 > > WindowsXP + ruby 1.6.7 で試しました。 > 元の文字列はシフトJISです。 というわけでこういう結果になるわけですが、解決法としては 1. EUCに変換してからURI::extractに渡す 2. 日本語を削除してからURI::extractに渡す。 str.gsub(/[^a-zA-Z0-9_\W]+/, '')とか。 3. URI.extractの結果から日本語を削除する。 などが考えられます(日本語を単純に消していい場合)。 uri/common.rbのRegexp.newの'N'をなんとかするという手もあるか もしれない。 -- わたなべひろふみ