[#21736] OBJECTDAY 2000 — 助田 雅紀 <masaki.suketa@...>

助田です.

29 messages 2000/04/03
[#21748] Re: OBJECTDAY 2000 — keiju@... (石塚圭樹) 2000/04/04

けいじゅ@日本ラショナルソフトウェアです.

[#21753] Re: OBJECTDAY 2000 — Hideto ISHIBASHI <hideto-i@...4u.or.jp> 2000/04/05

石橋秀仁です。

[#21755] Re: OBJECTDAY 2000 — keiju@... (石塚圭樹) 2000/04/05

けいじゅ@日本ラショナルソフトウェアです.

[#21837] site_ruby & Linux distribution — OZAWA Sakuro <crouton@...>

小澤さくです。

14 messages 2000/04/10

[#21922] ruby-1.4.4 binary for BeOS 5 (Intel) — tenmei@... (Noriaki Harada)

はらだです。

23 messages 2000/04/15
[#21923] Re: ruby-1.4.4 binary for BeOS 5 (Intel) — NAITOH Jun <naitoh@...> 2000/04/15

はじめまして、内藤と申します。

[#21926] Re: ruby-1.4.4 binary for BeOS 5 (Intel) — tenmei@... (Noriaki Harada) 2000/04/16

>はじめまして、内藤と申します。

[#21930] Re: ruby-1.4.4 binary for BeOS 5 (Intel) — NAITOH Jun <naitoh@...> 2000/04/16

内藤です。

[#21968] Re: ruby-1.4.4 binary for BeOS 5 (Intel) — Katsuyuki Komatsu <komatsu@...> 2000/04/17

小松です。

[#21969] Re: ruby-1.4.4 binary for BeOS 5 (Intel) — NAITOH Jun <naitoh@...> 2000/04/17

再び内藤です。

[#21956] Thread & STDIN — Masato Toyoshima <mt@...>

はじめまして、豊島といいます。

16 messages 2000/04/17

[#21981] rd2man — WATANABE Hirofumi <eban@...>

わたなべです.

29 messages 2000/04/18
[#21982] Re: rd2man — Toshiro Kuwabara <toshirok@...3.so-net.ne.jp> 2000/04/18

Toshです。

[#21985] Re: rd2man — WATANABE Hirofumi <Hirofumi.Watanabe@...> 2000/04/19

わたなべです.

[#22036] Re: rd2man — Wakou Aoyama <wakou@...> 2000/04/20

青山です。

[#22040] Re: rd2man — Toshiro Kuwabara <toshirok@...3.so-net.ne.jp> 2000/04/21

Toshです。

[#22014] shell interactive — WATANABE Daisaku <dwata@...3.rim.or.jp>

31 messages 2000/04/20
[#22016] Re: shell interactive — 時田幸粋 <ktokita@...> 2000/04/20

こんにちは、時田です。

[#22017] Re: shell interactive — nobu.nakada@... 2000/04/20

なかだです。

[#22018] Re: shell interactive — WATANABE Hirofumi <Hirofumi.Watanabe@...> 2000/04/20

わたなべです.

[#22027] Re: shell interactive — 時田幸粋 <ktokita@...> 2000/04/20

こんにちは、時田です。

[#22103] Please put ruby-1.4.4.tar.gz in pub/lang/ruby/1.4/ — "Akinori -Aki- MUSHA" <knu@...>

 お願いがあるのですが、 ruby-1.4.4.tar.gz を FTP ツリーの 1.4/

16 messages 2000/04/25
[#22199] Where to put ruby-i.j.k.tar.gz on? (Re: ) — SUGIHARA Hiroshi <maili31s@...> 2000/04/28

[ruby-list:22103]におきまして、2000/04/25 12:38ほどに、

[#22117] StateGraph: state machine interpreter — Hideto ISHIBASHI <hideto-i@...4u.or.jp>

石橋 "rubyholic" 秀仁です。

16 messages 2000/04/25

[#22159] $LOAD_PATH への追加について — "Sugawara Hajime" <sugawara@...>

 はじめまして、菅原@ホビー・データです。

13 messages 2000/04/27

[#22181] Can't Use optparse — Yamada Kenji <kyamada@...>

28 messages 2000/04/28
[#22186] Re: Can't Use optparse — akira yamada / やまだあきら <akira@...> 2000/04/28

[#22195] Re: Can't Use optparse — Toshiro Kuwabara <toshirok@...3.so-net.ne.jp> 2000/04/28

Toshです。

[#22261] Re: Can't Use optparse — nobu.nakada@... 2000/05/04

なかだです。

[#22264] Re: Can't Use optparse — Toshiro Kuwabara <toshirok@...3.so-net.ne.jp> 2000/05/04

Toshです。

[#22270] Re: Can't Use optparse — nobu.nakada@... 2000/05/04

なかだです。

[#22272] Re: Can't Use optparse — Toshiro Kuwabara <toshirok@...3.so-net.ne.jp> 2000/05/04

Toshです。

[#22300] Re: Can't Use optparse — Koji Arai <JCA02266@...> 2000/05/05

新井です。

[ruby-list:22188] Web Robot of Ruby

From: Ryunosuke Ohshima <ryu@...>
Date: 2000-04-28 08:06:06 UTC
List: ruby-list #22188
大島@北陸先端科学技術大学院大学です。

現在、Web用のrobotをrubyで書いています。以前一度書こうとして挫折した
ことがあるのですが、Ruby Application Archiveのnet、uriなどのライブラ
リの充実のおかげで、今回は何とか作り上げられそうです。

そのなかで、いくつかの不具合が出てきたので、報告・質問いたします。


1. rubyの正規表現について

robots.txtのコメントを取り除く処理で
line.sub!(/\s*\#.*/, "")
としている部分でSegmentation faultが起きたので気づいたのですが、
以下のように非常に長い行で、正規表現がらみの処理をしようとすると、
Segmentation faultが起きてしまいます。

% ruby -ve '("#" * 245760).sub(/.*/, "")'
ruby 1.4.3 (1999-12-08) [sparc-solaris2.7]
Segmentation fault

ruby自身のソースは読めていないので、とりあえず報告のみです。


2. Ruby Application ArchiveのLibraryであるuri(version 3.41)について

a. 以下のようにカレント・ディレクトリ(".")が連続したURLでは、カレン
ト・ディレクトリが残ってしまいます。

% ruby -ruri -e 'puts URIModule::URI.create("http://a/b/././c")'
http://a/b/./c
% ruby -ruri -e 'puts URIModule::URI.create("http://a/b/././../c")'
http://a/b/c

b. 以下のようにサイトのルートディレクトリ(?)で、カレント・ディレクト
リを明示的に指定した相対パスがあると、スラッシュ("/")が挿入されてし
まいます。(実害はあまりなさそうですが。)

% ruby -ruri -e 'puts URIModule::URI.create("http://a/", "./g")'
http://a/.//g

bの問題は、RFC2396に出てくる例に対応して、「URI.create("http://a/",
"/./g") => "http://a/./g"」とする処理のせいです。ところがRFC2396の意
図は、そもそもスラッシュで始まる相対パス(および絶対パス)の場合は、パ
スの解釈はしない(パスを一意に解決しない)ことだと思われます。したがっ
て、現在の対応方法は誤っていると思われるので、この部分は削除した方が
良いと思われます。(スラッシュで始まる相対パスおよび絶対パスを一意に
解決するかどうかは、また別問題ですが。)

以上、a、bの2点を修正したパッチが、以下のものです。

__patch for uri.rb__
diff -u1 uri_old.rb uri.rb
--- uri_old.rb  Fri Apr 28 15:13:11 2000
+++ uri.rb      Fri Apr 28 15:42:33 2000
@@ -345,7 +345,4 @@
       # remove current directories
-      apath.gsub!(%r|/\./|, sLASH)
+      apath.gsub!(%r|/(\./)+|, sLASH)
       apath.sub!(%r|/\.\z|, sLASH)
-      if path[0..2] == sLASH_DOT_SLASH
-       apath = sLASH_DOT_SLASH + apath
-      end
__END of patch for uri.rb__
 

3. html-parser(version 19990912)について

HTMLファイルの解析に、昔のアーカイブには存在したhtml-parserを利用さ
せていただいています。しかし、現在のRubyApplication Archiveには見当
たりません。便利だと思われるのですが、もうサポートがされていないので
しょうか?それとも、他にhtmlに使えるパーサがあったりするのでしょうか?

ちなみに2つほどバグと思われる部分を見つけたので、以下にパッチを添え
ておきます。

__patch for sgml-parser.rb__
--- sgml-parser_old.rb  Fri Apr 28 16:55:29 2000
+++ sgml-parser.rb      Fri Apr 28 16:55:37 2000
@@ -53,3 +53,3 @@
   def setliteral(*args)
-    self.literal = true
+    @literal = true
   end
__END of patch for sgml-parser.rb__

__patch for html-parser.rb__
--- html-parser_old.rb  Fri Apr 28 16:51:40 2000
+++ html-parser.rb      Fri Apr 28 16:54:20 2000
@@ -249,3 +249,3 @@
       if a == 'type'
-       if len(v) == 1
+       if v.length == 1
          v = v + '.'
__END of patch for html-parser.rb__


以上です。

大島 龍之介	ryu@jaist.ac.jp

In This Thread

Prev Next