ruby-list

チュートリアルの5回目です．今回のテーマは『正規表現』です．

実はrubyにバグがあったので，中で紹介されているregx.rbを実行
する時には以下のパッチを当ててください．もうすぐ0.96b(か，ま
たは0.97)を出します．

--- string.c~	Fri Feb  2 18:29:57 1996
+++ string.c	Wed Feb  7 10:22:30 1996
@@ -702 +702 @@
-	offset += STRLEN(repl);
+	offset = beg + STRLEN(repl);

--
* 正規表現のパズル

もうちょっとましなパズルをしよう．今度はある文字列の一部に文
字列(パターンと呼ぶ)が一致するかどうかを見ることにしてみよう．
たとえば，パターン"abc"は文字列"abcdef"とマッチする．

これだけだと，全然面白くないので，パターンに役のある文字を導
入しよう．以下が特別な役のある文字だ．

	^	行頭
	$	行末
	.	任意の1文字
	[ ]	文字範囲指定．[a-z]はaからzまでのいずれか
	\w	英数字．[0-9A-Za-z_]と同じ
	\W	非英数字
	\s	空白文字．[ \t\n\r\f]と同じ
	\S	非空白文字
	\d	数字．[0-9] と同じ
	\D	非数字
	\b	語境界文字(範囲指定外)
	\B	非語境界文字
	\b	後退(0x08)(範囲指定内)
	*	直前の表現の0回以上の繰り返し
	+	直前の表現の1回以上の繰り返し
	{m,n}   直前の表現のm回からn回の繰り返し
	?	直前の表現の0または1回の繰り返し
	|	選択
	( )     表現をまとめる

たとえば，「^f[a-z]+」は「fからはじまるaからzまでの文字の繰
り返し」であり，"foobar"や"fool"などと一致する．こういう役の
ある一致を正規表現(regular expression)と呼ぶ．正規表現は文字
列の検索の時に役に立つので，UNIXの世界ではいろいろと使われて
いる．代表的なのはgrepと呼ばれるプログラムだ．

たとえば，このチュートリアルのファイルから見出しの行を取り出
すためには，「^\* 」というパターンにマッチする行を選べば良い．

正規表現を身につけるために，ちょっとしたプログラムを使ってみ
よう．以下のプログラムをregx.rbという名前でセーブして実行し
てみよう．

 st = "\033[7m"
 en = "\033[m"

 while TRUE
   print "str> "
   STDOUT.flush
   str = gets
   break if not str
   str.chop!
   print "pat> "
   STDOUT.flush
   re = gets
   break if not re
   re.chop!
   str.gsub! re, "#{st}&#{en}"
   print str, "\n"
 end
 print "\n"

これは最初に入力した文字列のうち，次に入力した正規表現に一致
する部分を反転するプログラムだ以下は実行例だ．

 str> foobar
 pat> ^fo+
 foobar
 ~~~

# 実際はfooの部分は反転している．

いろいろ試してみよう．

 str> abc012dbcd555
 pat> \d
 abc012dbcd555
    ~~~    ~~~
このプログラムは複数の一致を検出できるようになっている．

 str> foozboozer
 pat> f.*z
 foozboozer
 ~~~~~~~~
foozではなく，foozboozにマッチするのは正規表現というのはより
長い一致を選ぶようになっているからだ．

正規表現はとてもひとめでは意味の分からないようなパターンも書
ける．

 str> Wed Feb  7 08:58:04 JST 1996
 pat> [0-9]+:[0-9]+(:[0-9]+)?
 Wed Feb  7 08:58:04 JST 1996
            ~~~~~~~~
rubyのプログラムの中では正規表現は`/'でくくる．またいくつか
のメソッドは文字列を正規表現に自動的に変換してくれる．

 ruby> "abcdef" =~ /def/
 3
 ruby> "aaaa" =~ /d/
 FALSE

`=~'は正規表現の比較を行う演算子で，一致した時一致した位置を
返す．

Thread

Prev Next

In This Thread

Prev Next

[#108] Re: None — matz@... (Yukihiro Matsumoto)

[#109] Re: ruby 0.96a core dump — matz@... (Yukihiro Matsumoto)

[#110] pure ruby — nakawtse@... (P nakawtse)

[#111] Re: pure ruby — matz@... (Yukihiro Matsumoto)

[#112] Re: pure ruby — ozawa@...

[#113] Re: pure ruby — matz@... (Yukihiro Matsumoto)

[#114] iterator benchmark — matz@... (Yukihiro Matsumoto)

[#115] Re: iterator benchmark — matz@... (Yukihiro Matsumoto)

[#116] while vs WHILE — nakawtse@... (P nakawtse)

[#117] Re: while vs WHILE — matz@... (Yukihiro Matsumoto)

[#118] i++ — nakawtse@... (P nakawtse)

[#119] Re: i++ — matz@... (Yukihiro Matsumoto)

[#120] Re: i++ — matz@... (Yukihiro Matsumoto)

[#121] iterator by C? — nakawtse@... (P nakawtse)

[#122] Re: iterator by C? — matz@... (Yukihiro Matsumoto)

[#123] TUTORIAL - intro — matz@... (Yukihiro Matsumoto)

[#124] TUTORIAL - ruby's features — matz@... (Yukihiro Matsumoto)

[#125] i++ ???? — nakawtse@... (P nakawtse)

[#126] Re: i++ ???? — matz@... (Yukihiro Matsumoto)

[#127] TUTORIAL - simple scripts — matz@... (Yukihiro Matsumoto)

[#128] TUTOROAL - strings — matz@... (Yukihiro Matsumoto)

[#129] Re: TUTOROAL - strings — matz@... (Yukihiro Matsumoto)

[#130] TUTORIAL - regular expression — matz@... (Yukihiro Matsumoto)

[#131] ruby — OZAWA Sakuro <ozawa@...>

[#132] Re: ruby — matz@... (Yukihiro Matsumoto)

[#133] Yet another ruby ?? — nakawtse@... (P nakawtse)

[#134] Re: Yet another ruby ?? — matz@... (Yukihiro Matsumoto)

[#135] TUTOARIAL - array and associative-array — matz@... (Yukihiro Matsumoto)

[#136] Re: TUTOARIAL - array and associative-array —

[#137] Re: TUTOARIAL - array and associative-array — matz@... (Yukihiro Matsumoto)

[#138] TUTORIAL - simple scripts again — matz@... (Yukihiro Matsumoto)

[#139] ruby 0.97 available — matz@... (Yukihiro Matsumoto)

[#140] Altair — Yasuo OHBA <jammy@...>

[#141] Re: Altair — matz@... (Yukihiro Matsumoto)

[#142] homepage — Yasunari Momoi <conan@...>

[#143] The black face. — nakawtse@... (P nakawtse)

[#144] Re: homepage — matz@... (Yukihiro Matsumoto)

[#145] Re: The black face. — matz@... (Yukihiro Matsumoto)

[#146] TUTORIAL - control structure — matz@... (Yukihiro Matsumoto)

[#147] Re: cannot mget files — matz@... (Yukihiro Matsumoto)

[#148] rml — nakawtse@... (P nakawtse)

[#149] Re: rml — matz@... (Yukihiro Matsumoto)

[#150] Re: rml — matz@... (Yukihiro Matsumoto)

[#151] [..]or[...] — nakawtse@... (P nakawtse)

[#152] Re: [..]or[...] — matz@... (Yukihiro Matsumoto)

[#153] Ruby's home page — matz@... (Yukihiro Matsumoto)

[#154] TUTORIAL - iteraters — matz@... (Yukihiro Matsumoto)

[#155] [Q] ruby-mode.el — j_kuro@... (Jun Kuroda)

[#156] Re: [Q] ruby-mode.el — matz@... (Yukihiro Matsumoto)

[#157] Re: [Q] ruby-mode.el — matz@... (Yukihiro Matsumoto)

[#158] Re: [Q] ruby-mode.el — j_kuro@... (Jun Kuroda)

[#159] Re: [Q] ruby-mode.el — matz@... (Yukihiro Matsumoto)

[#160] Re: [Q] ruby-mode.el — j_kuro@... (Jun Kuroda)

[#161] TUTORIAL - object-orientation — matz@... (Yukihiro Matsumoto)

[#162] dir.rb が動きません . — Yasuo OHBA <jammy@...>

[#163] Re: dir.rb が動きま せん . — matz@... (Yukihiro Matsumoto)

[#164] TUTORIAL - methods — matz@... (Yukihiro Matsumoto)

[#165] UNIX MAGAZINE — Yasuo OHBA <jammy@...>

[#166] UNIX MAGAZINE — Yasuo OHBA <jammy@...>

[#167] cmail — nakawtse@... (P nakawtse)

[#168] Re: cmail — matz@... (Yukihiro Matsumoto)

[#169] Hello — Kazuhiko Iwama <iwama@...>

[#170] Re: Hello — matz@... (Yukihiro Matsumoto)

[#171] Re: Hello — Kazuhiko Iwama <iwama@...>

[#172] freebsd patch for dynamic link — Mitsuhide Satou <mit-sato@...>

[#173] var — nakawtse@... (P nakawtse)

[#174] DOS port — matz@... (Yukihiro Matsumoto)

[#175] Re: freebsd patch for dynamic link — matz@... (Yukihiro Matsumoto)

[#176] Re: var — matz@... (Yukihiro Matsumoto)

[#177] TUTOIAL - class — matz@... (Yukihiro Matsumoto)

[#178] Re: DOS port — matz@... (Yukihiro Matsumoto)

[#179] Re: DOS port —

[#180] Re: DOS port — Kazuhiko Iwama <iwama@...>

[#181] Re: DOS port — matz@... (Yukihiro Matsumoto)

[#182] Re: DOS port — Kazuhiko Iwama <iwama@...>

[#183] Re: DOS port — matz@... (Yukihiro Matsumoto)

[#184] Re: DOS port — Kazuhiko Iwama <iwama@...>

[#185] Re: DOS port — Kazuhiko Iwama <iwama@...>

[#186] Hello. — Takashi Nagano <nagano@...>

[#187] Re: Hello. — matz@... (Yukihiro Matsumoto)

[#163] Re: dir.rb が動きません . — matz@... (Yukihiro Matsumoto)

[#229] Re: ネイティブクラスを作る — matz@... (Yukihiro Matsumoto)

[#230] Re: ネイティブクラスを作る — gougi@...3test3.nagoya.caelum.co.jp (Shigeru Gougi)

[#231] Re: ネイティブクラスを作る — matz@... (Yukihiro Matsumoto)

[#232] Re: ネイティブクラスを作る — gougi@...3test3.nagoya.caelum.co.jp (Shigeru Gougi)

[#233] Re: ネイティブクラスを作る — matz@... (Yukihiro Matsumoto)

[#234] Re: ネイティブクラスを作る — gougi@...3test3.nagoya.caelum.co.jp (Shigeru Gougi)