[#16732] sharing sub-regexp — Tanaka Akira <akr@...17n.org>

Oniguruma についてひとつ要望があります。

51 messages 2002/04/03
[#16744] Re: sharing sub-regexp — "K.Kosako" <kosako@...> 2002/04/04

Tanaka Akiraさんの<hvopu1hxfyd.fsf@coulee.a02.aist.go.jp>から

[#16746] Re: sharing sub-regexp — matz@... (Yukihiro Matsumoto) 2002/04/04

まつもと ゆきひろです

[#16753] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/04

In article <1017890618.302241.17865.nullmailer@ev.netlab.jp>,

[#16755] Re: sharing sub-regexp — "K.Kosako" <kosako@...> 2002/04/05

Tanaka Akiraさんの<hvo7knn93ug.fsf@coulee.a02.aist.go.jp>から

[#16756] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/05

In article <20020405044506.D4784349@helium.ruby-lang.org>,

[#16822] Re: sharing sub-regexp — "K.Kosako" <kosako@...> 2002/04/10

Tanaka Akiraさんの<hvopu1e4omy.fsf@coulee.a02.aist.go.jp>から

[#16831] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/10

In article <20020410025054.C8DF0915@helium.ruby-lang.org>,

[#16863] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/11

In article <hvor8lnchak.fsf@coulee.a02.aist.go.jp>,

[#16877] Re: sharing sub-regexp — Shugo Maeda <shugo@...> 2002/04/12

前田です。

[#16887] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/12

In article <87pu15z80q.wl@studly.priv.netlab.jp>,

[#16909] Regexp#to_s — Shugo Maeda <shugo@...> 2002/04/15

前田です。

[#16912] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/15

In article <87g01x1e6m.wl@studly.priv.netlab.jp>,

[#16931] Re: Regexp#to_s — Kazuhiro NISHIYAMA <zn@...> 2002/04/16

西山和広です。

[#16934] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/16

In article <20020416180631.988E.ZN@mbf.nifty.com>,

[#16938] Re: Regexp#to_s — Shugo Maeda <shugo@...> 2002/04/17

前田です。

[#16939] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/17

In article <87u1qaj0xe.wl@studly.priv.netlab.jp>,

[#16947] Re: Regexp#to_s — Shugo Maeda <shugo@...> 2002/04/18

前田です。

[#16950] Re: Regexp#to_s — matz@... (Yukihiro Matsumoto) 2002/04/18

まつもと ゆきひろです

[#16951] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/18

In article <1019116103.420173.12691.nullmailer@picachu.netlab.jp>,

[#16960] Re: Regexp#to_s — nobu.nakada@... 2002/04/18

なかだです。

[#16761] StringIO — tadf@...

ふなばです。

43 messages 2002/04/05
[#16786] Re: StringIO — nobu.nakada@... 2002/04/08

なかだです。

[#16802] Re: StringIO — tadf@... 2002/04/09

ふなばです。

[#16803] Re: StringIO — nobu.nakada@... 2002/04/09

なかだです。

[#16804] Re: StringIO — tadf@... 2002/04/09

ふなばです。

[#17221] Re: StringIO — Wakou Aoyama <wakou@...> 2002/05/30

青山です。

[#17230] Re: StringIO — matz@... (Yukihiro Matsumoto) 2002/05/30

まつもと ゆきひろです

[#17231] Re: StringIO — Tanaka Akira <akr@...17n.org> 2002/05/30

In article <1022740594.117106.6073.nullmailer@picachu.netlab.jp>,

[#17233] IO#size — Shugo Maeda <shugo@...> 2002/05/30

前田です。

[#17239] Re: IO#size — Tanaka Akira <akr@...17n.org> 2002/05/31

In article <874rgqdt3x.wl@studly.priv.netlab.jp>,

[#17253] Re: IO#size — Wakou Aoyama <wakou@...> 2002/05/31

青山です。

[#16790] Ruby Shim — "Akinori MUSHA" <knu@...>

 1.7 early access kit という仮称で提案した構想ですが、先ほど

27 messages 2002/04/08
[#16796] Re: Ruby Shim — Koji Arai <JCA02266@...> 2002/04/08

新井です。

[#16833] math.c 1.10 — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

23 messages 2002/04/11
[#16834] Re: math.c 1.10 — matz@... (Yukihiro Matsumoto) 2002/04/11

まつもと ゆきひろです

[#16869] Makefiles dependency — nobu.nakada@...

なかだです。

17 messages 2002/04/12

[ruby-dev:16751] Re: sharing sub-regexp

From: Tanaka Akira <akr@...17n.org>
Date: 2002-04-04 09:29:56 UTC
List: ruby-dev #16751
In article <20020403113824.A7FE78CF@helium.ruby-lang.org>,
  "K.Kosako" <kosako@sofnec.co.jp> writes:

> 1. DFAの記述方法(形式)を、私は知らない。

> 4. Rubyで利用する前提の話であれば、記述形式の拡張となるので、
>    私が単独では決められない。

私の知る限り既存の正規表現パッケージにはこのような機能は存在しないので、
独自に設計する必要があります。

まぁ、概念としては難しいものではないので、適当に設計すればいいんじゃな
いかと思います。

例えば、Grail というソフトウェアでは (abc)* に対応する DFA を次のよう
に表現します。http://www.csd.uwo.ca/research/grail/

(START) |- 0
0 a 1
1 b 2
2 c 0
0 -| (FINAL)

0, 1, 2 という state があって、遷移が一行毎に書いてあって、(START) と
(FINAL) で初期状態と受理状態を示す、という感じですね。

> 2. 不受理の結果を処理するために、多少は改造(命令追加?)が必要。

ふむ。

> 3. DFA専用で作ったものより、遅くなるのではないか?

限界性能までは求めていません。
Ruby で実装したものよりも十分に速ければいいと思っています。

> 鬼車とは独立に作成したほうが、有利ではないでしょうか?
> (正規表現のアンカー等による検索の最適化機能は、意味がないんですよね)

正規表現の中に埋め込みたいというのが意図なのです。

例えば、
%r{/\*(
       # */ が含まれない文字列にマッチする DFA
       (START) |- 0
       0 \* 1
       0 / 0
       0 [^/\*] 0
       1 \* 1
       1 [^/\*] 0
       0 -| (FINAL)
       1 -| (FINAL)
      )\*/}x
とか。

もう少し内面的な点を述べると、結局、私にとっては、正規表現と DFA の等
価性を知っていて、DFA において簡単に表現可能であることがわかっているに
もかかわらずできないということがフラストレーションになっているので、正
規表現といっしょに使いたいと希望としています。ただし、現実にはさまざま
な問題点あるかもしれませんからどうしてもというわけではありません。もし、
比較的簡単なら、というわけです。

In article <20020404021742.B61F17AD@helium.ruby-lang.org>,
  "K.Kosako" <kosako@sofnec.co.jp> writes:

> サイズが問題だから共有するということは、
> 元のパターンだけでなくて、生成されたバイトコードも共有するということですよね。

はい。

> 共有された部分の実行を、関数呼び出しのように実行するために、
> スタックと命令コードのを新規追加すれば可能ではないかと思います。
> (呼び出しではない直接実行の場合も、呼び出しのように実行しなければいけない
> ので、速度的には不利と思いますが。実用に適さないほど遅くなるかどうかは不明。)

なるほど。

> 今は、()にしか番号を振っていませんので、名前で参照する方法だけにしたほうが
> 良いと思います。
> 名前定義グループと名前参照の二個分、ノードの種類を増やしてやればできるような
> 気がします。

確かに 番号が 2種類あると混乱を招くかも知れませんね。
-- 
[田中 哲][たなか あきら][Tanaka Akira]
「ふえろ! わかめちゃん作戦です$(C⊇」(Little Worker, 桂遊生丸)

In This Thread