ruby-dev

At Sun, 10 May 2009 10:08:47 +0900,
Tanaka Akira wrote:
> In article <86r5yy2nrg.knu@iDaemons.org>,
>   "Akinori MUSHA" <knu@iDaemons.org> writes:
>
> > 　少し仕様がわかりにくいように思います。繰り返しというストリームの
> > バッファという発想から、次のようなインターフェースを考案しました。
>
> どのようにわかりにくかったでしょうか?

nil の扱いの特殊性(捨てるのでなくそれ単独で、という意味づけ)とか、
gather という名前のせいかも知れませんが同じ値が再出しても前とは
関係ないというあたりですかねえ。

　引用を前後させてしまいますが、

> たとえば、ChangeLog をエントリ単位に処理するには、行頭が空白
> じゃなかったら flush すればいいというわけで以下のようにすれ
> ばいいと考えるかもしれませんが、実はそれだけだと先頭に [] が
> 表示されるというバグが発生してしまいます。
>
>   open("ChangeLog") {|f|
>     f.buffer {|e, b|
>       b.flush if /\A\S/ =~ e
>       b << e
>     }.each {|lines| pp lines }
>   }
>
> ちゃんとやるには条件を /\A\S/ =~ e && !b.empty? にしないとい
> けません。

これは思いました。バッファが空(初期化状態)の場合は flush しても
yield しないようにするべきですね。

> > どうでしょうか。
>
> まず、gather_each に比べてコードが長くなってよろしくありません。
>
> たとえば、最初に出したパラグラフの例は以下のように長くなってしまいます。

　最初の例というのが
> arg = lambda {|l| /\A\=~ l ? true : nil }
で読めなかったのですが、 l == "\n" でしたか。

> buffer:
>   open("lib/scanf.rb") {|f|
>     f.buffer {|e, b|
>       s = e == "\n"
>       b.flush if b.status != nil && b.status != s
>       b.status = s
>       b << e
>     }.each {|lines| pp lines }
>   }

これは

        prev, s.status = s.status, (e == "\n")
        b.flush if prev != b.status
        b << e

くらいで悪くはないと思います。b.status != nil のところは、上記の
「空なら flush しない」で手当てするとして。

　やりすぎかもしれませんが、 status/status= を提供するのなら、
prev_status や status_changed? も用意するという手はあります。

> gather_each:
>   arg = lambda {|l| l == "\n" }
>   open("lib/scanf.rb") {|f|
>     f.gather_each(arg) {|lines| pp lines }
>   }

　区切るだけなら確かに1行で済みますが、実際にはサンプルコード辺か
どうかを判定したり、前後の空行を除いたりと最終結果までの道のりは
長いので何とも言えません。要らない部分まで集めて(gather)いますが、
本当はもっと複雑な処理が必要なので buffer のようなものがあれば、
取捨や加工についても引き受けることができると思いました。

> また、gather_each は、ある要素に対する処理は、その要素とそれ
> が属するまとまりのことだけを考えて書けばいいようにデザインし
> てあるのですが、buffer では直前のまとまりを flush する必要が
> あって、直前のまとまりについても考えなければいけません。
> つまり、buffer のほうが考えることが多くなってよろしくありま
> せん。
>
> こういう、直前がなんだったか、というのを考えなくていいという
> のが gather_each の利点です。

　上記の通り、実際に考えるべきことが後ろに残ると思うので、 gather
単体の提供する機能が中途半端に思えたのです。すなわち、インデント
レベル等、分類の基準として計算した値(ブロックの評価値)を捨てて
しまっていますが、この例でも、後段でまた必要になりそうですよね。

> そして、gather_each でも同様に状態は扱えて、ChangeLog のエン
> トリは以下のように処理できます。(gather を使ってみました)
>
>   open("ChangeLog") {|f|
>     i = 0
>     f.gather {|l| i += 1 if /\A\S/ =~ l; i }.each {|lines| pp lines }
>   }

　そこが妥協可能ならそれでもいいですね。buffer の引数で status の
初期値を与えるようなことも考えていましたが。

> なお、私としてはこれを勧めているわけではなくて、ユーザがそう
> いう状態遷移を考えなくて済むというのが良いと思っています。
> つまり、専用のメソッを作るほうが、状態を考えなくていいので良
> いと思います。

　なるほど。それと、再び引用が前後しますが、

> 私は、gather_each とあともうひとつ ChangeLog みたいなものを
> 処理するものがあると、かなりの範囲の用途を扱えるのではないか、
> と考えています。その推測が正しければ専用のメソッドのほうが便
> 利でしょう。

ということであれば、 buffer を使って gather 等を実装するのは容易
なので、複数のメソッドを用意するのなら、実装を共有するためにも
buffer のような汎用のものを持つメリットがあるということになるの
ではないでしょうか。

> gather_each でも、要素を結果から除去する指定は出来てもいいか
> な、という気はします。そのための値を分類結果に定義しておけば
> 可能で、nil をその意味にするか、あるいは :delete あたりにす
> るか、なにがいいかな。
>
> buffer はいろんなことができるようにするという意図が感じられ
> ますが、現実的な用途の想定として、どんなものが考えられますか?

　buffer は1回のイテレーションで複数の値を push したり複数回
flush したり(あるいはしなかったり)でき、またイテレータ引数で
なく任意の値を push できるので、 lexer などを実装できます。

　というか、 scanf.rb をパースする例を見て、実際の延長上には
lexer のようなものがあるんじゃないかと推測しました。

--
Akinori MUSHA / http://akinori.org/

Thread

Prev Next

In This Thread

Prev Next

[#38362] [Bug #1427] Difference between Array#to_s and Array#inspect — "ujihisa ." <redmine@...>

[#38364] [Bug #1429] An arbitrary number of arguments of SortedSet#initialize — "ujihisa ." <redmine@...>

[#38368] IO.copy_stream doesn't convert encodings — sheepman <sh@...>

[#38370] Re: [ruby-core:23338] [Bug #1425] ruby/1.8/drb/drb.rb:1480: [BUG] Segmentation fault — Masatoshi SEKI <m_seki@...>

[#38371] Re: [ruby-cvs:30538] Ruby:r23320 (trunk): * lib/set.rb (SortedSet#add): Do not let an uncomparable object — "Yugui (Yuki Sonoda)" <yugui@...>

[#38372] making install-sh more descriptive — "Yugui (Yuki Sonoda)" <yugui@...>

[#38374] [Bug #1433] test_sprintf_p fails — Yui NARUSE <redmine@...>

[#38375] [Bug #1435] README.ja: 「defined(THINK_C)」 — Kazuhiro NISHIYAMA <redmine@...>

[#38376] [Bug #1435](Closed) README.ja: 「defined(THINK_C)」 — Nobuyoshi Nakada <redmine@...>

[#38377] Marshaling URI between 1.8 and 1.9 — Tanaka Akira <akr@...>

[#38382] [Bug #1442] indentation check and coverage for toplevel do not work — Yusuke Endoh <redmine@...>

[#38390] [Bug:1.8] Tempfile and extended Enumerable — Tanaka Akira <akr@...>

[#38392] Enumerable#gather_each — Tanaka Akira <akr@...>

[#38398] [Bug #1451] dl in ruby-1.9 can't parse signatures correctly. — Takashi Tamura <redmine@...>

[#38403] [Bug #1452] DL::CPtr.new doesn't check the type of the 3rd arg. — Takashi Tamura <redmine@...>

[#38404] [Bug #1453] dl in ruby-1.9 must check whether block is given to TempFunction — Takashi Tamura <redmine@...>

[#38423] longlife gc — Narihiro Nakamura <authornari@...>

[#38426] [Bug #1456] invalid $LOAD_PATH when configure with --program-suffix — Kazuhiro NISHIYAMA <redmine@...>

[#38434] [Bug #1464] backport request to ruby_1_9_1 — Usaku NAKAMURA <redmine@...>

[#38443] Re: [ANN] Ruby 1.9.1-p129リリース — Takahiro Kambe <taca@...>

[#38446] [Bug:1.9] exact Time and inexact Time — Yusuke ENDOH <mame@...>

[#38448] GCの問題 — keiju@... (Keiju ISHITSUKA)

[#38456] [Bug #1470] class definition under the anonymouse module dumps core — Nobuhiro IMAI <redmine@...>

[#38463] SQLiteライブラリ — "NARUSE, Yui" <naruse@...>

[#38474] [Bug #1477] DL::Function#unbind raises TypeError — Takashi Tamura <redmine@...>

[#38486] [Bug #1483] some commands installed without program-suffix — Kazuhiro NISHIYAMA <redmine@...>

[#38488] [Bug #1485] warning in pathname when verbose mode — Kazuhiro NISHIYAMA <redmine@...>

[#38492] [Bug: trunk] test_encode_xmlschema depends upon system's time zone — zunda <zunda616e@...>

[#38493] [Feature:trunk] enhancement of Array#drop — "U.Nakamura" <usa@...>

[#38496] [Bug #1489] Netbeansからruby-debug-ideを利用した際 Segmentation faultが発生。 — Kiyokazu Hayashi <redmine@...>

[#38498] [Bug #1491] 「attr_reader :○○」と「def ○○ ; @○○ ; end」で動作が異なる — 慎一 江口 <redmine@...>

[#38508] overflow on LP64 — Nobuyoshi Nakada <nobu@...>

[#38518] [Bug:1.9] Enumerator.new { }.take(1).inject(&:+) causes stack overflow — Yusuke ENDOH <mame@...>

[#38524] [Bug #1503] -Kuをつけた時、/[#{s}]/n と Regexp.new("[#{s}]",nil,"n") で実行結果が異なる — sinnichi eguchi <redmine@...>

[#38531] [Bug #1075](Rejected) \r\n と \n が混在した CSV がエラーになる — James Gray <redmine@...>

[#38533] [Bug #1505] DL::CPtr#<=> doesn't return -1 — Takashi Tamura <redmine@...>

[#38535] [Bug #1506] irbで日本語を入力できない — Nobuhiro IMAI <redmine@...>

[#38537] [Bug #1508] Recursive arrays with the same structure are not eql?. — Yuki Sonoda <redmine@...>

[#38538] [Bug #1509] typo in CGI::HTTP_STATUS — Nobuhiro IMAI <redmine@...>

[#38539] [ANN] RubyKaigi2009: Commiter Invitation — SASADA Koichi <ko1@...>

[#38544] [Bug #1523] typo in sample/optparse/opttest.rb — Kazuhiro NISHIYAMA <redmine@...>

[#38545] [suggestion] sorted flag for Array — Yusuke ENDOH <mame@...>

[#38549] Re: [ruby-cvs:30701] Ruby:r23482 (ruby_1_8): * ext/thread/thread.c (unlock_mutex_inner): should adjust join — Tietew <tietew@...>

[#38550] チケットBackport #1091 [ruby-core:21762]のステータスについて — Takahiro Kambe <taca@...>

[#38554] [Bug #1534] Inconsistency Between Struct#to_s and Struct#inspect — "ujihisa ." <redmine@...>

[#38555] [Bug #1537] The Feature of Hash#to_s was Changed — "ujihisa ." <redmine@...>

[ruby-dev:38417] Re: Enumerable#gather_each

Thread

In This Thread

[#38496] [Bug #1489] Netbeansからruby-debug-ideを利用した際　Segmentation faultが発生。 — Kiyokazu Hayashi <redmine@...>

[#38498] [Bug #1491] 「attr_reader :○○」と「def ○○ ; @○○ ; end」で動作が異なる — 慎一江口 <redmine@...>