ruby-dev

In article <86my9l2tts.knu@iDaemons.org>,
  "Akinori MUSHA" <knu@iDaemons.org> writes:

> 　しかし、 ChangeLog のような場合は gather_each も単純さを維持
> できず複数行になると思います。buffer は、そうした少しの違いには
> 少しの違いで対応できます。

下にある ChangeLog の例は、slice_before と gather を使って書
くと以下のような感じになるでしょうか。
(ここで使っている gather は、[ruby-dev:38418] の仕様で、nil
によりその要素を除去します。そこでは slice_before も実装して
あります)

open("ChangeLog") {|f|
  f.slice_before {|l|
    /\A\S/ =~ l
  }.each {|h|
    header = h.shift
    h.gather {|l|
      /\A\s*\z/ !~ l
    }.each {|entry_lines|
      next if /\A\s+\*/ !~ entry_lines[0]
      puts header, *entry_lines
      puts "----"
    }
  }    
}

gather や slice_before は入力の並びを変えられないので、この
ような処理はこうやって何段階かに分けてやることになりますね。

> 　はい。私の方は gather_each がカバーできる範囲の広さについて
> 疑問を持っていますが、二択という話ではないと思っています。

そうですね。

> 　情報を捨てないとすると、カバー範囲はとても狭くなると思います。
> たとえばコード片の摘出の例は実用的な処理として完結しないので、
> gather の有用な使用例としては弱いのではないでしょうか。

あぁ、捨てないことが出来る、と書くべきでした。
どの値を捨てる印にするかという話はありますが、捨てる機能は付
けようと思っています。

コード片については、コード片の syntax check をやるのであれば
他は捨てていいでしょうし、また、文書の中のコード片を (色とか)
マークアップするのであれば、他の部分は残しておいたほうがいい
でしょう。用途次第ですね。

> 　たとえばですが、 RD や markdown のような文書を処理する場合を
> 考えていました。考えてみると gather の守備範囲外かもしれませんね。

RD の pre はインデントが先頭行の深さ以上のところですからねぇ。
buffer のように上から処理していったほうが自然かも。

もし、インデントを先頭行よりも浅くできるようなフォーマットで
あれば、あとからやったほうがいいでしょうね。

>> もし、どうしても分類の値が必要だということであれば、yield す
>> る配列にインスタンス変数としてつけておく (必要ならそれを参照
>> するアクセサも) のにはやぶさかではありません。
>
> 　その場合のAPIはどうなるのでしょう。gather 本来の用途には邪魔な
> データがくっついてしまうので、別メソッドですかね。

ary.category とかでいいんじゃないでしょうか。配列にメソッド
があったからって邪魔にはなりませんよね。

enum.gather { ... }.each {|ary| p ary.category }

> 　むしろ、田中さんの出された2問を具体例としたときの私なりの解が
> Buffer なんですよ。scanf.rbからのコード片の切り出しという最初の
> 例は、コード片でない部分も含めて pp するというのが最終目的では
> ないですよね。削除するという機能が欠けているので不要な部分まで
> 得られてわずらわしい。従って取捨選択の機能が必要ではないか、と
> 思いました。

gather のブロックのなにかの値に削除の機能を割り当てようと思
います。

[ruby-dev:38418] の実装だと、nil, false, :reject が削除になっ
てます。

> 　次にパラグラフごとに切るという例は gather_each がもっとも短く
> 書ける例でした。しかしながら、ヘッダを区切りとする構造を扱う際は
> 短くなくなる。従って恣意的なタイミングで yield できる必要がある、
> あるいは状態の管理を支援するといいのではないか、と思いました。

ヘッダを区切りとする場合には別メソッドの slice_before がいい
んじゃないかと思います。

> 　これらを合わせた考えたのが Bufferです。当たり前ですが複雑なこと
> 自体を目指しているのではなくて、 gather_each では不十分と感じ、
> 一部のケースを除けば最適な解とは思えなかったのが対案の動機です。

なるほど。

> Unix mbox の切り分け:

slice_before (slice_by) による実装は [ruby-dev:38407] に書き
ましたが、buf の扱いが不要なぶん slice_before のほうが簡潔で
すね。

> ChangeLog の各エントリの切り出し:

これは上に書きましたが、もっと短く書けます。

> 簡単な電卓:

なんで buffer を使うんですか?

>   STDIN.lines.buffer { |line, buf|
>     until line.empty?
>       line.sub!(/\A\s+/, '')
>       line.sub!(/\A(\d*\.?\d+)/) { buf << [:NUM, $1.to_f]; '' }
>       line.sub!(/\A([+\-*\/])/) { buf << [:OP, $1.intern]; '' }
>     end
>     buf.flush
>   }.tap { |expr|

これって、1行ずつトークンにわけて、それを処理するわけですよ
ね。

STDIN.each_line {|line|
  line をトークンにわけて tokens に入れる
  tokens を計算して表示
}

というのではいけないんですか?
-- 
[田中 哲][たなか あきら][Tanaka Akira]

Thread

Prev Next

In This Thread

Prev Next

[#38362] [Bug #1427] Difference between Array#to_s and Array#inspect — "ujihisa ." <redmine@...>

[#38364] [Bug #1429] An arbitrary number of arguments of SortedSet#initialize — "ujihisa ." <redmine@...>

[#38368] IO.copy_stream doesn't convert encodings — sheepman <sh@...>

[#38370] Re: [ruby-core:23338] [Bug #1425] ruby/1.8/drb/drb.rb:1480: [BUG] Segmentation fault — Masatoshi SEKI <m_seki@...>

[#38371] Re: [ruby-cvs:30538] Ruby:r23320 (trunk): * lib/set.rb (SortedSet#add): Do not let an uncomparable object — "Yugui (Yuki Sonoda)" <yugui@...>

[#38372] making install-sh more descriptive — "Yugui (Yuki Sonoda)" <yugui@...>

[#38374] [Bug #1433] test_sprintf_p fails — Yui NARUSE <redmine@...>

[#38375] [Bug #1435] README.ja: 「defined(THINK_C)」 — Kazuhiro NISHIYAMA <redmine@...>

[#38376] [Bug #1435](Closed) README.ja: 「defined(THINK_C)」 — Nobuyoshi Nakada <redmine@...>

[#38377] Marshaling URI between 1.8 and 1.9 — Tanaka Akira <akr@...>

[#38382] [Bug #1442] indentation check and coverage for toplevel do not work — Yusuke Endoh <redmine@...>

[#38390] [Bug:1.8] Tempfile and extended Enumerable — Tanaka Akira <akr@...>

[#38392] Enumerable#gather_each — Tanaka Akira <akr@...>

[#38398] [Bug #1451] dl in ruby-1.9 can't parse signatures correctly. — Takashi Tamura <redmine@...>

[#38403] [Bug #1452] DL::CPtr.new doesn't check the type of the 3rd arg. — Takashi Tamura <redmine@...>

[#38404] [Bug #1453] dl in ruby-1.9 must check whether block is given to TempFunction — Takashi Tamura <redmine@...>

[#38423] longlife gc — Narihiro Nakamura <authornari@...>

[#38426] [Bug #1456] invalid $LOAD_PATH when configure with --program-suffix — Kazuhiro NISHIYAMA <redmine@...>

[#38434] [Bug #1464] backport request to ruby_1_9_1 — Usaku NAKAMURA <redmine@...>

[#38443] Re: [ANN] Ruby 1.9.1-p129リリース — Takahiro Kambe <taca@...>

[#38446] [Bug:1.9] exact Time and inexact Time — Yusuke ENDOH <mame@...>

[#38448] GCの問題 — keiju@... (Keiju ISHITSUKA)

[#38456] [Bug #1470] class definition under the anonymouse module dumps core — Nobuhiro IMAI <redmine@...>

[#38463] SQLiteライブラリ — "NARUSE, Yui" <naruse@...>

[#38474] [Bug #1477] DL::Function#unbind raises TypeError — Takashi Tamura <redmine@...>

[#38486] [Bug #1483] some commands installed without program-suffix — Kazuhiro NISHIYAMA <redmine@...>

[#38488] [Bug #1485] warning in pathname when verbose mode — Kazuhiro NISHIYAMA <redmine@...>

[#38492] [Bug: trunk] test_encode_xmlschema depends upon system's time zone — zunda <zunda616e@...>

[#38493] [Feature:trunk] enhancement of Array#drop — "U.Nakamura" <usa@...>

[#38496] [Bug #1489] Netbeansからruby-debug-ideを利用した際 Segmentation faultが発生。 — Kiyokazu Hayashi <redmine@...>

[#38498] [Bug #1491] 「attr_reader :○○」と「def ○○ ; @○○ ; end」で動作が異なる — 慎一 江口 <redmine@...>

[#38508] overflow on LP64 — Nobuyoshi Nakada <nobu@...>

[#38518] [Bug:1.9] Enumerator.new { }.take(1).inject(&:+) causes stack overflow — Yusuke ENDOH <mame@...>

[#38524] [Bug #1503] -Kuをつけた時、/[#{s}]/n と Regexp.new("[#{s}]",nil,"n") で実行結果が異なる — sinnichi eguchi <redmine@...>

[#38531] [Bug #1075](Rejected) \r\n と \n が混在した CSV がエラーになる — James Gray <redmine@...>

[#38533] [Bug #1505] DL::CPtr#<=> doesn't return -1 — Takashi Tamura <redmine@...>

[#38535] [Bug #1506] irbで日本語を入力できない — Nobuhiro IMAI <redmine@...>

[#38537] [Bug #1508] Recursive arrays with the same structure are not eql?. — Yuki Sonoda <redmine@...>

[#38538] [Bug #1509] typo in CGI::HTTP_STATUS — Nobuhiro IMAI <redmine@...>

[#38539] [ANN] RubyKaigi2009: Commiter Invitation — SASADA Koichi <ko1@...>

[#38544] [Bug #1523] typo in sample/optparse/opttest.rb — Kazuhiro NISHIYAMA <redmine@...>

[#38545] [suggestion] sorted flag for Array — Yusuke ENDOH <mame@...>

[#38549] Re: [ruby-cvs:30701] Ruby:r23482 (ruby_1_8): * ext/thread/thread.c (unlock_mutex_inner): should adjust join — Tietew <tietew@...>

[#38550] チケットBackport #1091 [ruby-core:21762]のステータスについて — Takahiro Kambe <taca@...>

[#38554] [Bug #1534] Inconsistency Between Struct#to_s and Struct#inspect — "ujihisa ." <redmine@...>

[#38555] [Bug #1537] The Feature of Hash#to_s was Changed — "ujihisa ." <redmine@...>

[ruby-dev:38422] Re: Enumerable#gather_each

Thread

In This Thread

[#38496] [Bug #1489] Netbeansからruby-debug-ideを利用した際　Segmentation faultが発生。 — Kiyokazu Hayashi <redmine@...>

[#38498] [Bug #1491] 「attr_reader :○○」と「def ○○ ; @○○ ; end」で動作が異なる — 慎一江口 <redmine@...>