ruby-dev

遠藤です。

2010年11月27日18:45 Tanaka Akira <akr@fsij.org>:
> enumerable から hash を生成するメソッドとして
> Enumerable#categorize を追加するのはどうでしょうか。

みんなと同じ感想ですが、やはり 1 メソッドに詰め込み過ぎていると思います。
「要素の抽出」「分類集計処理」「後処理」のうち、2 番目に絞ったらいいのでは
ないでしょうか。

  [[1, 2], [1, 3], [2, 3]].aggregate          #=> {1 => [2, 3], 2 => [3]}
  [[1, 2], [1, 3], [2, 3]].aggregate(:op=>:+) #=> {1 => 5, 2 => 3 }
  [[1, 2, 3]].aggregate                       #=> {1 => {2 => [3]} }

# 議論の混乱防止のため、aggregate という名前にしています。
# 他の候補としては、to_hash 、hashtree とかどうでしょう。


コーナーケースはこんな感じでしょうか。

  [[1, 2], [1, 2, 3]].aggregate               #=> 例外
  [].aggregate                                #=> {}
  [[]].aggregate                              #=> 例外
  [[1]].aggregate                             #=> 例外


多少 categorize より長くなりますが、何をやっているかはずっとわかりやすく
なると思います。
以下、akr さんの例を書き換えてみました。


ary = [["matz", "Yukihiro Matsumoto"],
       ["nobu", "Nobuyoshi Nakada"],
       ["akr", "Tanaka Akira"],
       ["usa", "Usaku NAKAMURA"],
       ["naruse", "NARUSE, Yui"],
       ["ko1", "SASADA Koichi"]]

# akr さん版:
#   h = ary.categorize(1, 0)

h = ary.map {|k, v| [v, k] }.aggregate

#=> {"Yukihiro Matsumoto"=>["matz"],
#    "Nobuyoshi Nakada"=>["nobu"],
#    "Tanaka Akira"=>["akr"],
#    "Usaku NAKAMURA"=>["usa"],
#    "NARUSE, Yui"=>["naruse"],
#    "SASADA Koichi"=>["ko1"]}


# akr さん版:
#   ary.categorize(lambda {|elt| elt[1] }, lambda {|elt| elt[0] })

h = ary.map {|elt| [elt[1], elt[0]] }.aggregate

#=> {"Yukihiro Matsumoto"=>["matz"],
#    "Nobuyoshi Nakada"=>["nobu"],
#    "Tanaka Akira"=>["akr"],
#    "Usaku NAKAMURA"=>["usa"],
#    "NARUSE, Yui"=>["naruse"],
#    "SASADA Koichi"=>["ko1"]}


# akr さん版:
#   h = ary.categorize(lambda {|e| e[0][0] }, lambda {|e| e[0][1]}, 0)

h = ary.map {|e| [e[0][0], e[0][1], e[0]] }.aggregate

#=> {"m"=>{"a"=>["matz"]},
#    "n"=>{"o"=>["nobu"], "a"=>["naruse"]},
#    "a"=>{"k"=>["akr"]},
#    "u"=>{"s"=>["usa"]},
#    "k"=>{"o"=>["ko1"]}}


# akr さん版:
#   h = ary.categorize(lambda {|e| e[0][0] }, 1) {|ks, vs| vs.sort }

h = ary.map {|elt| [elt[0][0], elt[1]] }.aggregate
h.each {|ks, vs| h[ks] = vs.sort } # または vs.sort!

#=> {"m"=>["Yukihiro Matsumoto"],
#    "n"=>["NARUSE, Yui", "Nobuyoshi Nakada"],
#    "a"=>["Tanaka Akira"],
#    "u"=>["Usaku NAKAMURA"],
#    "k"=>["SASADA Koichi"]}


# akr さん版:
#   h = ary.categorize(1, 0) {|ks, vs|
#     raise "duplicate keys: #{ks.inspcet}" if vs.length != 1
#     vs[0]
#   }

h = ary.map {|k, v| [v, k] }.aggregate
h.each {|ks, vs|
  raise "duplicate keys: #{ks.inspcet}" if vs.length != 1
  h[ks] = vs[0]
}

#=> {"Yukihiro Matsumoto"=>"matz",
#    "Nobuyoshi Nakada"=>"nobu",
#    "Tanaka Akira"=>"akr",
#    "Usaku NAKAMURA"=>"usa",
#    "NARUSE, Yui"=>"naruse",
#    "SASADA Koichi"=>"ko1"}


# akr さん版:
#   h = ary.categorize(lambda {|e| e[0][0] }, lambda {|e| 1 }, :op=>:+)

h = ary.map {|e| [e[0][0], 1] }.aggregate(:op=>:+)

#=> {"m"=>1, "n"=>2, "a"=>1, "u"=>1, "k"=>1}


# akr さん版:
#   committers = open("ruby-committers.yml") {|f| YAML.load(f) }
#   pp committers.categorize("account", ["name", "nick"]) {|ks, vs| vs[0] }

h = committers.map {|e| [e["account"], [e["name"], e["nick"]]] }.aggregate
h.each {|ks, vs| h[ks] = vs[0] }



中間配列ができるのが嫌、と言われると思いますが、それは categorize 特有の
問題ではないので、map の Enumerator を返すバージョンを用意することで解決
すべきだと思います。

# 手前味噌ですが http://d.hatena.ne.jp/ku-ma-me/20091111/p2


また、Hash から Hash を返す map もあると便利かもしれません。
しばしば要望きてると思いますが、なんで用意されないんでしたっけ。


group_by との類似については、個人的にはあまり気になりません。
というか、group_by がどうにも使いにくすぎるのが行けないんだと思います。



あと、:seed は値ではなく値を生成する Proc を受け取るべきだと思います。
Hash.new([]) と同じ設計不良になってしまいます。

  p [[1, 2], [1, 3], [2, 5]].categorize(0, 1, seed: [], op: proc {|x,
e| x << e })
  {1=>[2, 3, 5], 2=>[2, 3, 5]}

-- 
Yusuke Endoh <mame@tsg.ne.jp>

Thread

Prev Next

In This Thread

Prev Next

[#42666] Errno::EINTR: Interrupted system call on console#echo= — SASADA Koichi <ko1@...>

[#42668] [Ruby 1.9-Bug#4109][Open] test_timeout.rbが失敗する — Kouhei Yanagita <redmine@...>

[#42670] webrick log remote port: %{remote}p — Tanaka Akira <akr@...>

[#42672] [Ruby 1.9-Bug#4110][Open] ホスト名の先頭が数字であるとき、WEBrickのテストでErrorが出る — Kouhei Yanagita <redmine@...>

[#42674] [Ruby 1.9-Bug#4112][Assigned] StringIO#gets(limit) returns incomplete string — Nobuyoshi Nakada <redmine@...>

[#42677] Fwd: [ruby-list:47675] Bignum#* を Toom3 乗法に対応させる patch — Kenta Murata <muraken@...>

[#42679] ruby -x で実行すると行がずれる？ — "KISHIMOTO, Makoto" <ksmakoto@...4u.or.jp>

[#42680] [Ruby 1.9-Bug#4118][Open] ruby -x で実行すると行がずれる — Makoto Kishimoto <redmine@...>

[#42681] Re: Enumerable#categorize — Yukihiro Matsumoto <matz@...>

[#42684] [Ruby 1.9-Bug#4120][Assigned] 2 failures on test/mkmf/test_convertible.rb — Usaku NAKAMURA <redmine@...>

[#42686] [Ruby 1.9-Bug#4121][Open] test_getpty_nonexistentで止まることがある — Kouhei Yanagita <redmine@...>

[#42687] [Ruby 1.9-Bug#4122][Open] test_x509store.rbのtest_set_errorsが失敗する — Kouhei Yanagita <redmine@...>

[#42690] [Ruby 1.9-Bug#4124][Open] optparse: needless argument: --help=zshcomplete=COMMAND — Kazuhiro NISHIYAMA <redmine@...>

[#42692] [Feature: trunk] String#encode(:fallback) should accept default handler — SASADA Koichi <ko1@...>

[#42693] [Ruby 1.9-Bug#4126][Assigned] Pathname#+ サブクラスの場合 — Shyouhei Urabe <redmine@...>

[#42696] [Ruby 1.9-Bug#4128][Open] String#kconvでfrom_encを指定していないときにString#encodingを使うようになっていない — Kouhei Yanagita <redmine@...>

[#42701] 1.9.x release and trunk branch policy — Yusuke ENDOH <mame@...>

[#42716] [Ruby 1.9-Bug#4129][Open] multi-tk を require すると、おかしい — Makoto Kishimoto <redmine@...>

[#42718] [Ruby 1.9-Bug#4130][Assigned] wrong line number with shadowing and unused variable — Nobuyoshi Nakada <redmine@...>

[#42719] [Ruby 1.9-Bug#4131][Assigned] can't set length of shared string error in IO#read — Masaya Tarui <redmine@...>

[#42722] [Ruby 1.9-Bug#4134][Open] assigned but unused variable — Kouhei Yanagita <redmine@...>

[#42724] [Ruby 1.9-Bug#4137][Assigned] Test Failure because of assigned but unused variable: ruby/test_rubyoptions.rb — Yui NARUSE <redmine@...>

[#42725] [Ruby 1.9-Bug#4138][Assigned] Test Failure because of method redefined: test/irb/test_option.rb — Yui NARUSE <redmine@...>

[#42729] [Ruby 1.9-Feature#4142][Open] multipart/form-data for net/http — Yui NARUSE <redmine@...>

[#42730] [Ruby 1.9-Bug#4143][Open] warning: "SUPPORT_JOKE" is not defined — Kazuhiro NISHIYAMA <redmine@...>

[#42731] [Ruby 1.9-Bug#4144][Open] check_signedness("size_t") — Kazuhiro NISHIYAMA <redmine@...>

[#42733] [Ruby 1.9-Feature#4146][Open] Improvement of Symbol and Proc — Nobuyoshi Nakada <redmine@...>

[#42735] [Ruby 1.9-Feature#4147][Open] Array#sample で重みを指定したい — Yoji Ojima <redmine@...>

[#42754] [Ruby 1.9-Bug#4152][Open] optparseのzsh compsysでrspecの補完が出来ない — Kazuhiro NISHIYAMA <redmine@...>

[#42758] [Ruby 1.9-Bug#4157][Open] test_pty で、たまに出る Failure — Makoto Kishimoto <redmine@...>

[#42761] [Ruby 1.9-Bug#4158][Open] X509V3_set_nconf が使用できないと openssl がコンパイルエラー — Tomoyuki Chikanaga <redmine@...>

[#42763] [Ruby 1.9-Bug#4159][Open] test_block_variables(TestRipper::ParserEvents) が失敗する — Kouhei Yanagita <redmine@...>

[#42771] [Ruby 1.9-Bug#4160][Open] test_core_03_notify(Rinda::TupleSpaceProxyTest) が失敗する — Kouhei Yanagita <redmine@...>

[#42775] --program-prefix option of configure.bat(mswin32) — "羽田 憲克 (HANEDA Norikatsu)" <haneda@...>

[#42777] [Ruby 1.9-Bug#4164][Assigned] tool/rbinstall.rb doesn't transform script names — Usaku NAKAMURA <redmine@...>

[#42778] BasicObject#object_id — keiju@... (Keiju ISHITSUKA)

[#42782] [Ruby 1.9-Feature#4165][Open] win32ビルドでbaserubyを設定しなかったときのエラーが非常に不親切 — Motohiro KOSAKI <redmine@...>

[#42788] Re: [ruby-changes:18220] Ruby:r30241 (trunk): * compile.c (setup_args, iseq_compile_each): optimize AMPER LAMBDA — SASADA Koichi <ko1@...>

[#42790] Re: [ruby-changes:18222] Ruby:r30243 (trunk): * compile.c (setup_args), vm.c (invoke_block_from_c), — SASADA Koichi <ko1@...>

[#42804] [Backport87-Backport#4171][Open] Warn Array#choice — Yui NARUSE <redmine@...>

[#42818] [Ruby 1.9-Bug#4173][Open] TestProcess#test_wait_and_sigchild が、たまに失敗する — Makoto Kishimoto <redmine@...>

[#42827] [Ruby 1.9-Bug#4176][Assigned] wrong fixed value at test_contrib.rb(test_pos) — Masaya Tarui <redmine@...>

[#42828] [Ruby 1.9-Bug#4177][Assigned] wrong fixed value at test/rexml/test_sax.rb(test_socket) — Masaya Tarui <redmine@...>

[#42832] [Ruby 1.9-Bug#4178][Open] test/rubygems/gemutilities.rb で、よくわからない ArgumentError — Makoto Kishimoto <redmine@...>

[#42833] [Ruby 1.9-Feature#4180][Open] Add Zlib.deflate / Zlib.inflate — Yui NARUSE <redmine@...>

[#42859] [Ruby 1.9-Bug#4186][Open] Failure: test_imaps_with_ca_file(IMAPTest) — Kazuhiro NISHIYAMA <redmine@...>

[#42860] [Ruby 1.9-Bug#4187][Open] Error: test_starttls(IMAPTest) — Kazuhiro NISHIYAMA <redmine@...>

[#42869] [feature:trunk] option for Socket#sendmsg — Nobuyoshi Nakada <nobu@...>

[#42872] Ruby 1.9.2 is going to be released — "Yuki Sonoda (Yugui)" <yugui@...>

[#42884] [Ruby 1.9-Bug#4201][Open] open fails with Encoding object — Nobuyoshi Nakada <redmine@...>

[#42887] [Ruby 1.9-Feature#4204][Open] IO#advise should raise error for unknown symbol — Tomoyuki Chikanaga <redmine@...>

[#42893] [Ruby 1.8-Bug#4206][Open] failed to set ext option for win32/configure.bat — Akio Tajima <redmine@...>

[#42894] [Ruby 1.8-Feature#4207][Open] これから「1.8.8」の話をしよう -- 1.8がこの先生きのこるには — Shyouhei Urabe <redmine@...>

[#42896] [Ruby 1.9-Bug#4209][Assigned] nmake reports warning in ext/ripper — Usaku NAKAMURA <redmine@...>

[#42907] [Ruby 1.9-Bug#4223][Open] GC.stress = true で謎の ArgumentError — Makoto Kishimoto <redmine@...>

[#42912] cut off an array at C level — Tanaka Akira <akr@...>

[ruby-dev:42691] Re: Enumerable#categorize

Thread

In This Thread

[#42775] --program-prefix option of configure.bat(mswin32) — "羽田　憲克 (HANEDA Norikatsu)" <haneda@...>