ruby-list

(2011/04/28 22:58), 5.5 wrote:
> 文字列 S の中で，正規表現 R にマッチする部分とそれ以外の
> 部分をそれぞれ取得したいときに，どうもうまい方法が見つか
> りません。
> 
> 以下のような String#each_segment メソッドがあると嬉しい
> です。（この例は非実用的です）

一般論として、実際のユースケースを示した方が良いです。
特に新しいメソッドを提案するときには。

> そこで，strscan を使う方法を考えました。
> 
> s=StringScanner.new("ab12cd")
> 
> result=""
> while offset=s.exist?(/\d+/)
>   len=offset-s.matched.size
>   result << s.peek(len).upcase unless len.zero?
>   result << "<#{s.matched}>"
>   s.pos=s.pos+offset
> end
> result << s.rest.upcase unless s.rest.empty?
> 
> これ以上簡潔な書き方が思いつきませんでした。
> マッチ文字列の間を取り出す手段が無いからです。
> 
> いかにも回りくどいですし，非マッチ文字列に対する処理が
> 二箇所に書かれていて DRY ではありません。

以下のような感じでいいんじゃないですかね

require'strscan'
ss = StringScanner.new("abc;def!ghi.jkl:")
while r = ss.scan_until(/[;!.:]/)
  p ss.matched
  p r[0...-ss.matched_size]
end

-- 
NARUSE, Yui  <naruse@airemix.jp>

Thread

Prev Next

In This Thread

Prev Next

[#47953] [ANN]るびま33号リリース — sunao tanabe <sunao.tanabe@...>

[#47954] postgresql接続モジュール — 中川貴 <nora1962@...>

[#47955] るびま記事募集：FiberとかSinatra/PadrinoとかBundlerとか — Makoto Kuwata <kwa@...>

[#47959] Ruby用のリアルタイムプロファイラ — Takahiro Sunaga <sunagae@...>

[#47966] CSV.read で読むとUTF-8の扱いがおかしい？ — Dezawa <dezawa@...>

[#47967] Re: CSV.read で読むとUTF-8の扱いがおかしい？ — "Endo Akira" <endo4917@...>

[#47974] [ANN] Feature matrix of Ruby HTTP clients — Hiroshi Nakamura <nahi@...>

[#47976] Fiber#resumeの引数について — Satoshi GUNJI <gunjisatoshi@...>

[#47978] PostgrSQL7.3との接続方法 — 大井 俊介 <tbe02663@...>

[#47979] Ruby/Pcapのコンパイルについて — 重松邦彦 <sigematu@...>

[#47980] unsubscribe — hrkt0115311 <hrkt0115311@...>

[#47982] TokyuRuby会議03: LT発表者募集のお知らせ — SAWADA Tadashi <moc.liamg.cesare@...>

[#47990] String#gsub への委譲 — "5.5" <5.5@...>

[#47997] lambda中のProc中のreturnの挙動について — m_takao <threewayhandshake@...>

[#48009] randの挙動 — YAGUCHI Yuya <yayugu@...>

[#48014] [ANN] RubyKaigi2011の当日ボランティアスタッフの募集を開始します — Kei Shiratsuchi <kei.shiratsuchi@...>

[#48016] 文字列を正規表現にマッチする部分と他の部分に分割 — "5.5" <5.5@...>

[#48018] 「Rubyリファレンスマニュアル刷新計画」2011-04分のスナップショットリリース — okkez <okkez000@...>

[ruby-list:48019] Re: 文字列を正規表現にマッチする部分と他の部分に分割

Thread

In This Thread

[#47978] PostgrSQL7.3との接続方法 — 大井俊介 <tbe02663@...>