ruby-list

青木です。

  In mail "[ruby-list:42975] 長い書名を短くするメソッド"
  keiichi matsunaga <ma2@lifemedia.co.jp> wrote:

> 　松永です。

> 問題は4)の段階で，何も考えずに str[0,10] などとやると，漢字の真ん中で
> 切れる，いわゆる泣き別れが起きる可能性があるということです。バイト数と
> 文字数の両方を意識しながら文字を取り出すにはどういう方法があるのでしょ
> うか？

レシピブックを書いたときに調べたことがあります。そのとき思い
ついた方法で一番速かったのは、バイト長で切ってから正規表現で
slice するやりかたです。

[最大 n バイト取り出す例]

  def take_nbytes(str, n)
    str[0, n].slice(/\A.*/)
  end

  $KCODE = 'SJIS'
  take_nbytes("あいうえお", 4)   # => "あい"
  take_nbytes("あいうえお", 5)   # => "あい"

なんでこれで取り出せるかというと、正規表現の「.」は中途半端な
マルチバイト文字にマッチしないからです。だから最後の泣き別れ
部分だけはマッチせず、切り捨てられます。

また、後ろから n バイト取る場合は、かずひこさんも書いていた文字
分割と組み合わせて、次のようにすればいいんじゃないかと思います。

  def take_last_nbytes(str, n)
    mbreverse(take_nbytes(mbreverse(str), n))
  end

  def mbreverse(str)
    str.split(//).reverse.join('')
  end

  $KCODE = 'SJIS'
  take_last_nbytes("あいうえお", 4)   # => "えお"
  take_last_nbytes("あいうえお", 5)   # => "えお"


# 参考： レシピブック [065]「文字列を最大 n バイトに切り詰める」
# 自分でも見るまで忘れてた (笑)

--
青木峰郎

Thread

Prev Next

In This Thread

Prev Next

[#42940] — "ARAI Shunichi" <arai@...>

[#42941] /.../の中の#{...}に対するruby-mode.elの処理について — KURODA Hiraku <hiraku@...>

[#42942] [ANN] Rubyの本読書会第一回開催のお知らせ — "MOROHASHI Kyosuke" <moronatural@...>

[#42947] CSV — "S_Konno(今野 滋)" <sk@...>

[#42968] IRB on a text widget of Ruby/Tk — Hidetoshi NAGAI <nagai@...>

[#42969] iTerm上でのirbの日本語表示に関して — "Kouta Osabe" <kota0919wasabi@...>

[#42975] 長い書名を短くするメソッド — keiichi matsunaga <ma2@...>

[#42984] 6.12 includeとextendはどう違いますか — take_tk <ggb03124@...>

[#42987] Ruby/Tk+callcc — Hattori Kenta <hattori@...>

[#42991] BASE64について — "Nobuyuki Inaba" <nobuyuki.inaba@...>

[#42996] [ANN] Rails Date Pickerの日本語化を行いました — Masatoshi Itagaki <masatoshi@...>

[#42997] オープンソースコミュニティのMLに関するアンケートのお願い — "Junai Go" <junai@...>

[#42999] 尋ね人://Mac/Applications/Editor/mi/Rubyモード — "S_Konno(今野 滋)" <sk@...>

[#43003] Q：SQLite使用時に例外が補足できない？ — swec@...

[#43005] [ANN] ABD飲み会を開催します — "MOROHASHI Kyosuke" <moronatural@...>

[#43010] Enumerable#empty? が欲しい — aka <admin@...>

[#43012] Bignum * Float — Hiroyuki Ito <ZXB01226@...>

[#43013] [ANN] Rubyist Magazine 0017 — SASADA Koichi <ko1@...>

[#43014] [ANN] Rubyの本読書会 第二回 開催のお知らせ — "MOROHASHI Kyosuke" <moronatural@...>

[ruby-list:42978] Re: 長い書名を短くするメソッド

Thread

In This Thread

[#42947] CSV — "S_Konno(今野滋)" <sk@...>

[#42999] 尋ね人://Mac/Applications/Editor/mi/Rubyモード — "S_Konno(今野滋)" <sk@...>

[#43014] [ANN] Rubyの本読書会第二回開催のお知らせ — "MOROHASHI Kyosuke" <moronatural@...>