[#16732] sharing sub-regexp — Tanaka Akira <akr@...17n.org>

Oniguruma についてひとつ要望があります。

51 messages 2002/04/03
[#16744] Re: sharing sub-regexp — "K.Kosako" <kosako@...> 2002/04/04

Tanaka Akiraさんの<hvopu1hxfyd.fsf@coulee.a02.aist.go.jp>から

[#16746] Re: sharing sub-regexp — matz@... (Yukihiro Matsumoto) 2002/04/04

まつもと ゆきひろです

[#16753] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/04

In article <1017890618.302241.17865.nullmailer@ev.netlab.jp>,

[#16755] Re: sharing sub-regexp — "K.Kosako" <kosako@...> 2002/04/05

Tanaka Akiraさんの<hvo7knn93ug.fsf@coulee.a02.aist.go.jp>から

[#16756] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/05

In article <20020405044506.D4784349@helium.ruby-lang.org>,

[#16822] Re: sharing sub-regexp — "K.Kosako" <kosako@...> 2002/04/10

Tanaka Akiraさんの<hvopu1e4omy.fsf@coulee.a02.aist.go.jp>から

[#16831] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/10

In article <20020410025054.C8DF0915@helium.ruby-lang.org>,

[#16863] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/11

In article <hvor8lnchak.fsf@coulee.a02.aist.go.jp>,

[#16877] Re: sharing sub-regexp — Shugo Maeda <shugo@...> 2002/04/12

前田です。

[#16887] Re: sharing sub-regexp — Tanaka Akira <akr@...17n.org> 2002/04/12

In article <87pu15z80q.wl@studly.priv.netlab.jp>,

[#16909] Regexp#to_s — Shugo Maeda <shugo@...> 2002/04/15

前田です。

[#16912] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/15

In article <87g01x1e6m.wl@studly.priv.netlab.jp>,

[#16931] Re: Regexp#to_s — Kazuhiro NISHIYAMA <zn@...> 2002/04/16

西山和広です。

[#16934] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/16

In article <20020416180631.988E.ZN@mbf.nifty.com>,

[#16938] Re: Regexp#to_s — Shugo Maeda <shugo@...> 2002/04/17

前田です。

[#16939] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/17

In article <87u1qaj0xe.wl@studly.priv.netlab.jp>,

[#16947] Re: Regexp#to_s — Shugo Maeda <shugo@...> 2002/04/18

前田です。

[#16950] Re: Regexp#to_s — matz@... (Yukihiro Matsumoto) 2002/04/18

まつもと ゆきひろです

[#16951] Re: Regexp#to_s — Tanaka Akira <akr@...17n.org> 2002/04/18

In article <1019116103.420173.12691.nullmailer@picachu.netlab.jp>,

[#16960] Re: Regexp#to_s — nobu.nakada@... 2002/04/18

なかだです。

[#16761] StringIO — tadf@...

ふなばです。

43 messages 2002/04/05
[#16786] Re: StringIO — nobu.nakada@... 2002/04/08

なかだです。

[#16802] Re: StringIO — tadf@... 2002/04/09

ふなばです。

[#16803] Re: StringIO — nobu.nakada@... 2002/04/09

なかだです。

[#16804] Re: StringIO — tadf@... 2002/04/09

ふなばです。

[#17221] Re: StringIO — Wakou Aoyama <wakou@...> 2002/05/30

青山です。

[#17230] Re: StringIO — matz@... (Yukihiro Matsumoto) 2002/05/30

まつもと ゆきひろです

[#17231] Re: StringIO — Tanaka Akira <akr@...17n.org> 2002/05/30

In article <1022740594.117106.6073.nullmailer@picachu.netlab.jp>,

[#17233] IO#size — Shugo Maeda <shugo@...> 2002/05/30

前田です。

[#17239] Re: IO#size — Tanaka Akira <akr@...17n.org> 2002/05/31

In article <874rgqdt3x.wl@studly.priv.netlab.jp>,

[#17253] Re: IO#size — Wakou Aoyama <wakou@...> 2002/05/31

青山です。

[#16790] Ruby Shim — "Akinori MUSHA" <knu@...>

 1.7 early access kit という仮称で提案した構想ですが、先ほど

27 messages 2002/04/08
[#16796] Re: Ruby Shim — Koji Arai <JCA02266@...> 2002/04/08

新井です。

[#16833] math.c 1.10 — "U.Nakamura" <usa@...>

こんにちは、なかむら(う)です。

23 messages 2002/04/11
[#16834] Re: math.c 1.10 — matz@... (Yukihiro Matsumoto) 2002/04/11

まつもと ゆきひろです

[#16869] Makefiles dependency — nobu.nakada@...

なかだです。

17 messages 2002/04/12

[ruby-dev:16940] Re: ライブラリ拡大計画

From: nobu.nakada@...
Date: 2002-04-17 07:29:41 UTC
List: ruby-dev #16940
なかだです。

At Wed, 17 Apr 2002 15:21:07 +0900,
Tanaka Akira wrote:
> > successは残します。succeededじゃないかという気もそこはかとなく
> > するのですが。
> 
> ふと、converted というのが頭に浮かびました。

うーん、どうしたものか。そしたらfailedじゃなくてrestとかになる
ような。全部aliasしとこうかなぁ。

> > ただし、Iconv#closeやIconv#iconvで発生するときもIconv.iconvに合
> > わせてArrayにしようかと思ってます。まだ決めかねてますが。その他
> > では、Iconv::Failure#sourceとIconv::Failure#posを追加するつもり
> > です。#sourceは入力のArray、#posはsource[0]で変換が停止した位置、
> > つまりfailed == source(0)[pos..-1] if source(0)になります。
> 
> ふたつめ以降の文字列で問題が起きた場合にはどうなりますか?
> 現在だと、
> 
> % ruby -riconv -e 'Iconv.iconv("US-ASCII", "EUC-JP", "a", "b\xa1\xa1") rescue p $!' 
> #<Iconv::IllegalSequence: ["a", "b"], ["\241\241"]>
> 
> というようになる場合です。

success, failedは同じ、source = ["b\xa1\xa1"], pos = 1になりま
す。

> # うぅむ。ここで MIME charset が使えるのは現実的にはとても便利だ...

それはたぶんiconvの実装に依存します。

> > > ちなみに、変換できない文字を(XML の)文字参照にするというのに使ったので
> > > すが、コード自体は短いくせにかなり厄介でしたね。
> > 
> > どういう風に厄介でしたか。
> 
>     begin
>       @out << @iconv.iconv(str)
>     rescue Iconv::IllegalSequence => err
>       @out << err.success
>       ch, str = err.failed.split(//, 2)
>       ch = @iconv_to_utf8.iconv(ch) if @iconv_to_utf8
>       @out << @iconv.iconv("&##{ch.unpack('U')};")
>       retry
>     end
> 
> というコードを書いたんですが、
> 
> * ふたつの Iconv オブジェクトの状態変化を正しく扱っているかどうかを確
>   信するのが難しい。

ステートフルな入力だと芳しくないような気がします。たぶん一つの
入出力に対して複数のiconvを使うのは、iconvの仕様上無理があると
思います。シフトステートに対する操作はリセットだけで、退避して
おいたりすることはできませんから。文字参照を使うことを前提にす
るなら、むしろ一度UCS-4にしてしまったほうがいいかも。

> * retry でループを構成する必要がある。

一応異常系なのでしょうがないという気もするのですが。まぁ他に手
を思い付かなかったというだけなので、もっといい方法があればそう
します。

> * unpack が期待通りに動かなかった。

これはよく分からないんですが。というか、iconvの問題ですか。

-- 
--- 僕の前にBugはない。
--- 僕の後ろにBugはできる。
    中田 伸悦

In This Thread