[#33948] Schedule for the 1.8.7 release — "Akinori MUSHA" <knu@...>
Hi, developers,
[#33955] --encoding affects script encoding — sheepman <sheepman@...>
こんばんは sheepman です。
なかだです。
[#33962] Ruby1.9.0でのインタプリタ組み込みについての質問 — Masayuki Yamaguchi <Yamaguchi.Masayuki@...>
山口と申します。
[#33966] Re: [ruby-cvs:22881] Ruby:r15644 (trunk): * test/ruby/test_m17n_comb.rb (TestM17NComb::test_str_chomp): test — Tanaka Akira <akr@...>
In article <200802291457.m1TEv6nh008515@ci.ruby-lang.org>,
まつもと ゆきひろです
[#33974] Test::Unit::Collector::Dirがtest_*.rb以外集めてくれない — "Ken Date" <itacchi@...>
こんにちは、伊達です。
[#33983] Re: [ruby-cvs:22913] Re: Ruby:r15674 (trunk): * gc.c (add_heap): sort heaps array in ascending order to use — Yukihiro Matsumoto <matz@...>
まつもと ゆきひろです
In article <E1JWAV5-0001MG-9W@x61.netlab.jp>,
[#34011] Should --verbose be equal to -v ? — Yugui <yugui@...>
Yuguiです。
まつもと ゆきひろです
西山和広です。
Yuguiです。
[#34020] MurmurHash problem — Nobuyoshi Nakada <nobu@...>
なかだです。
[#34030] uint32_t — KIMURA Koichi <kimura.koichi@...>
木村です。
[#34037] Ruby performance gains on SPARC — Yukihiro Matsumoto <matz@...>
まつもと ゆきひろです
[#34067] Array#take,take_while,drop,drop_whlie — "Yusuke ENDOH" <mame@...>
遠藤と申します。
[#34068] lgamma_r requires _REENTRANT on Solaris — "Yusuke ENDOH" <mame@...>
遠藤と申します。
[#34077] 異なるエンコーディングだと同じバイト列でも==にならない件 — rubikitch@...
るびきちです。
[#34086] extend spawn to change attributes of child process. — Tanaka Akira <akr@...>
spaen, system, exec, IO.popen で、起動する子プロセスの属性を
[#34093] 拡張ライブラリ初期化中でのmodule_eval — Kouhei Sutou <kou@...>
須藤です。
[#34095] (再送) Cygwin で Resolv.getaddress が失敗する — Kouhei Yanagita <yanagi@...>
こんにちは。柳田です。
こんばんは、植田と申します。
柳田です。
[#34105] rational.rb, complex.rb and mathn.rb — Tadayoshi Funaba <tadf@...>
rational と complex が組み込みになったことで、lib/mathn.rb の意義は薄
現時点で rational.rb と complex.rb を残しているのは、それが無難だから
で、かなり選択肢を絞った叩き台です。
けいじゅ@いしつかです.
原です。
> 私も Complex の組み込みは Rational とは比較にならないくらい、仕様が決め
まつもと ゆきひろです
> Mathモジュールは伝統的にlibmのラッパーであったので、それを逸
原です。
> (1) (-8)**Rational(1,2) は複素数1.0+1.7320508*i
[#34109] LP64: date.rb:321:in `convert': integer 86400000000000 too big to convert to `int' (RangeError) — Tanaka Akira <akr@...>
LP64 なマシンで test-all が動かなくなっています。
[#34144] [質問2点] C からの定数参照 & thread switching コストの低減 — Hidetoshi NAGAI <nagai@...>
永井@知能.九工大です.
[#34158] Complex組み込み — Masahiro TANAKA <masa16.tanaka@...>
Complexが組み込みになるそうですが、これはcomplex.rbを踏襲して、
原です。
> 今までの Complex は、complex.rb にほぼ残して、たとえば Rational 成分
原です。
> そうです。Complex が難しい、という話を書いておくと、
まつもと ゆきひろです
> |僕としては、/ 演算子の振舞いについて前向きに検討してほしいです。
まつもと ゆきひろです
> ふむ。では、/ のふるまいを
まつもと ゆきひろです
> |僕は、quo がいいと思います。
まつもと ゆきひろです
> となるようですが、別の実装として、
田中です。
> 最初に言っておきますが、気を悪くされたのならすみません。
村田です.
[#34159] ruby-trunk Marshal.dump bug — nagachika <rucila@...>
nagachika と申します。
[#34163] Array#shift/unshift の高速化 — wanabe <s.wanabe@...>
ワナベと申します。
[#34189] Re: [ruby-cvs:23106] Re: Ruby:r15866 (trunk): * numeric.c (num_quo): should convert its operand to Rational. — Tadayoshi Funaba <tadf@...>
間違って送ったので、再送。
> > > Log:
[ruby-dev:33975] Re: encdet.rb
In article <20080226.204332.1007194564549993975.kou@cozmixng.org>,
Kouhei Sutou <kou@cozmixng.org> writes:
> 収束しない気もするのでとりあえずまとめておきます。
> (誰か助けて)
介入する人はいないみたいですねぇ。
> 須藤: openするところまで含むとファイル以外に使えないからIOに
> エンコーディングを検出・設定する
> API(io.detect_encoding!)を追加して、openとは独立
> に使えるAPIがいい。でも、使うときはreadする前とか
> に呼んでね、という注意が必要。
そういう API が存在してはならないとは考えていません。
私が第一に欲しいものはそれではありませんが。
> 私は"/"が細分化とかグループ化とか具体化されている、というよ
> うなイメージがあるので、net/httpはネットワーク関係のHTTPとい
> う風に思い、憤りは感じませんでした。ディレクトリの区切りが
> "/"なのに影響を受けているのかもしれません。
net/http は net の下にいくつもあるので憤りは感じません。
憤りを感じるのは test/unit です。
> XxxYyyというモジュールはxxxyyy.rbというファイル名にするとい
> う習慣のことを言いたかったのでした。
ふむ。だからといって XxxYyy というモジュールを xxx/yyy.rb と
いうファイル名にするのはかなり慣習に反しますから、xxx-yyy.rb
にするか、XxxYyy というモジュール名はつけるべきではないとい
うように解釈できます。
そして、xxx-yyy.rb は現在のところモジュール名はあまり関係な
い形でしか使われていないので、これまた慣習に反します。
ということは、結局、XxxYyy というモジュール名をつけることに
反対していると解釈できるのですが、あってますか?
>> 問題はそもそも分類すべきかどうかというところだと思います。
>
> 私は「エンコーディング関連の機能」の「検出機能」という風に考
> えてしまうんでよね。たとえ、今は「エンコーディング関連の機能」
> が一つしかなくても。
私は、不要な分類は避けたいと思っています。
分類すると名前が長くなって使いにくくなりますし、私の思考は不
要な分類に憤りを感じるようにできているようです。
もちろん、必要な分類は必要であり、憤りも感じませんが、今回の
はいまのところ必要であるかどうかははっきりしません。
RAA や freshmeat や sourceforge や CPAN でしばらくエンコーディ
ングまわりのライブラリを検索してみた結果としては、エンコーディ
ングに直接関連するライブラリとしては変換・推測・修復あたりが
ありがちなようです。もうちょっと広げると言語推測、行末検出あ
たりが入ってくるかもしれません。(言語推測はエンコーディング
推測と密接に関連していますが。) さらに広げるとローマ字かな変
換とか大文字小文字変換とかが入ってきますが、このへんになると
エンコーディングは単なる道具で、エンコーディング関連の機能と
はいえないような気もします。
私の印象としてはそんなに広がらなそうで、分類の必要性はあまり
感ていません。ただ、Unicode なシステムではエンコーディングに
関する処理が外界とのやりとりのところに集中するのが当然で、変
換が基本になるのも容易に想像できるわけですが、Ruby では外界
とのやりとりのところに集中しない (ようにも書ける) ので、なに
か違う種類の機能が必要とされることもあり得るのかもしれません。
分類の必要性に関する決断を遅らせる方法としては
Encoding.detection_open とかにして encoding.rb にするという
方法がありますが、私の感覚からするとちょっと長いんですよねぇ。
> ひとつ具体例をあげると、SF.netにHTML(全部がXHTMLというわけで
> はないですが)をアップロードする時にSF.netのロゴを入れるとき
> に使うことがあります。(SF.netにアップロードするHTMLには
> SF.netのロゴを入れなきゃいけないので。)
わかったうえでやりたければやればいいんじゃないでしょうか。
> chdirする前にfile.detect_encoding!(仮)してね、というのでは
> 弱いでしょうか?
そういう注意が不要な API をデザイン可能なのに、なぜわざわざ
ユーザが問題に注意しなければならない API を好むのでしょう?
> StringIOやTempfileなどIOっぽいファイル以外のものにも使いたく
> ない?と言いたかっただけでした。
具体例はどんなのがあるんでしょう?
StringIO や Tempfile についてエンコーディングをどう扱うのが
正しいかということを考えると、それらの内容を生成したやりかた
を考えてエンコーディングを得るのが正しいように思えます。
それではうまくない、という例にはどんなのがありますか?
> やはり、EncDet.openがそれほどたくさん使われるものなのかがわか
> りません。
>
> 今のところ、具体例としてRDocでのRubyスクリプトの読み込み、と
> いうのがでていますが、それ以外の場合で使われることは多いので
> しょうか?というのも、スクリプトを読み込むことはそんなにない
> のではないかと思っているからです。PythonやEmacsで編集するファ
> イルでmagic commentを使っているのはわかるのですが、それらの
> ファイルを読み込むことが多いのかがわかりません。
テキストを処理する、というのは充分に多いように思います。
たとえば、RD のプリプロセッサを書いたとして、プリプロセッサ
が RD で記述されたテキストを読むときに、日本語を扱いたいとす
れば、エンコーディングをどうにかする必要があります。テキスト
を Emacs で編集するとすれば、今回のようなライブラリがあれば、
エディタとプリプロセッサでエンコーディング指定を共用できます。
RD にかぎらず、プレインテキストに近いフォーマットであればど
れも同じ事情が成り立つでしょう。
設定ファイルもそうです。最近は YAML が多いような気がしますが、
自前のパーザを持っているアプリケーションも少なくはないでしょ
う。設定ファイルの中に日本語を入れたいとすればエンコーディン
グをどうにかしなければならず、今回のようなライブラリが役に立
ちます。
> また、CERN httpd形式はよく使われているのか、そしてそれを利用
> したファイルを読み込むことは多いのかというのもわかりません。
こちらはいまのところあまり普及しているとは思いません。
しかし、どんなファイルにでもエンコーディングをつけられるとい
う良い性質を持っており、また、エンコーディング以外の情報も入
れられるため、いろいろと便利なんじゃないかと考えています。
> そういう場面が多いのであれば名前を短くしたいという欲求はわか
> らなくもないです。ただ、私の経験ではそんなにないんじゃないか
> なぁという感じです。
不思議なんですが、日本語を含んだテキストを扱うとき、どうやっ
てエンコーディングを処置しているんですか?
と、思って Rabbit の README.ja をみてみると、--encoding オプ
ションか自動検出のようですね。自動検出がうまくいくのであれば、
必要性を感じないのかなぁ。自動検出はうまくいかないけれど、毎
回 --encoding オプションを指定するのは面倒、というときに役に
立つんですが。
>> EncDet.make_magic_comment("euc-jp") が
>> "-*- coding: euc-jp -*-" を返すとか。
>
> うーん、使いやすいでしょうか。
> もし、今後XMLをサポートした場合は↑の形式は使えませんよね。
> 検出はmagic comment以外も頑張るけど、出力はmagic commentのみ
> サポートというのでもいいでしょうけど、出力もライブラリがうま
> い具合に頑張ってほしい気がします。(やるなら)
EncDet.make_xml_decl も作ることは出来ます。
ただ、なんにしろ入力は magic comment でも BOM でもどれかひと
つの形式で検出できればそれにするというものなのに対し、出力は
どの形式にするかユーザが指定する必要があります。どう頑張って
も、形式の情報を提供しなくてもいいようにはならないでしょうね。
--
[田中 哲][たなか あきら][Tanaka Akira]