[#32172] Re: eRuby のインストールに関して — "Tatsuaki Nagai" <Tatsuaki_Nagai@...>
永井@KCです。
[#32182] 汚染された文字列の eval — 堀川 久 <vzw00011@...>
こんにちは。
まつもと ゆきひろです
新井です。
こんにちは。
[#32185] (´ヘ`;)ハァ — "akira@..." <aan82580@...>
御晩で御座いますドモドモ\(^_^ ) ( ^_^)/ドモドモ
[#32205] assert and assert_equal — Masaki Suketa <masaki.suketa@...>
助田です。
あべです。
[#32216] ある文字列以外にマッチさせる正規表現 — "Tatsuaki Nagai" <Tatsuaki_Nagai@...>
こんにちは。永井@KCです。
[#32221] Re: ある文字列以外にマッチさせる正規表現 — "Tatsuaki Nagai" <Tatsuaki_Nagai@...>
永井@KCです。
[#32249] ActiveScriptRuby + rbnamazu (on windows) — keiichi matsunaga <ma2@...>
松永です。
松永です。
あおき@一週間メール見てなかったらカレー食べそこなったよ〜 です。
松永です。
大島です。
松永です。
松永です。
[#32254] Install ruby-1.6.5 on MacOSX10.1 — Ryotaro Arai <misty@...>
はじめまして、R.Araiといいます。
[#32263] fastcgi.rb and cgi.rb — 岡田 潤 <yun@...>
ゆんです。
前田です。
青山です。
高橋征義です。
青山です。
まつもと ゆきひろです
高橋征義です。
> うーん、あんまり文字列一般が備えるべき機能ではないと
高橋征義です。
> でも、128から255までの場合、ISO-8859-1を使っている人で、
まつもと ゆきひろです
In article <1005968249.366927.16199.nullmailer@ev.netlab.jp>,
[#32284] cgi/session.rb について — IKEBE Tomohiro <ikebe@...>
まつもと ゆきひろです
[#32291] how to use gdk_{pointer|keyboard}_{grab|ungrab}? — HOSONO Hidetomo <h@...>
細野と申します。
[#32310] Ruby SAX Library — TAKAHASHI Masayoshi <maki@...>
高橋征義です。
なひです。
[#32319] ruby のソースを流用することについて — Kengonakajima <ringo@...>
こんにちは
[#32329] PalmOS for Ruby — Toru MITANI <toru_m@...2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
白川です。
From: "T.Shirakawa" <niegh@dk.catv.ne.jp>
まつもと ゆきひろです
まつもと ゆきひろです
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
こんばんわ、MoonWolfです。
In message <20011119230955.E9F7.TORU_M@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
At Thu, 22 Nov 2001 21:26:45 +0900,
From: shukaku@j-mac.co.jp
ほり@筑波大学といいます
From: "Masatake E. Hori" <eddie@luft.geo.tsukuba.ac.jp>
ほり@筑波大学です
白川です。 #話題に乗り遅れた?
From: "T.Shirakawa" <niegh@dk.catv.ne.jp>
白川です。
From: "T.Shirakawa" <niegh@dk.catv.ne.jp>
[#32405] [irb]%-statement bug? — rubikitch <rubikitch@...>
るびきちです。
[#32440] shibu-rug — KANDA Daisuke <MAP2303@...>
From: KANDA Daisuke <MAP2303@mapletown.net>
高橋征義です。
高橋征義です。
rubiben です。
前田です。
まつもと ゆきひろです
[#32465] Ruby for PalmOS に対する熱い想い — Toru MITANI <toru_m@...2.dion.ne.jp>
newです.
From: "Nibu, Mitsunori." <nyu@nk.rim.or.jp>
newです.
From: "丹生 光則 Nibu,Mitsunori." <nyu@nk.rim.or.jp>
newです.
From: "丹生 光則 Nibu,Mitsunori." <nibu@tec.osaka.jip.co.jp>
newです.
初めまして。オーストラリア在住のビクターと申します。ハンドルではなく本名です。(^^;)
わたなべです。
まつもと ゆきひろです
横から失礼します。
From: Hiroyuki KUROSAKI <noir@st.rim.or.jp>
From: Toru MITANI <toru_m@h2.dion.ne.jp>
At Wed, 28 Nov 2001 20:52:49 +0900,
rubiben 尾崎です。
昨年11月29日の[ruby-list:32609]で、下記のような投稿を書きました。
From: Nakamura Akifumi <BXQ04723@nifty.ne.jp>
From: Nakamura Akifumi <BXQ04723@nifty.ne.jp>
From: Nakamura Akifumi <BXQ04723@nifty.ne.jp>
newです.
[#32473] File.expand_path(" 一覧表 .xsl") — Take_tk <ggb03124@...>
File.expand_path で「表」の文字が化けたのですが、最新版ではOKでしょう
まつもと ゆきひろです
たけ(tk)です。
[#32486] FormDesigner について — Nagai T <idonagai@...>
はじめまして、Tnagaiと申します。
[#32515] 拡張された日本語処理 — rubikitch <rubikitch@...>
るびきちです。
高橋征義です。
[#32551] ソースの readme をもう少し詳しく — "Mitsuo Igarashi" <mitsu5@...>
ソース中のREADMEをもう少し説明を詳しくしていただければ、
五十嵐です。
[#32552] RubyCocoa 0.1.0 — FUJIMOTO Hisakuni <hisa@...>
藤本です、こんにちは。
[#32578] cygwin database Ruby Install MySQL PostgreSQL other... MS-Access(blase) — "Inoue" <inoue@...>
井上です。
井上です。
井上です。
なかだです。
とみたです。
[#32612] Ruby/MySQL Cygwin 環境での構築 (Re: cygwin database Ruby Install MySQL ...) — tamra@...
[#32632] Re: Ruby for PalmOS に対する熱い想い — Nagai T <idonagai@...>
原です。
こんにちは、なかむら(う)です。
すぎむし%Rubyちゃんポータルも見直ししないと…
From: maili31s@clio.ne.jp (SugHimsi == SUGIHARA Hiroshi)
原です。
なかだです。
あおきです。
渡辺哲也です。
なかだです。
[#32673] RubyCocoa 0.1.1 — FUJIMOTO Hisakuni <hisa@...>
藤本です、こんにちは。
[#32674] しぶらぐ議事録 — rubiben <ozaki@...>
[ruby-list:32625] XMLParser(expat) bug with UTF-16LE & CR+LF
高橋征義です。
先に要旨を書いておきます。
・XMLParserでUTF-16LE&CR+LFの文書をファイルオブジェクトの形で
parseすると落ちる(原因はexpat?)。
・その前に、XMLParserの「getsメソッドがあるオブジェクトの場合、
行ごとに読み込んでparseする」という仕様は、素朴に行なうと
UTF-16 Little-Endian の場合に(16bitの)コードユニットを分断して
しまうことになるが、それは構わないのか構うのか? 構うなら
どうするべきか?
とりわけ後者の方の意見を聞いてみたいです。
□
では、本文です。
xmlparserを使ってUTF-16の文書をparseしようとすると、
Segmentation faultになってRubyごと落ちることがある
ようです(Ruby 1.6.5 + XMLParser 0.6.1 + expat 1.95.2)。
これは、
require 'xmlparser'
class FXMLParser < XMLParser; end
## UTF-16なXML文書をtmp.xmlにいったん書き込む
File.open("tmp.xml","w"){|f|
f.write("\377\376<\000a\000>\000\r\000\n\000"+
"<\000/\000a\000>\000\r\000\n\000")
}
## ファイルオブジェクトにしてparseする
File.open("tmp.xml"){|f|
x = FXMLParser.new()
x.parse(f)
}
というように、Fileオブジェクトを渡してparseさせようとした際に、
ファイルの中身がUTF-16(LE)で改行がCR+LFだった場合に発生するよう
です。
UTF-16(LE)の文書の場合、改行は「\r \000 \n \000」といったように
なるわけですが、この最後の1回前、「(..略..) > \000 \r \000 \n」
という部分まで読みこみ(まだ最後の「\000」は読み込んでいない)、
ここまでをparseするべくXML_Parseを呼ぶと、そこで失敗するようです。
# というわけで、どうやらexpatのせいのような気が (--;
□
とはいえ、現在のXMLParserの「getsを使って改行(\n)まで読み込む」
という仕様がちょっと美しくないかも、という気もします。なぜなら、
UTF-16(LE)の場合、1コードユニットの半分だけを読み込む、という
ことになってしまうためです。
ちなみにPerlのExpat.xsとPythonのpyexpat.cでは、ファイルから
読み込む場合は XML_ParseBufferを使い、固定バイト数だけreadで
読み込んでます。当然ながらバッファのバイト数は2の倍数なわけで、
UTF-16が途中でぶち切れるようなことはなさそうです。
もっとも、Rubyの場合、直接ファイルを読み込むのではなく、
あくまで「getsメソッドを持っているオブジェクトは、ファイルで
あるかどうかかかわらず、getsメソッドを使って読み込みながら
parseする」ということをやっているわけで、PerlやPythonと
同じようにはできないですし、するべきでもないように思います。
それでも、getsではなくreadを使うことにして、行ごとではなく
固定バイト数ごとにparseする、というのはアリかもしれません。
……とはいえ、これもいまいちの解決法ではありますが。たまたま
expatが対応している文字コードではうまくいく、というだけの
話ですし。
というわけで、どうしたもんでしょうね?
# やっぱそもそもexpatをなんとかするべきなんだから、Rubyは
# 今のままでよい? それとも?
高橋征義 (TAKAHASHI Masayoshi) Email:maki@inac.co.jp