ruby-list

MoonWolfです。

REXMLの内部ではすべてのテキストがUTF-8で扱われる以上、正規表現全てにuオプ
ションを付けないと駄目なんじゃないかなぁ。
uが付いてたり付いてなかったりしてます。

REXMLのunnormalizeまわりは書籍 Ruby de XML(初版)の126ページにあるように不
完全のようです。
rexml/text.rbにあるREXML::Text::unnormalizeもbaseparser.rbと同じような実装
です。

"rv.gsub( /&amp;/, '&')"という処理が最後にあるというのはおかしい。
数値文字参照を変換した後だから'&#38;'が'&'扱いされてしまうのでは?
実体参照のunnormalizeは複数回のgsubではなく1つのgsubで一括で処理するのが良
いと思います。

以下、出力がおかしい例です。
  parser.unnormalize('&lt;&#38;amp;')      # => "<&"
  parser.unnormalize("&lt;&#38;&#97;mp;")  # => "<&"

Thread

Prev Next

In This Thread

Prev Next

[#43585] LL魂のチケットは本日10時より発売開始です — Masayoshi Takahashi <maki@...>

[#43586] Rubyインタプリタ搭載の２画面ファイラ — 湊大典 <minato.daisuke@...>

[#43588] CGIが実行できない(open failed) — Maehara Masahide (前原正英) <maehrm@...>

[#43595] [Ruby会議2007] RejectKaigi 2007の告知 — "Mitsuteru Nakao" <n@...>

[#43596] シフトJISで全角カタカナを半角カタカナに — Shin-ichiro HARA <sinara@...>

[#43600] [ANN] Ruby勉強会＠東海 第1回開催のお知らせ — OHASHI Takeshi <ohashi@...>

[#43602] Performance 比較 Ruby 1.8.6 v.s. JRuby-1.0.0RC3 on Rails — "HISAMATSU, Hiroshi" <hiroshi.hisamatsu@...>

[#43608] Ruby 1.8.6-p36 released — Urabe Shyouhei <shyouhei@...>

[#43609] Ruby 1.8.5-p52 released — Urabe Shyouhei <shyouhei@...>

[#43610] [ANN] Rails勉強会@東京 第19回のお知らせ — "MOROHASHI Kyosuke" <moronatural@...>

[#43611] [ANN] RubyKaigi2007: お礼とアンケートのお知らせ — Masayoshi Takahashi <maki@...>

[#43612] [ANN] 第16回 Ruby勉強会＠関西（運営：Ruby 関西） — "shoko.m" <shoko-m@...>

[#43613] [ANN] 第16回 Ruby勉強会＠関西（運営：Ruby 関西） — "shoko.m" <shoko-m@...>

[#43614] [ANN] toRuby 4th — Masatoshi SEKI <m_seki@...>

[#43621] Rails勉強会@東北第1回のお知らせ — 片平 裕市 <yuichi_katahira@...>

[#43625] [ANN] Rubyについて開発者が語る＠北海道旭川のご案内 — Kazushi Sakamoto <kspro@...>

[#43627] SWIGとRuby/DLの使い方について — "takeru sasaki" <sasaki.takeru@...>

[#43631] クラス名の衝突 — Kentaro KAWAMOTO <kentaro.kawamoto@...>

[#43633] [再] Rails勉強会＠東北第1回のお知らせ — Fujioka <fuj@...>

[#43637] case when 〜 end 構文での and/or/not 演算子について — "M.Fujii" <boochang@...4.kcn.ne.jp>

[#43645] RubyGems — Maehara Masahide (前原正英) <maehrm@...>

[#43646] RUBYLIBの影響を排除したい — keiichi matsunaga <ma2@...>

[#43652] [ANN] rcodetools-0.7.0 - エディタ非依存開発支援ツール群 — rubikitch@...

[#43653] [ANN]Ruby Sapporo Night Vol.1のお知らせ — "SHIMADA Koji" <snoozer.05@...>

[#43654] Text file busy — Yasushi Ito <yas@...>

[#43656] [ANN] Ruby勉強会@札幌 第4回のお知らせ — "SHIMADA Koji" <snoozer.05@...>

[#43662] [ANN] るびま読書会#3 — cuzic <cuzic@...>

[#43664] [ANN] RubyKaigi2007 での Dave Thomas による基調講演のログ — zunda <zunda616e@...>

[#43665] [ANN] 「Webアプリケーションセキュリティフォーラム 第5回コンファレンス」のご案内 — "TAKAGI, Hiromitsu" <takagi.hiromitsu@...>

[#43667] REXMLでのパーサーの不具合について — Eito Katagiri <eito@...>

[#43669] [ANN] オープンセミナー2007@四国 開催のお知らせ — Kazuhiro Yoshida <moriq@...>

[#43670] [Q] RMagick multi crop — Hiroki Kashiwazaki <reo@...>

[ruby-list:43668] Re: REXMLでのパーサーの不具合について

Thread

In This Thread

[#43600] [ANN] Ruby勉強会＠東海　第1回開催のお知らせ — OHASHI Takeshi <ohashi@...>

[#43610] [ANN] Rails勉強会@東京第19回のお知らせ — "MOROHASHI Kyosuke" <moronatural@...>

[#43621] Rails勉強会@東北第1回のお知らせ — 片平裕市 <yuichi_katahira@...>

[#43656] [ANN] Ruby勉強会@札幌第4回のお知らせ — "SHIMADA Koji" <snoozer.05@...>

[#43665] [ANN] 「Webアプリケーションセキュリティフォーラム第5回コンファレンス」のご案内 — "TAKAGI, Hiromitsu" <takagi.hiromitsu@...>

[#43669] [ANN] オープンセミナー2007@四国開催のお知らせ — Kazuhiro Yoshida <moriq@...>