[ruby-list:49825] Nokogiri で文字実体参照が

From: "5.5" <5.5@...>
Date: 2014-05-19 23:54:34 UTC
List: ruby-list #49825
5.5 と申します。

Nokogiri で HTML を読み込んで書き出すと,文字実体参照がリテラルに
変えられます。
たとえば &copy; が © になります。

Nokogiri::HTML("<p>&copy; 2014 Hoge</p>").to_s
# => "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" 
\"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body><p>© 2014 
Hoge</p></body></html>\n"

それはいいのですが,&hbar; のような文字実体参照が &amp;hbar; に変
えられてしまいます。

これを防ぐ(&hbar; のままにしてもらう)手段はありますでしょうか。

使い得る実体参照を ENTITY 宣言に全部書く,という方法は避けたいです。

-- 
5.5@moji.gr.jp

In This Thread

Prev Next