[ruby-list:49825] Nokogiri で文字実体参照が
From:
"5.5" <5.5@...>
Date:
2014-05-19 23:54:34 UTC
List:
ruby-list #49825
5.5 と申します。
Nokogiri で HTML を読み込んで書き出すと,文字実体参照がリテラルに
変えられます。
たとえば © が © になります。
Nokogiri::HTML("<p>© 2014 Hoge</p>").to_s
# => "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\"
\"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body><p>© 2014
Hoge</p></body></html>\n"
それはいいのですが,ℏ のような文字実体参照が &hbar; に変
えられてしまいます。
これを防ぐ(ℏ のままにしてもらう)手段はありますでしょうか。
使い得る実体参照を ENTITY 宣言に全部書く,という方法は避けたいです。
--
5.5@moji.gr.jp