[ruby-list:49831] Re: Nokogiri で文字実体参照が

From: "5.5" <5.5@...>
Date: 2014-05-20 23:57:00 UTC
List: ruby-list #49831
5.5 です。

(14/05/21 0:11), Kazuhiro NISHIYAMA wrote:
> ちょっと検索してみると
> http://stackoverflow.com/questions/7756123/nokogiri-leaving-html-entities-untouched
> に同じような話があって、libxml の挙動のようなので libxml を使っている
> nokogiri を使っている限りはどうしようもなさそうな気がしました。

そうですか。
(このページはちらっと見たのですが,少し違う話〔正しい変換を抑制
したい〕かと思ってちゃんと読んでませんでした)

&copy; が © になるのはちっとも構わないのですが,&hbar; が &amp;
hbar; になるなんて。

> stackoverflow の回答でも書いてありますが NOENT というオプションがある
> ようなので、その辺りの挙動が変わるのかと思ったら、試してみても何も
> 変わらないようで、よくわかりませんでした。

うーん,困りました。
Nokogiri にかける前後で別表記に変換/逆変換するような姑息な手段
でも考えてみます。

ありがとうございました。

-- 
5.5@moji.gr.jp

In This Thread