[ruby-list:50018] Re: pdfを扱うためのpopplerライブラリをrequireできない
From:
Kouhei Sutou <kou@...>
Date:
2014-11-23 08:24:33 UTC
List:
ruby-list #50018
須藤です。
In <39F3154DC7894567B79F9338A6AB278B@tyoshiizumiPC>
"[ruby-list:50017] Re: pdfを扱うためのpopplerライブラリをrequireできない" on Sat, 22 Nov 2014 11:42:44 +0900,
"Yoshiizumi" <yoshi@cup.sakura.ne.jp> wrote:
> 「require "pango"」の1行を加えるだけで、popplerを使って、pdfからテ
> キストを抽出できるようになりました!とても助かります。
よかったです!
> 参考まで、私が試したスクリプトを貼り付けておきます。slide.pdfのテキ
> ストを標準出力に出力します。
ありがとうございます!
strに貯めてからprintせずに、sprintfしたものをすぐにprintして
もいいかもしれませんね。
> −−−−−−−− ここから
> require "pango"
> require "poppler"
> pdf_file = "slide.pdf"
> document = Poppler::Document.new(pdf_file)
> str = ''
> document.each do |page|
> str += sprintf("%s\n\n%s\n\n", page.get_text, "-"*16)
> end
> print str # 文字エンコードは utf-8 になっている
> −−−−−−−− ここまで
> 話は違いますが、rabbit.bat でpdfファイルを閲覧しようとした時に、下の
> ようなエラーが出ました。
> MS-Windows7, ruby 2.1.5(32bit版)を使った場合、
> DOS窓で「rabbit.bat slide.pdf [enter]」を実行した時のものです。
> slide.pdf は、rabbitで生成しました。
> ちょっと気になったので掲げてみます。
報告ありがとうございます!
実は、これはmasterでは直っているのです。なので、新しいバージョ
ンをリリースしないといけませんね。。。