2010年1月2日土曜日

ScanSnapでスキャンしてSeadragonで表示する

 ScanSnapで電子化した本をどうしたら読みやすくなるかな、と考えていたときにTEDで見た「ブレイズ・アゲラ・イ・アルカス Photosynthを実演説明 (1:07〜)」を思い出したのでためしてみました。


表示側は、Seadragon、データの作成にはOpenZoomを利用しています。テスト用データは、青空文庫のデータをてふてふ君でPDFにして使いました。



 
作業は以下のとおり。

  1. ScanSnapについていたAcrobatでPDFを開き、JPEG形式で保存。これで1ページ1ファイルのJPEGファイルができます。
  2.  deepzoom.pyで縮小・分割したファイルを生成。オリジナルのdeepzoom.pyは、ひとつのファイルを分割するようになっています。ScanSnapで生成したJPEGファイルを連結してからこれにかけようとしても、ファイルが大きくなりすぎて扱えないので、1ページ1ファイルを扱えるようにテキトーに修正してつかいます。
  3. てきとーにHTMLをつくって表示。