seraphyの日記

日記というよりは過去を振り返るときのための単なる備忘録

ScanSnapS510でスキャンしたらAcrobat 9 Professionalで最適化をかけるべし*1

  1. 文中心の書籍をスキャンするときはScanSnapの設定で白黒になるようにしておく。(自動でもよいが、古い本だったり下地が白くなかったりするとカラーーにされてしまうし、あるいは二色刷りであっても別にモノトーンでもいいような場合は白黒に設定しておく。)
  2. 白紙ページは自動的に削除しないように設定しておく。(紙送りに失敗して2枚まとめて送られたような場合でもページ番号を追えばわかる。本の背中を落とすときにノリがついていないかチェックするのは当たり前だが、きれいに分離されていることを確認しても紙送りの性能がまあまあな製品なので、100枚に1回ぐらいは2枚送りしてしまうこともある。そうすると2ページ欠落するが、このとき白紙スキップを選択していない場合は見開きページ状態で画面に表示させてページ番号だけ、2,4,6,...と追跡してゆくだけで欠落の有無がわかる。)
  3. スキャンするときは「継続読み取り」を有効にしておくのが当たり前。(この便利オプションがあることを知らないがために、すごい苦労させられた。S510で一度にスキャンできるのは20枚程度だからたいていの本は一度には読み取れない。継続読み取りにしておかないと、複数PDFに細切れにされて、そのあとで結合しなければならない。)
  4. もし縦書きの本であればAcrobatで開いて右綴じに変更する。これで、2ページ見開き表示にしたときに本と同じように開ける。(横書きの場合でも見開きページがあったりするので同じようにそろえておくとよい。)
  5. 一度上書き保存したのちに、再度、「名前をつけて保存する」を選択。最適化を選んで保存。*1
    • このとき白黒画像の保存方法として「JBIG2」を選択し、「劣化なし」にしておく
    • Web最適化をもしておくとよい。(デフォルトでWeb最適化が選択されているはず。)


ScanSnap S510でスキャンした直後に30MBもあったファイルも、Acrobatの白黒画像のJBIG2劣化なしで圧縮すると11MBにまで圧縮される。

開いていても見た目は変わらないにもかかわらず、100MBを超えるようなファイルも20MBそこそこになることも珍しくない。

ただし、これが効くのは「白黒」の場合のみ。カラーでスキャンされた場合はjpeg圧縮なので圧縮効果は望めない。

なので、ScanSnapでスキャンするときは白黒でいいものは白黒にするのが鉄則となりそうだ。*2


スキャンした本に対して「Web最適化」をすると何がいいかというと、ファイルサーバにおいてノーパソ等からブラウザ経由でPDFファイルを見るときにいちいちダウンロードしなくてもよくなる、という作用がある。
Web最適化していないファイルの場合、一度全部のファイルを読み込み終わるまでページが表示されないので結局、ダウンロードするのと同じである。
Web最適化されている場合はダウンロードが完了してなくてもページがひらけるし、自由に見たいページをすぐに指定して、すぐに表示できるようになる。
なので、サーバにファイルを置きっぱなしで問題なくなる。
これは非常に便利。


くわえて最適化するとファイルサイズが小さくなり、Web閲覧も可能になるので、RICOHquanp.onのようなサービスでファイルを保存しても、その場で見れたりするようになるようだ。*3


しかし、まったく副作用がないわけではない。JBIG2で保存した場合の欠点は、開くときにCPUパワーを食うようになるという点である。このため、ページ送りするときに若干遅くなる。読む場合には、それほど不都合ではないだろうが、ページをすばやく送りたい場合には向いていない。(JBIG2で圧縮していないページについてはWeb最適化しようがページ送りの速度に変わりはない。)

*1:「ファイルサイズを縮小する」というコマンドもあり、こちらは複数ファイルの一括処理ができるが、試したところ、画質の劣化がひどく、しかも調整オプションが見あたらないので絶対にお勧めできない。

*2:フルカラーの雑誌等は圧縮をあきらめる。(w

*3:100MBほどのファイルで試したところ、PDFが表示できなかった。サポートに問い合わせたら、大きなPDFはダウンロードしないとみれません。サムネが表示されないPDFはダウンロードしないとみれません、と言われてがっかりしたのだが、Acrobat 9 Professionalで最適化保存して再度試したところ、ファイルサイズも小さくなりWeb最適化もされたことでquanp.onでも開けるようになった。