さらぽっぽ

アクセスカウンタ

zoom RSS 【自炊設定】 Scansnap S1500設定 & OCRについて

<<   作成日時 : 2016/10/03 01:07   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

いろいろ設定を試して下記設定にたどり着きました。

事前準備 付属のCDから ScanSnap OrganizerとAdobe Acrobatをインストールしておきます。


アプリ選択 → 「ScanSnap Organizer」
※Adobe Acrobatでもいいですが、私はこっちのが編集しやすいのでこちらを使用しています。

ScanSnap Organizerを使用する場合の注意点
どうやらデフォルトで検索可能なPDFに勝手に変換していくようです。
1.ソフト左上のフォルダアイコン
2.最近使用したファイルとかの下にあるオプション
3.PDF自動変換
4.テキスト情報とマーカのチェックを外す。チェックがついてると勝手に変換します。


保存先 → ファイル名の設定 「漫画名 巻」といれてスキャン後巻数を入れています。
※読み取り後ファイル名を変更しますにチェック


読み取りモード

画質の選択 → スーパーファイン

カラーモード → 表紙は「カラー」 漫画は「グレー」
※白黒にすると漫画の場合は荒くなるのでオススメしません。
※面倒だからと言って自動判別とかカラーでスキャンすると、漫画が黄ばんでた場合黄ばみまでスキャンされます。

読み取り面 → 両面

オプション → 白紙ページを削除のみチェック、文字をくっきりにするとOCRの精度が落ちます。
※白紙削除で見開きがずれる場合はチェック外してください。


ファイル形式 → PDF
※検索可能なPDFのチェックは外す


原稿

原稿サイズ → サイズ自動検出

マルチフィールド検出 → 重なりで検出(超音波)


ファイルサイズ

ドライブに空きがあるなら、「1」をオススメします。余裕がないならデフォルトの「3」で。
※画質にこだわりがないなら3でOKです。圧縮すると戻せないのでこだわりたい人は1で。


裁断機 Durodex STACK CUTTER 200DX

すごくオススメです!これから裁断機を買うならぜひこれを検討してみてください。


スキャン方法

1.まず表紙カバーと表紙・裏表紙をスキャンします。
2.名前をつけて保存します。
3.スキャン設定のカラーをグレーに変更します。
4.漫画をスキャンします。
5.適当な名前で保存します。
6.表紙を保存したPDFと漫画のPDFを両方開きます。
7.表紙のPDFに漫画全部選択してコピーします。(ドラッグすればOK)
8.保存します、漫画のPDFは削除します。


※表紙カバーをスキャンしたときに見切れてしまう場合は、スキャナーのScanボタンを長押しして下さい。
青いランプが点滅したら指を離します、これで長い原稿もスキャンしてくれます。


OCR化&圧縮

漫画の場合は検索とかしないので、OCR化とかしなくてもいいんですが
OCR化すると文字周辺のぼやけた感じがなくなりすっきり綺麗になります。
※漫画の認識精度はあまり良くないと思うので、検索する場合実用に耐えられないと思います。
見た目のためだけです!


普通に圧縮だけしたい人


1.Adobe Acrobatを起動します。
2.文章→ファイルサイズを縮小
3.圧縮したいファイルを選びます。
4.互換性を確保 「Acrobat9.0およびそれ以降」
※バージョンによって違いますが、一番新しいバージョン選んでおけばいいかなと。
5.指定のフォルダ→保存したい場所を選びます、圧縮したやつは生データを上書きしないように別の場所へ


OCR化する人
※Adobe Acrobatだと、傾き補正のせいで原稿が斜めになることがあります。
「検索可能な画像(非圧縮)」でやると斜めにならないのですが、非圧縮なのでデータが大きくなります。
「ScanSnap Organizer」でもOCRにできますが、圧縮してくれないです。
Adobeで圧縮すると文字が悲しいことになります・・・。
どうしても斜めになるときは、有料ですが読取革命あたりを使うことをお勧めします。
読取革命付属の「フォルダウォッチャー」を使えば、指定フォルダに入れたPDFを勝手にOCRにしてくれます。
こちらは試用版がありますので、気になる人は試してみてください。

1.文章→OCRテキスト認識
2.OCRを使用して複数のファイルテキストを認識
3.ファイルを追加→保存フォルダを指定(生データとは違う場所へ保存)
4.PDFの出力形式→検索可能な画像


「ClearScan」にしてもいいですが、私の場合ClearScanにすると
変換できなかった文字が歯抜けになってしまいました。
文字まわりも検索可能な画像でやったほうが綺麗でした。


駆け足でしたが、これから自炊する人の参考になれば幸いです。


10月7日 追記


読取革命のフォルダーウォッチャーについて、いろいろ試しましたのでメモがてら。

1.PDFをPDF(透明文字)に変換中に失敗することがあります。
2.一回失敗すると、そのあとの処理が即失敗になります。
3.監視させているフォルダーを開いて、一番最初に失敗したPDFを取り除きます。
4.監視フォルダーにある「ym_temp」フォルダー(隠しフォルダーです)を開いて中身を消します。
このフォルダーの中身が履歴になっているので、履歴があると同じ名前のPDFは処理できません。
5.フォルダーウォッチャーを再起動させます。


処理失敗したPDF

元原稿があるなら再スキャンして下さい。
だいたい再スキャンしたPDFならコンバート成功すると思います。


再スキャンしてもコンバート失敗する&元原稿がすでにない場合

1.読取革命本体を起動して、PDF読み込みます。
2.認識ボタンでOCR処理します。
3.コンパクト保存で圧縮率を変更できますので、コンパクト保存で保存します。

上記で認識結果の保存に失敗した場合は、他のソフトを使うか一度JPGに変換してみる等試してください。



テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
URL(任意)
本 文
【自炊設定】 Scansnap S1500設定 & OCRについて さらぽっぽ/BIGLOBEウェブリブログ
文字サイズ:       閉じる