Presto! PageManagerでPDF文書を文字認識させる方法
こんなときに
紙の文書や写真撮影した書類の文字をパソコンであつかえるようにしたいとき
専用のソフトウェアはもっていません
brotherのプリンタ複合機を所有しています
そのbrotherのプリンタ付属のソフトであるPresto! PageManagerをパソコンにインストールしました
Presto! PageManagerでPDF文書を文字認識させる方法
Presto! PageManagerのバージョンは9
1.準備
ドキュメント>My PageManagerのフォルダへ対象のファイルを移動またはコピーしておきます。移動またはコピーの操作そのものは、Windowsのエクスプローラーで行ってもかまいません。
2.対象のPDFをダブルクリック
Presto! PageManager上で、My PageManagerフォルダを開いた状態にしておきます。この画面表示はサムネイルビューです。
PDF文書は左上に赤いPDFのマークがついています。
3.書類をビューでPageManegerを選択
環境設定ダイアログボックスが表示され、書類をビューするプログラムを選択します。PageManegerを選択してOKします。
ページが読み込まれ、画面表示がページビューに切り替わります。
4.各ページをBMP形式等で保存
PDFはそのままではOCR認識させることができません。
各ページをそれぞれ名前をつけて保存でBMP形式等で保存します。
ファイル>名前を付けて保存
または、
ページビュー上で右クリック>名前をつけて保存
BMP形式で保存する際に、設定で高画質にしておきます。
あとでどこへ保存したか困らないために、保存先はよく確認しておきます。
1ページ目を画像として保存したら、続いて、OCR認識させてみましょう。
5.保存した画像ファイルをOCR認識させる
ツール>文字認識(OCR)処理をクリック
小さなウィンドウが表示されます。黄緑色に変化して消えたら認識が完了しています。
6.テキスト形式やHTML形式で保存
ファイル>名前を付けて保存
または、
ページビュー上で右クリック>名前をつけて保存
テキストまたはHTML形式で保存します。
7.結果を確認
保存したテキストまたはHTMLファイルを開いて認識結果を確認します。
メモ
認識結果に納得いかない場合は、元の画像、スキャン時の解像度を見直すことになります。OCR認識そのものについては、PageManagerでは設定がどうも見当たりません。
PDFではなく、たんなる画像を文字認識させる場合の手順は、より簡単です。サムネイルビューの状態からでもツール>文字認識(OCR)処理をクリックすることができます。
OCRソフトをお探しの方は、手持ちのプリンタ機器に何かおまけのソフトがついてないか 確認するといいかもしれません。
作成日: