- 公開日:
- 更新日:
PDFのOCR処理について(無料で変換する方法もご紹介)
本記事ではOCRを使用して、PDFのテキストを編集可能なデータに変換する方法についてご紹介しています。
フリーソフトやGoogle ドライブ、Adobe Acrobat Pro DCを使用した方法を解説しておりますので、必要の際にお役立てください。
OCR(光学文字認識)とは?
OCR(光学文字認識)とは、手書きや印刷された文字をスキャナーやカメラなどの光学的な機械で読み取り、解析することによって、コンピューターで利用できるデジタルなテキストデータに変換する技術のことです。
例えば本一冊を編集可能なデータとしてパソコンに取り込む場合、手作業で文字を入力していたら大変な時間がかかりますが、OCRを使用すれば、作業時間を大幅に削減でき、打ち間違えや二重入力などの人的なミスも防ぐことができます。
OCR処理され、ファイルに埋め込まれたテキストデータには編集を加えることもでき、文字の検索なども可能になるため、さまざま場面で活用されています。
PDFを無料で編集可能なテキストに変換する方法
PDFを無料で編集可能なテキストに変換する方法をご紹介します。
フリーソフトでテキスト化する
フリーソフトを使用してPDFのテキストを編集可能なデータに変換する方法については、以下の記事をご参照ください。
オンライン型とインストール型に分けておすすめのフリーソフトをご紹介しています。
Google ドライブでテキスト化する
Google ドライブを使用して、PDFをテキスト化する方法をご紹介します。
Google ドライブのOCR機能は、読み込むデータの容量に制限はありますが、有料のOCRソフトと比較しても精度が高くおすすめです。
![ocr Google ドライブ テキスト化完了](/_wu/ocr2.png)
PDFがテキスト化されました。
Adobe Acrobat Pro DCでOCR処理する方法
Adobe Acrobat Pro DCのアプリを使用して、PDFのテキストを編集可能なデータに変換する方法をご紹介します。
![ocr Adobe ツール](/_wu/ocr3.png)
Adobe Acrobat Pro DCでPDFを開きます。画面左上の【ツール】タブを選択します。
![ocr Adobe 編集](/_wu/ocr4.png)
【PDF を編集】を選択すると、自動的にOCR処理が開始されます。
![ocr Adobe OCR処理完了](/_wu/ocr5.png)
PDF内のテキストが編集可能なデータに変換されました。
OneNoteでOCR処理する方法
MicrosoftのOneNoteを使用して、PDFをOCR処理する方法をご紹介します。
![ocr onenote pdfを開く](/_wu/ocr6.png)
テキスト化したいPDFを開きます。(表示できれば何のソフトでも構いません)
![ocr onenote ファイル](/_wu/ocr7.png)
OneNoteを開き、画面左上の【ファイル】タブを選択します。
![ocr onenote ノートブックの作成](/_wu/ocr8.png)
①【新規】タブを選択します。
②『ノートブック名』を入力し、②【ノートブックの作成】ボタンを押します。
![ocr onenote 今は共有しない](/_wu/ocr9.png)
「Microsoft OneNote」ダイアログボックスが表示されました。
共有に関して、【任意の回答(例:今は共有しない)】ボタンを押します。
![ocr onenote 挿入](/_wu/ocr10.png)
①【挿入】タブ、②【画面の領域】の順に選択します。
![ocr onenote 範囲を決める](/_wu/ocr11.png)
One Noteの画面が一旦閉じられ、先ほど開いておいたPDFの画面が表示されます。
【OCR処理する範囲】をカーソルを押しながらドラッグして選択します。
![ocr onenote コピー](/_wu/ocr12.png)
選択した範囲がOneNoteに挿入されました。
①【挿入された画像】を右クリックし、②【画像からテキストをコピー】を選択します。
![ocr onenote 貼り付け](/_wu/ocr13.png)
①【OCR処理されたテキストを挿入したい空白】を右クリックし、②「貼り付けのオプション」で【赤枠内のマーク】を選択します。
![ocr onenote OCR処理完了](/_wu/ocr14.png)
OCR処理されたテキストが貼り付けられました。
Macの場合
オンライン型フリーソフトのLightPDFを使用して、MacでPDFをテキストファイル化する方法をご紹介します。
![ocr Mac LightPDF 選択](/_wu/ocr16.png)
ダイアログボックスが表示されました。
①【任意のファイル】を選択し、②【開く】ボタンを押します。
![ocr Mac LightPDF 日本語](/_wu/ocr17.png)
①【元ファイルの言語を選択】、②【日本語】の順に選択します。
![ocr Mac LightPDF 変換](/_wu/ocr18.png)
【変換】ボタンを押します。
![ocr Mac LightPDF ダウンロード](/_wu/ocr19.png)
【ダウンロード】ボタンを押します。
![ocr Mac LightPDF Finderで表示](/_wu/ocr20.png)
①画面左下の【v】ボタンを押し、②【Finder で表示】を選択します。
![ocr Mac LightPDF ファイルを開く](/_wu/ocr21.png)
「ダウンロード」ダイアログボックスが表示されました。
【ダウンロードしたファイル】をダブルクリックして開きます。
![ocr Mac LightPDF 変換完了](/_wu/ocr22.png)
PDFがテキストファイル化されました。