• 公開日:
  • 更新日:

PDFのOCR処理について(無料で変換する方法もご紹介)

本記事ではOCRを使用して、PDFのテキストを編集可能なデータに変換する方法についてご紹介しています。

フリーソフトやGoogle ドライブ、Adobe Acrobat Pro DCを使用した方法を解説しておりますので、必要の際にお役立てください。

OCR(光学文字認識)とは?

OCR(光学文字認識)とは、手書きや印刷された文字をスキャナーやカメラなどの光学的な機械で読み取り、解析することによって、コンピューターで利用できるデジタルなテキストデータに変換する技術のことです。

例えば本一冊を編集可能なデータとしてパソコンに取り込む場合、手作業で文字を入力していたら大変な時間がかかりますが、OCRを使用すれば、作業時間を大幅に削減でき、打ち間違えや二重入力などの人的なミスも防ぐことができます。

OCR処理され、ファイルに埋め込まれたテキストデータには編集を加えることもでき、文字の検索なども可能になるため、さまざま場面で活用されています。

PDFを無料で編集可能なテキストに変換する方法

PDFを無料で編集可能なテキストに変換する方法をご紹介します。

フリーソフトでテキスト化する

フリーソフトを使用してPDFのテキストを編集可能なデータに変換する方法については、以下の記事をご参照ください。

オンライン型とインストール型に分けておすすめのフリーソフトをご紹介しています。

PDFをOCR処理できるおすすめのフリーソフト

Google ドライブでテキスト化する

Google ドライブを使用して、PDFをテキスト化する方法をご紹介します。

Google ドライブのOCR機能は、読み込むデータの容量に制限はありますが、有料のOCRソフトと比較しても精度が高くおすすめです。

ocr Google ドライブ Google ドキュメントを開く

Google ドライブを開き、①【テキスト化したいPDF】を右クリックします。

②【アプリで開く】、③【Google ドキュメント】の順に選択します。

ocr Google ドライブ テキスト化完了

PDFがテキスト化されました。

Adobe Acrobat Pro DCでOCR処理する方法

Adobe Acrobat Pro DCのアプリを使用して、PDFのテキストを編集可能なデータに変換する方法をご紹介します。

ocr Adobe ツール

Adobe Acrobat Pro DCでPDFを開きます。画面左上の【ツール】タブを選択します。

ocr Adobe 編集

【PDF を編集】を選択すると、自動的にOCR処理が開始されます。

ocr Adobe OCR処理完了

PDF内のテキストが編集可能なデータに変換されました。

OneNoteでOCR処理する方法

MicrosoftのOneNoteを使用して、PDFをOCR処理する方法をご紹介します。

ocr onenote pdfを開く

テキスト化したいPDFを開きます。(表示できれば何のソフトでも構いません)

ocr onenote ファイル

OneNoteを開き、画面左上の【ファイル】タブを選択します。

ocr onenote ノートブックの作成

①【新規】タブを選択します。

②『ノートブック名』を入力し、②【ノートブックの作成】ボタンを押します。

ocr onenote 今は共有しない

「Microsoft OneNote」ダイアログボックスが表示されました。

共有に関して、【任意の回答(例:今は共有しない)】ボタンを押します。

ocr onenote 挿入

①【挿入】タブ、②【画面の領域】の順に選択します。

ocr onenote 範囲を決める

One Noteの画面が一旦閉じられ、先ほど開いておいたPDFの画面が表示されます。

【OCR処理する範囲】をカーソルを押しながらドラッグして選択します。

ocr onenote コピー

選択した範囲がOneNoteに挿入されました。

①【挿入された画像】を右クリックし、②【画像からテキストをコピー】を選択します。

ocr onenote 貼り付け

①【OCR処理されたテキストを挿入したい空白】を右クリックし、②「貼り付けのオプション」で【赤枠内のマーク】を選択します。

ocr onenote OCR処理完了

OCR処理されたテキストが貼り付けられました。

Macの場合

オンライン型フリーソフトのLightPDFを使用して、MacでPDFをテキストファイル化する方法をご紹介します。

ocr Mac LightPDFへアクセス

LightPDF「OCR」にアクセスします。

【ファイルを追加】ボタンを押します。

ocr Mac LightPDF 選択

ダイアログボックスが表示されました。

①【任意のファイル】を選択し、②【開く】ボタンを押します。

ocr Mac LightPDF 日本語

①【元ファイルの言語を選択】、②【日本語】の順に選択します。

ocr Mac LightPDF 変換

【変換】ボタンを押します。

ocr Mac LightPDF ダウンロード

【ダウンロード】ボタンを押します。

ocr Mac LightPDF Finderで表示

①画面左下の【v】ボタンを押し、②【Finder で表示】を選択します。

ocr Mac LightPDF ファイルを開く

「ダウンロード」ダイアログボックスが表示されました。

【ダウンロードしたファイル】をダブルクリックして開きます。

ocr Mac LightPDF 変換完了

PDFがテキストファイル化されました。