- 公開日:
- 更新日:
PDFを文字起こししてテキスト化する方法
本記事では、PDFを文字起こししてテキスト化する方法について解説しています。
無料のオンラインサービスやAdobe Acrobat、スマホのアプリなど、PDFから簡単にテキストを抽出できる様々なツールをご紹介していますので、お役立てください。
PDFファイルを文字起こししてテキスト化する方法
パソコンやスマホで、PDFを文字起こししてテキスト化する方法について解説します。
無料のオンライン変換サイトを使用する
フリーソフトを使用したテキスト抽出方法については、以下の記事「PDFから文字(テキスト)を抽出する方法」のセクションをご参照ください。
WindowsとMacの両方で使用することができます。
Googleドライブを使用する
Googleドライブを使用して、PDFからテキストを抽出する方法をご紹介します。
![pdf-text-conversion googleドライブ 新規](/_wu/pdf-text-conversion1.png)
Google ドライブ(https://drive.google.com/)にアクセスし、【新規】ボタンを押します。
![pdf-text-conversion googleドライブ ファイルをアップロード](/_wu/pdf-text-conversion2.png)
出てきたメニューから、【ファイルのアップロード】を選択します。
![pdf-text-conversion googleドライブ ファイルを選択](/_wu/pdf-text-conversion3.png)
「開く」ダイアログボックスが表示されました。①【任意のファイル】を選択し、②【開く】ボタンを押します。
![pdf-text-conversion googleドキュメント](/_wu/pdf-text-conversion5.png)
①【アップロードしたファイル】を右クリックします。②【アプリで開く】、③【Google ドキュメント】の順に選択します。
![pdf-text-conversion googleドライブ テキスト抽出完了](/_wu/pdf-text-conversion6-1.png)
新規タブでGoogle ドキュメントが開きます。テキストの抽出が完了しました。
スマホ(iPhone)でアプリを使用する
「CamScanner」というアプリを使用したテキストの抽出方法をご紹介します。
CamScannerでは、手書きのメモや領収書などの大切な書類を高速でスキャンして保存でき、画像やPDFからもテキストを簡単に抽出することができます。
アプリをインストールする
![pdf-text-conversion camscanner インストール](/_wu/pdf-text-conversion7-1.png)
App Storeより、CamScannerのアプリをインストールします。
無料会員登録をする
CamScannerは、無料会員登録をすることで、1日4回までOCR機能を使用することができます。
以下、会員登録の方法を解説いたします。
![pdf-text-conversion CamScanner アプリを開く](/_wu/pdf-text-conversion8.png)
CamScannerのアプリを開きます。
![pdf-text-conversion CamScanner 私](/_wu/pdf-text-conversion9.png)
画面右下の【私】を選択します。
![pdf-text-conversion CamScanner 会員登録](/_wu/pdf-text-conversion10.png)
【ログイン/登録】を押します。
![pdf-text-conversion CamScanner メール](/_wu/pdf-text-conversion11.png)
①『メールアドレス』を入力し、②【利用規約及びプライバシーポリシーに同意】の項目にチェックマークを入れます。
③【次のステップ】ボタンを押します。
![pdf-text-conversion CamScanner パスワード](/_wu/pdf-text-conversion12.png)
①『パスワード』を入力し、②【次のステップ】ボタンを押します。
![pdf-text-conversion CamScanner メール認証](/_wu/pdf-text-conversion13.png)
入力したメールアドレスに、確認メールが届きました。
【メールアドレスを確認してください】ボタンを押します。
![pdf-text-conversion CamScanner 認証完了](/_wu/pdf-text-conversion14.png)
メールアドレスの確認が完了しました。
![pdf-text-conversion CamScanner アカウント](/_wu/pdf-text-conversion15.png)
CamScannerのアプリに戻ると、会員登録が完了しています。
PDFからテキストを抽出する
PDFからテキストを抽出する方法について解説します。
![pdf-text-conversion CamScanner PDFの保存されているアプリを開く](/_wu/pdf-text-conversion27.png)
今回は、「ファイル」アプリに保存されたPDFのテキストを抽出します。
【ファイル】アプリを開きます。
![pdf-text-conversion CamScanner PDFを長押し](/_wu/pdf-text-conversion28.png)
【任意のPDF】を長押しします。
![pdf-text-conversion CamScanner 共有](/_wu/pdf-text-conversion29.png)
出てきたメニューから、【共有】を選択します。
![pdf-text-conversion CamScannerでPDFを開く](/_wu/pdf-text-conversion30-1.png)
①【「アプリのメニュー」を「横にスクロール」】し、②【CamScanner】のアプリを選択します。
![pdf-text-conversion CamScannerで保存](/_wu/pdf-text-conversion31.png)
【保存】ボタンを押します。
![pdf-text-conversion CamScanner 選択して保存](/_wu/pdf-text-conversion32.png)
【保存】ボタンを押します。
![CamScanner アップロード完了](/_wu/pdf-text-conversion33-1.png)
PDFがアップロードされました。
![pdf-text-conversion CamScanner テキスト抽出したいファイルを選択](/_wu/pdf-text-conversion34.png)
【テキストを抽出したいページ】を選択します。
※無料会員はテキストの抽出可能回数に上限があるため、上限を超えた数のデータから抽出を行いたい場合は、別途料金を支払う必要があります。
![pdf-text-conversion CamScanner テキスト表示](/_wu/pdf-text-conversion35.png)
【テキスト】を選択します。
![pdf-text-conversion CamScanner PDF認識](/_wu/pdf-text-conversion36.png)
【認識】ボタンを押します。
![pdf-text-conversion CamScanner PDFフルページ](/_wu/pdf-text-conversion37.png)
【任意の文字認識範囲(例:フルページを認識)】を選択します。
![pdf-text-conversion CamScanner テキストが抽出される](/_wu/pdf-text-conversion38.png)
画面右下の【エクスポート】を選択します。
![pdf-text-conversion CamScanner PDF txtとして保存](/_wu/pdf-text-conversion39.png)
【Txtファイルとしてエクスポート】を選択します。
![pdf-text-conversion CamScanner PDFメール](/_wu/pdf-text-conversion40.png)
【任意の共有方法(例:メール)】を選択します。
![pdf-text-conversion CamScanner メールで送信](/_wu/pdf-text-conversion41.png)
①『送信先のメールアドレス』を入力し、②【↑】ボタンを押します。
![pdf-text-conversion CamScanner 添付ファイルを開く](/_wu/pdf-text-conversion42.png)
入力したメールアドレスにTxtファイルが届きました。
【添付ファイル】をダブルクリックして開きます。
![pdf-text-conversion CamScanner テキスト抽出完了](/_wu/pdf-text-conversion43.png)
テキストの抽出が完了しました。
画面右上の「共有」ボタンでファイルの保存ができます。
スキャンした画像のPDFからテキストを抽出する方法
スキャンした画像のPDFからテキストを抽出する方法について解説します。
Adobe AcrobatのOCR機能を使用する
OCR(Optical Character Recognition)とは、画像の中にある文字を認識して、編集可能なテキストに変換する技術のことです。
今回はAdobe Acrobat Pro DCのOCR機能を使用したテキストの抽出方法をご紹介します。
※無料版のAdobe Acrobat Reader DCでは、テキストの抽出は行えませんのでご注意ください。
有料版Adobe Acrobat Standard/Pro DCをまだPCにインストールしていない方は、以下のリンクから購入ができます。
![Adobe Acrobat Standard PDF編集ソフト 【12ヵ月】 オンラインコード版 Windows 対応 | PDF 変換 編集 Adobe Acrobat Standard PDF編集ソフト 【12ヵ月】 オンラインコード版 Windows 対応 | PDF 変換 編集](https://m.media-amazon.com/images/I/41YcMeHV0EL._SL160_.jpg)
Adobe Acrobat Standard PDF編集ソフト 【12ヵ月】 オンラインコード版 Windows 対応 | PDF 変換 編集
![Adobe Acrobat Pro PDF編集ソフト / 12ヵ月 / オンラインコード版 Windows / Mac 対応 | PDF 変換 編集 Adobe Acrobat Pro PDF編集ソフト / 12ヵ月 / オンラインコード版 Windows / Mac 対応 | PDF 変換 編集](https://m.media-amazon.com/images/I/41N+30NCbNL._SL160_.jpg)
Adobe Acrobat Pro PDF編集ソフト / 12ヵ月 / オンラインコード版 Windows / Mac 対応 | PDF 変換 編集
![pdf-text-conversion Adobe Acrobat Proで開く](/_wu/pdf-text-conversion44.png)
スキャンした画像のPDFを、Adobe Acrobat Pro DCで開きます。
![pdf-text-conversion Adobe Acrobat Pro PDFを編集](/_wu/pdf-text-conversion45.png)
画面右側のメニューから、【PDF を編集】を選択します。
![pdf-text-conversion Adobe Acrobat Pro 文字認識開始](/_wu/pdf-text-conversion46.png)
文字の認識が始まります。
![pdf-text-conversion Adobe Acrobat Pro テキストの選択](/_wu/pdf-text-conversion47.png)
PDFが編集可能なテキストと画像に変換されました。
【抽出したいテキスト】を選択します。
![pdf-text-conversion Adobe Acrobat Pro コピー](/_wu/pdf-text-conversion48.png)
選択したテキスト上で「右クリック」し、出てきたメニューから【コピー】を選択します。
![pdf-text-conversion メモ帳起動](/_wu/pdf-text-conversion58.png)
【文書作成ソフト(例:メモ帳)】を起動します。
![pdf-text-conversion Adobe Acrobat Pro 貼り付け](/_wu/pdf-text-conversion49.png)
空白を「右クリック」し、出てきたメニューから【貼り付け】を選択します。
![pdf-text-conversion Adobe Acrobat Pro テキスト抽出完了](/_wu/pdf-text-conversion50.png)
テキストの抽出が完了しました。
PDFがテキスト化できない場合
Adobe Acrobat Pro DCを使用したテキストの抽出がうまくいかない場合、以下の方法でスキャン画像の補正をお試しください。
![pdf-text-conversion Adobe Acrobat Pro スキャン補正](/_wu/pdf-text-conversion51.png)
Adobe Acrobat Pro DCでスキャンした画像のPDFを開きます。
![pdf-text-conversion Adobe Acrobat Pro スキャンとOCR](/_wu/pdf-text-conversion52.png)
画面右側のメニューから、【スキャンと OCR】を選択します。
![pdf-text-conversion Adobe Acrobat Pro 補正選択](/_wu/pdf-text-conversion53.png)
①【補正】、②【スキャンした文書】の順に選択します。
![pdf-text-conversion Adobe Acrobat Pro 補正ボタン](/_wu/pdf-text-conversion54.png)
【補正】ボタンを押します。
![pdf-text-conversion Adobe Acrobat Pro 補正後テキストの抽出](/_wu/pdf-text-conversion55.png)
①【テキストの認識】、②【このファイル内】の順に選択します。
![pdf-text-conversion Adobe Acrobat Pro テキスト抽出ボタン](/_wu/pdf-text-conversion56.png)
【テキスト認識】ボタンを押します。
![pdf-text-conversion Adobe Acrobat Pro 補正完了](/_wu/pdf-text-conversion57.png)
テキストが抽出可能な状態になりました。