Rakutenサプライズデー 2日間限定価格
終了まで15時間9分

Office Hack

PDFを文字起こししてテキスト化する方法

  • Release
  • Update

本記事では、PDFを文字起こししてテキスト化する方法について解説しています。

無料のオンラインサービスやAdobe Acrobat、スマホのアプリなど、PDFから簡単にテキストを抽出できる様々なツールをご紹介していますので、お役立てください。

PDFファイルを文字起こししてテキスト化する方法

パソコンやスマホで、PDFを文字起こししてテキスト化する方法について解説します。

無料のオンライン変換サイトを使用する

フリーソフトを使用したテキスト抽出方法については、以下の記事「PDFから文字(テキスト)を抽出する方法」のセクションをご参照ください。

WindowsとMacの両方で使用することができます。

Googleドライブを使用する

Googleドライブを使用して、PDFからテキストを抽出する方法をご紹介します。

作業時間:5分

  1. Google ドライブにアクセスする
    pdf-text-conversion googleドライブ 新規

    Google ドライブ(https://drive.google.com/)にアクセスし、【新規】ボタンを押します。

  2. ファイルのアップロード
    pdf-text-conversion googleドライブ ファイルをアップロード

    出てきたメニューから、【ファイルのアップロード】を選択します。

  3. ファイルの選択
    pdf-text-conversion googleドライブ ファイルを選択

    「開く」ダイアログボックスが表示されました。①【任意のファイル】を選択し、②【開く】ボタンを押します。

  4. Google ドキュメントで開く
    pdf-text-conversion googleドキュメント

    ①【アップロードしたファイル】を右クリックします。②【アプリで開く】、③【Google ドキュメント】の順に選択します。

  5. テキスト抽出完了
    pdf-text-conversion googleドライブ テキスト抽出完了

    新規タブでGoogle ドキュメントが開きます。テキストの抽出が完了しました。

スマホ(iPhone)でアプリを使用する

「CamScanner」というアプリを使用したテキストの抽出方法をご紹介します。

CamScannerでは、手書きのメモや領収書などの大切な書類を高速でスキャンして保存でき、画像やPDFからもテキストを簡単に抽出することができます。

アプリをインストールする
pdf-text-conversion camscanner インストール

App Storeより、CamScannerのアプリをインストールします。

無料会員登録をする

CamScannerは、無料会員登録をすることで、1日4回までOCR機能を使用することができます。

以下、会員登録の方法を解説いたします。

pdf-text-conversion CamScanner アプリを開く

CamScannerのアプリを開きます。

pdf-text-conversion CamScanner 私

画面右下の【私】を選択します。

pdf-text-conversion CamScanner 会員登録

【ログイン/登録】を押します。

pdf-text-conversion CamScanner メール

①『メールアドレス』を入力し、②【利用規約及びプライバシーポリシーに同意】の項目にチェックマークを入れます。

③【次のステップ】ボタンを押します。

pdf-text-conversion CamScanner パスワード

①『パスワード』を入力し、②【次のステップ】ボタンを押します。

pdf-text-conversion CamScanner メール認証

入力したメールアドレスに、確認メールが届きました。

【メールアドレスを確認してください】ボタンを押します。

pdf-text-conversion CamScanner 認証完了

メールアドレスの確認が完了しました。

pdf-text-conversion CamScanner アカウント

CamScannerのアプリに戻ると、会員登録が完了しています。

PDFからテキストを抽出する

PDFからテキストを抽出する方法について解説します。

pdf-text-conversion CamScanner PDFの保存されているアプリを開く

今回は、「ファイル」アプリに保存されたPDFのテキストを抽出します。

【ファイル】アプリを開きます。

pdf-text-conversion  CamScanner PDFを長押し

【任意のPDF】を長押しします。

pdf-text-conversion  CamScanner 共有

出てきたメニューから、【共有】を選択します。

pdf-text-conversion  CamScannerでPDFを開く

①【「アプリのメニュー」を「横にスクロール」】し、②【CamScanner】のアプリを選択します。

pdf-text-conversion  CamScannerで保存

【保存】ボタンを押します。

pdf-text-conversion  CamScanner 選択して保存

【保存】ボタンを押します。

CamScanner アップロード完了

PDFがアップロードされました。

pdf-text-conversion  CamScanner テキスト抽出したいファイルを選択

【テキストを抽出したいページ】を選択します。

※無料会員はテキストの抽出可能回数に上限があるため、上限を超えた数のデータから抽出を行いたい場合は、別途料金を支払う必要があります。

pdf-text-conversion  CamScanner テキスト表示

【テキスト】を選択します。

pdf-text-conversion  CamScanner PDF認識

【認識】ボタンを押します。

pdf-text-conversion  CamScanner PDFフルページ

【任意の文字認識範囲(例:フルページを認識)】を選択します。

pdf-text-conversion  CamScanner テキストが抽出される

画面右下の【エクスポート】を選択します。

pdf-text-conversion  CamScanner PDF txtとして保存

【Txtファイルとしてエクスポート】を選択します。

pdf-text-conversion  CamScanner PDFメール

【任意の共有方法(例:メール)】を選択します。

pdf-text-conversion  CamScanner メールで送信

①『送信先のメールアドレス』を入力し、②【↑】ボタンを押します。

pdf-text-conversion  CamScanner 添付ファイルを開く

入力したメールアドレスにTxtファイルが届きました。

【添付ファイル】をダブルクリックして開きます。

pdf-text-conversion  CamScanner テキスト抽出完了

テキストの抽出が完了しました。

画面右上の「共有」ボタンでファイルの保存ができます。

スキャンした画像のPDFからテキストを抽出する方法

スキャンした画像のPDFからテキストを抽出する方法について解説します。

Adobe AcrobatのOCR機能を使用する

OCR(Optical Character Recognition)とは、画像の中にある文字を認識して、編集可能なテキストに変換する技術のことです。

今回はAdobe Acrobat Pro DCのOCR機能を使用したテキストの抽出方法をご紹介します。

※無料版のAdobe Acrobat Reader DCでは、テキストの抽出は行えませんのでご注意ください。

有料版Adobe Acrobat Standard/Pro DCをまだPCにインストールしていない方は、以下のリンクから購入ができます。


pdf-text-conversion Adobe Acrobat Proで開く

スキャンした画像のPDFを、Adobe Acrobat Pro DCで開きます。

pdf-text-conversion Adobe Acrobat Pro PDFを編集

画面右側のメニューから、【PDF を編集】を選択します。

pdf-text-conversion Adobe Acrobat Pro 文字認識開始

文字の認識が始まります。

pdf-text-conversion Adobe Acrobat Pro テキストの選択

PDFが編集可能なテキストと画像に変換されました。

【抽出したいテキスト】を選択します。

pdf-text-conversion Adobe Acrobat Pro コピー

選択したテキスト上で「右クリック」し、出てきたメニューから【コピー】を選択します。

pdf-text-conversion メモ帳起動

【文書作成ソフト(例:メモ帳)】を起動します。

pdf-text-conversion Adobe Acrobat Pro 貼り付け

空白を「右クリック」し、出てきたメニューから【貼り付け】を選択します。

pdf-text-conversion Adobe Acrobat Pro テキスト抽出完了

テキストの抽出が完了しました。

PDFがテキスト化できない場合

Adobe Acrobat Pro DCを使用したテキストの抽出がうまくいかない場合、以下の方法でスキャン画像の補正をお試しください。

pdf-text-conversion Adobe Acrobat Pro スキャン補正

Adobe Acrobat Pro DCでスキャンした画像のPDFを開きます。

pdf-text-conversion Adobe Acrobat Pro スキャンとOCR

画面右側のメニューから、【スキャンと OCR】を選択します。

pdf-text-conversion Adobe Acrobat Pro 補正選択

①【補正】、②【スキャンした文書】の順に選択します。

pdf-text-conversion Adobe Acrobat Pro 補正ボタン

【補正】ボタンを押します。

pdf-text-conversion Adobe Acrobat Pro 補正後テキストの抽出

①【テキストの認識】、②【このファイル内】の順に選択します。

pdf-text-conversion Adobe Acrobat Pro テキスト抽出ボタン

【テキスト認識】ボタンを押します。

pdf-text-conversion Adobe Acrobat Pro 補正完了

テキストが抽出可能な状態になりました。

[PDF 抽出]の関連記事

よろしければ参考にならなかった点をお聞かせください

CAPTCHA


Page Top