OCR (Optical Character Recognition) converts scanned PDFs — which are image-based and unsearchable — into real text you can copy, search, and edit. It works by analyzing the visual patterns in each page image and matching them to known characters.

Does this tool upload my PDF to a server?

No. The OCR processing runs entirely in your browser using Tesseract.js, a WebAssembly-based OCR engine. Your file never leaves your device.

How accurate is the OCR?

Accuracy depends on scan quality. High-resolution scans of printed documents typically achieve 95%+ accuracy. Low-quality phone photos or handwritten text will be less accurate. For best results, use clean, high-contrast scans.

What languages does the OCR support?

The OCR tool supports 13 languages including English, Hebrew, Arabic, French, German, Spanish, Italian, Portuguese, Dutch, Polish, Turkish, Japanese, and Russian. Select the document language before running OCR for best accuracy.

PDF OCR — Extract Text from Scanned PDF Free

使い方 PDF OCR

「PDFを選択」をクリックするか、アップロード領域にドラッグしてスキャン済みPDFをアップロードします。

OCRエンジンがブラウザ内で各ページをローカル処理するのを待ちます—アップロード不要。

抽出されたテキストをプレビューし、結果が正しいことを確認します。

「.txtをダウンロード」をクリックして抽出されたテキストをデバイスに保存します。

このツールについて PDF OCR

スキャンしたPDFからテキストを抽出

スキャンしたPDFは実質的に画像です—テキストのコピー、検索、編集ができません。当社の無料PDF OCRツールは、ブラウザ内直接光学文字認識を実行し、各ページを実用的なテキストに変換することでこの問題を解決します。

仕組み

PDFMerger.ioはWebAssemblyにコンパイルされたオープンソースのOCRエンジンTesseract.jsを使用します。スキャンされたPDFをアップロードすると：

各ページがブラウザ内で2倍スケールの高解像度画像にレンダリングされます
Tesseract.jsが画像をピクセル単位で分析し、文字、単語、行を識別します
全ページの認識テキストが1つの.txtファイルにまとめられます
結果を直接ダウンロード—どの段階でもサーバーは関与しません

PDF OCRの活用シーン

スキャンした契約書・請求書 — 検索可能・コピペースト可能に
デジタル化された書籍・論文 — 編集・アーカイブ用にテキスト抽出
撮影したレシート — 手入力不要でテキスト内容を取得
古い文書 — デジタル化以前に作成された文書からテキストを復元

プライバシー优先

機密文書をリモートサーバーにアップロードするクラウドOCRサービスとは異なり、PDFMerger.ioはブラウザタブ内で全てローカル処理します。ファイルは送信、保存、閲覧されることは一切ありません。

よくある質問

QPDF OCRとは何ですか？

OCR（光学文字認識）は、画像ベースで検索できないスキャン済みPDFを、コピー、検索、編集可能なテキストに変換します。

QこのツールはPDFをサーバーにアップロードしますか？

いいえ。OCR処理はWebAssemblyベースのOCRエンジンであるTesseract.jsを使用して全てブラウザ内で実行されます。ファイルがデバイスを離れることはありません。

QOCRの精度はどの程度ですか？

精度はスキャン品質によります。印刷物の高解像度スキャンは通常祝%以上の精度を達します。低品質の携帯電話写真や手書きテキストは精度が低くなります。

QOCRはどの言語に対応していますか？

OCRツールは英語、ヘブライ語、アラビア語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、オランダ語、ポーランド語、トルコ語、日本語、ロシア語の13言語に対応しています。最高の精度には、OCR実行前に文書の言語を選択してください。

PDF OCR — スキャンしたPDFから無料でテキストを抽出

プライバシー保護