OCR (Optical Character Recognition) converts scanned PDFs — which are image-based and unsearchable — into real text you can copy, search, and edit. It works by analyzing the visual patterns in each page image and matching them to known characters.

Does this tool upload my PDF to a server?

No. The OCR processing runs entirely in your browser using Tesseract.js, a WebAssembly-based OCR engine. Your file never leaves your device.

How accurate is the OCR?

Accuracy depends on scan quality. High-resolution scans of printed documents typically achieve 95%+ accuracy. Low-quality phone photos or handwritten text will be less accurate. For best results, use clean, high-contrast scans.

What languages does the OCR support?

The OCR tool supports 13 languages including English, Hebrew, Arabic, French, German, Spanish, Italian, Portuguese, Dutch, Polish, Turkish, Japanese, and Russian. Select the document language before running OCR for best accuracy.

PDF OCR — Extract Text from Scanned PDF Free

كيفية الاستخدام PDF OCR

ارفع ملف PDF الممسوح ضوئياً بالنقر على "تحديد ملف PDF" أو سحبه إلى منطقة الرفع.

انتظر ريثما يعالج محرك OCR كل صفحة محلياً في متصفحك — دون الحاجة إلى رفع الملف.

استعرض النص المستخرج وتحقق من دقة النتائج.

انقر على "تنزيل .txt" لحفظ النص المستخرج على جهازك.

حول PDF OCR

استخراج النص من أي ملف PDF ممسوح ضوئياً

ملفات PDF الممسوحة ضوئياً هي في جوهرها صور — لا يمكنك نسخ النص منها أو البحث فيها أو تحريرها. تحل أداة PDF OCR المجانية لدينا هذه المشكلة بتشغيل التعرف الضوئي على الحروف مباشرةً في متصفحك، مما يحوّل كل صفحة إلى نص حقيقي قابل للاستخدام.

آلية العمل

يستخدم PDFMerger.io محرك Tesseract.js، وهو المحرك الرائد لتقنية OCR مفتوح المصدر المُجمَّع إلى WebAssembly. عند رفع ملف PDF ممسوح ضوئياً:

تُعرض كل صفحة كصورة عالية الدقة بمقياس 2× داخل متصفحك
يحلل Tesseract.js الصورة بكسلاً بكسل، ويتعرف على الحروف والكلمات والأسطر
يُجمَع النص المستخرج من جميع الصفحات في ملف .txt واحد
تنزّل النتيجة مباشرةً — دون أي تدخل من خادم خارجي

متى تستخدم PDF OCR

العقود والفواتير الممسوحة ضوئياً — اجعلها قابلة للبحث والنسخ
الكتب والمقالات المرقمنة — استخرج النص للتحرير أو الأرشفة
الإيصالات المصوّرة — احصل على المحتوى النصي دون الكتابة اليدوية
الوثائق القديمة — استرجع النص من مستندات أُنشئت قبل العصر الرقمي

الخصوصية أولاً

على عكس خدمات OCR السحابية التي تتطلب رفع مستنداتك الحساسة إلى خوادم بعيدة، يعالج PDFMerger.io كل شيء محلياً في تبويب متصفحك. لا تُنقل ملفاتك أو تُخزَّن أو يطّلع عليها أحد.

الأسئلة الشائعة

Qما هو PDF OCR؟

OCR (التعرف الضوئي على الحروف) يحوّل ملفات PDF الممسوحة ضوئياً — التي تعتمد على الصور وغير قابلة للبحث — إلى نص حقيقي يمكنك نسخه والبحث فيه وتحريره.

Qهل تقوم هذه الأداة برفع ملف PDF إلى خادم؟

لا. يعمل محرك OCR بالكامل في متصفحك باستخدام Tesseract.js، وهو محرك OCR مبني على WebAssembly. ملفك لا يغادر جهازك أبداً.

Qما مدى دقة التعرف الضوئي؟

تعتمد الدقة على جودة المسح الضوئي. تحقق عمليات المسح عالية الدقة للمستندات المطبوعة دقةً تتجاوز 95% عادةً. أما صور الهاتف ذات الجودة المنخفضة أو النصوص المكتوبة بخط اليد فتكون دقتها أقل.

Qما اللغات التي يدعمها OCR؟

تدعم الأداة 13 لغة، منها: الإنجليزية والعبرية والعربية والفرنسية والألمانية والإسبانية والإيطالية والبرتغالية والهولندية والبولندية والتركية واليابانية والروسية. اختر لغة المستند قبل تشغيل OCR للحصول على أفضل دقة.

تحويل PDF الممسوح ضوئياً إلى نص — مجاناً

الخصوصية مضمونة