حول PDF OCR
استخراج النص من أي ملف PDF ممسوح ضوئياً
ملفات PDF الممسوحة ضوئياً هي في جوهرها صور — لا يمكنك نسخ النص منها أو البحث فيها أو تحريرها. تحل أداة PDF OCR المجانية لدينا هذه المشكلة بتشغيل التعرف الضوئي على الحروف مباشرةً في متصفحك، مما يحوّل كل صفحة إلى نص حقيقي قابل للاستخدام.
آلية العمل
يستخدم PDFMerger.io محرك Tesseract.js، وهو المحرك الرائد لتقنية OCR مفتوح المصدر المُجمَّع إلى WebAssembly. عند رفع ملف PDF ممسوح ضوئياً:
- تُعرض كل صفحة كصورة عالية الدقة بمقياس 2× داخل متصفحك
- يحلل Tesseract.js الصورة بكسلاً بكسل، ويتعرف على الحروف والكلمات والأسطر
- يُجمَع النص المستخرج من جميع الصفحات في ملف
.txtواحد - تنزّل النتيجة مباشرةً — دون أي تدخل من خادم خارجي
متى تستخدم PDF OCR
- العقود والفواتير الممسوحة ضوئياً — اجعلها قابلة للبحث والنسخ
- الكتب والمقالات المرقمنة — استخرج النص للتحرير أو الأرشفة
- الإيصالات المصوّرة — احصل على المحتوى النصي دون الكتابة اليدوية
- الوثائق القديمة — استرجع النص من مستندات أُنشئت قبل العصر الرقمي
الخصوصية أولاً
على عكس خدمات OCR السحابية التي تتطلب رفع مستنداتك الحساسة إلى خوادم بعيدة، يعالج PDFMerger.io كل شيء محلياً في تبويب متصفحك. لا تُنقل ملفاتك أو تُخزَّن أو يطّلع عليها أحد.