استخرج النص من أي PDF،
داخل متصفحك.
اسحب طبقة نصية نظيفة من أي PDF — مع الحفاظ على الفقرات، ودعم متعدد الصفحات، وترميز UTF-8. الاستخراج يجري داخل متصفحك، فالملف لا يغادر جهازك أبداً.
ثلاث خطوات. ملفك لا يغادر علامة التبويب.
أسقط ملف PDF
اختر الملف الذي تريد استخراج النص منه. يُحمَّل في ذاكرة متصفحك، لا على خادم.
نقرأ طبقة النص
يمر pdf.js على كل صفحة، ويرتب العناصر حسب الإحداثي Y، ويعيد بناء فواصل الفقرات في مكانها الصحيح.
انسخ أو نزّل .txt
احصل على نص عادي UTF-8 نظيف. انسخه إلى الحافظة أو احفظه كملف .txt — القرار لك.
أسئلة متكررة
كيف يعمل الاستخراج؟
نستخدم pdf.js من Mozilla لقراءة طبقة النص المضمّنة في ملف PDF صفحة بصفحة. تُجمَّع العناصر حسب إحداثيها Y لتبقى فواصل الفقرات سليمة — بدون خادم، بدون رفع.
هل يعمل على ملفات PDF الممسوحة ضوئياً؟
لا. الملفات الممسوحة هي صور للنص، لا نص — استخراجها يتطلب OCR، وهذه الأداة لا تشغّله. إذا كان ملفك ناتجاً عن مسح ورق، ستحتاج إلى أداة OCR أولاً.
هل يُرفع ملفي إلى أي مكان؟
أبداً. يجري الاستخراج بالكامل داخل متصفحك عبر WebAssembly — يمكن التحقق في DevTools ← Network. الملف يبقى على جهازك.
ماذا عن ملفات PDF المحمية بكلمة مرور؟
افتح القفل أولاً باستخدام أداة فك قفل PDF، ثم استخرج النص. لا يمكن تحليل تيارات المحتوى المشفرة بدون كلمة المرور.
ما هو الحد الأقصى لحجم الملف؟
حتى 100 ميجابايت. أي حجم أكبر قد يستنزف ذاكرة المتصفح — جرّب تقسيمه أولاً بأداة تقسيم PDF.