PDF إلى نص

استخرج النص من أي PDF،
داخل متصفحك.

اسحب طبقة نصية نظيفة من أي PDF — مع الحفاظ على الفقرات، ودعم متعدد الصفحات، وترميز UTF-8. الاستخراج يجري داخل متصفحك، فالملف لا يغادر جهازك أبداً.

أسقط ملف PDF الذي تريد استخراج النص منه
نقرأ طبقة النص المضمّنة باستخدام pdf.js — بدون OCR، بدون خادم.
متعدد الصفحات · إخراج UTF-8 ملفات PDF الممسوحة تحتاج OCR — هذه الأداة لطبقة النص فقط
مجاناً
بدون تسجيل
بدون رفع
إخراج UTF-8
كيف يعمل

ثلاث خطوات. ملفك لا يغادر علامة التبويب.

1

أسقط ملف PDF

اختر الملف الذي تريد استخراج النص منه. يُحمَّل في ذاكرة متصفحك، لا على خادم.

2

نقرأ طبقة النص

يمر pdf.js على كل صفحة، ويرتب العناصر حسب الإحداثي Y، ويعيد بناء فواصل الفقرات في مكانها الصحيح.

3

انسخ أو نزّل .txt

احصل على نص عادي UTF-8 نظيف. انسخه إلى الحافظة أو احفظه كملف .txt — القرار لك.

الأسئلة الشائعة

أسئلة متكررة

كيف يعمل الاستخراج؟

نستخدم pdf.js من Mozilla لقراءة طبقة النص المضمّنة في ملف PDF صفحة بصفحة. تُجمَّع العناصر حسب إحداثيها Y لتبقى فواصل الفقرات سليمة — بدون خادم، بدون رفع.

هل يعمل على ملفات PDF الممسوحة ضوئياً؟

لا. الملفات الممسوحة هي صور للنص، لا نص — استخراجها يتطلب OCR، وهذه الأداة لا تشغّله. إذا كان ملفك ناتجاً عن مسح ورق، ستحتاج إلى أداة OCR أولاً.

هل يُرفع ملفي إلى أي مكان؟

أبداً. يجري الاستخراج بالكامل داخل متصفحك عبر WebAssembly — يمكن التحقق في DevTools ← Network. الملف يبقى على جهازك.

ماذا عن ملفات PDF المحمية بكلمة مرور؟

افتح القفل أولاً باستخدام أداة فك قفل PDF، ثم استخرج النص. لا يمكن تحليل تيارات المحتوى المشفرة بدون كلمة المرور.

ما هو الحد الأقصى لحجم الملف؟

حتى 100 ميجابايت. أي حجم أكبر قد يستنزف ذاكرة المتصفح — جرّب تقسيمه أولاً بأداة تقسيم PDF.