تشذيب PDF

تشذيب نص في PDF
في متصفحك.

اكتب الكلمات لإخفائها — يُغطّى كل تكرار على كل صفحة. بدون رفع، بدون تسريب. (تشذيب بصري، ليس على مستوى الطب الشرعي — راجع الأسئلة.)

أسقط ملف PDF للتشذيب
نفتح المحرر مع نافذة التشذيب الجاهزة.

تحقق بنفسك: افتح DevTools → علامة التبويب Network → أفلت ملفًا. شاهد كيف لا يحدث أي رفع.

اكتب لتجد · صندوق أسود غطِّ كل تطابق على كل صفحة
مجاناً
بدون تسجيل
بدون رفع
اكتب لتجد · صندوق أسود
كيف يعمل

ثلاث خطوات. ملفك لا يغادر علامة التبويب أبداً.

1

أسقط ملف PDF

اختر الملف الذي تريد تشذيبه. يُحمَّل في ذاكرة المتصفح، لا على خادم.

2

اكتب الأنماط

أسماء، بريد إلكتروني، أرقام هواتف — واحد في السطر أو مفصولة بفواصل. نجد كل تطابق.

3

نزّل النسخة المُشذّبة

يُغطّى كل تطابق بمستطيل أسود معتم على كل صفحة. يبقى الملف الأصلي دون تغيير.

تغطيةُ نصٍّ لا تريد مشاركته

أسبابُ تنقيح (redact) PDF تدور عادةً حول إخفاء أجزاءٍ من المستند مع إبقاء البقية مقروءة. عقدٌ يحوي العنوان المنزلي للطرف المقابل يذهب إلى مراجعٍ ثالث لا ينبغي أن يرى ذلك العنوان. إحالةٌ طبية تُشارَك مع شركة تأمين حيث يجب تغطية معرِّف المريض. تقريرٌ مالي يُرفَق بحقيبة مجلسٍ لكن أرقام الحسابات على مستوى الوحدة يجب أن تُغطَّى. مقترح مشروع يُعرَض على مورِّدين مرشَّحين مع تسويد سطر الميزانية كي يقدِّموا عروضًا دون التثبيت بالرقم. المهمَّةُ هنا صغيرةٌ ومتوقَّعة: تكتب الكلمات أو العبارات التي تريد إخفاءها، فترسم الأداة مستطيلًا أسود معتمًا فوق كل ظهورٍ في كل صفحة.

اقرأ هذا بعنايةٍ قبل تنقيح أيِّ شيءٍ حسَّاس: هذا تنقيحٌ بصري، لا جنائي. المستطيلاتُ السوداء تُغطِّي النصَّ على الشاشة وفي الطباعة، لكنَّ النصَّ تحتها يبقى في الملف. أيُّ شخصٍ بأداة PDF يستطيع استخراجه بنسخٍ ولصقٍ أو بحثٍ أو فحص content-stream. مناسبٌ حين يجب ألا يرى القراءُ العاديُّون النص — إرسال مسوَّدة، إخفاء أرقام حساباتٍ غير علنية عن زميل، تغطية رقم هاتفك في لقطةٍ. غيرُ مناسبٍ للنشر بموجب قوانين الشفافية، ولا للوثائق القضائية، ولا لأيِّ شيءٍ سيدقِّق فيه خصم.

كيف يعمل المطابقة

تُدخل نمطًا واحدًا أو أكثر. كلُّ نمطٍ يُبحَث كمطابقة whole-substring غيرِ حسَّاسةٍ لحالة الأحرف ضدَّ شظايا النصِّ داخل الـPDF. حين تحوي شظيةٌ نمطك، يُرسَم مستطيلٌ أسود فوق المستطيل المحيط (bounding-rect) الكامل للشظية.

عواقبُ عمليَّة:

  • مطابقةُ متَّصلٍ جزئي، لا كلمةٍ كاملة. النمطُ art يغطِّي «art» و«artist» و«smart» و«martin». اجعل الأنماطَ محدَّدةً بما يكفي — أسماءٌ كاملة، أرقامُ حساباتٍ كاملة، عناوينُ بريدٍ كاملة.
  • غيرُ حسَّاسٍ لحالة الأحرف. النمطُ Anna يغطِّي «Anna» و«anna» و«ANNA».
  • لا regex، لا أحرف بديلة. ما تكتبه هو التتابعُ الحرفيُّ الذي تُطابقه.
  • التغطيةُ بحسب الشظية. الـPDF يخزِّن النصَّ شظايا؛ المستطيلُ المرسوم يغطِّي شظيةً كاملة. إن أصاب نمطُك كلمةً في شظيةٍ تحوي نصًّا أكثر، يُغطَّى النصُّ المحيط أيضًا. عادةً هذا ما تريد؛ أحيانًا ترى المغطى أكثر من المتوقَّع.
  • الأنماطُ التي تعبر حدودَ الشظايا تَضيع. «أحمد محمد» شظيةٌ واحدة في بعض الـPDF، واثنتان في أخرى. إن كانت مفصولة، فلن يطابق النمطُ السلسلةَ المُلحَقة. أضِف الأجزاءَ كأنماطٍ منفصلة: أحمد محمد، محمد، أحمد.

للمستطيل الأسود حشوةٌ بقدرِ نقطةٍ واحدة حول المستطيل المحيط المكتشف — لمراعاة وضعِ المحارف على دقَّة subpixel، لئلا تطلَّ شرائطُ من النصِّ الأصلي عند الحواف.

ما المخفيُّ مقابل ما يبقى في الملف

هذا القسمُ أهمُّ من أيِّ آخر. المستطيلُ الأسود تعليمةُ رسم في content-stream الصفحة. والنصُّ الأصلي أيضًا في content-stream، تحته. قارئاتُ PDF تعرضهما بالترتيب: نصٌّ أوَّلًا، ثم مستطيلٌ فوقه، فينتصرُ المستطيلُ بصريًّا. لكنَّ النصَّ نفسه لا يُمحى.

ما يعنيه هذا عمليًّا:

  • النسخُ واللصق يستردُّ النصَّ الأصلي. اختيارُ المنطقة المنقَّحة في Adobe Reader ونسخها يعطيك الكلماتِ التي حاولتَ إخفاءها. المستطيلُ الأسود لا يُحدَّد، أمَّا النصُّ تحته فيُحدَّد.
  • محرِّكاتُ البحث تجد النص. إن رُفِع PDF المنقَّح إلى موقعٍ، يستخرج البحثُ بالاسم المنقَّح المستندَ إلى السطح.
  • إعادةُ الحفظ في أداة PDF أخرى قد تُبقي الطبقتين. بعضُ الأدوات تُعيد بناء content-stream فقد تُسقط التنقيحات؛ وأخرى تُبقيها.
  • الأدواتُ الجنائيَّة تستخرج الأصلَ بسهولة. أيُّ مُحلِّل PDF يستطيع تعدادَ كل content-streams النصِّ. والمستطيلُ مجرَّد رسمٍ منفصل.

للحالات التي يجب أن يذهب فيها النصُّ تحته فعلًا — منشوراتُ قوانين الشفافية، الأدلَّةُ في المحاكم، كلُّ ما يصل إلى خصم — تحتاج تدفُّقًا آخر: أعِد تصدير المستند المصدر مع حذف النصِّ الحسَّاس، أو حوِّل الصفحةَ إلى صورةٍ وأعد OCR (وهو ما يُزيل طبقةَ النصِّ نهائيًّا).

ما الذي ينجو وما لا

  • المحتوى المرئي للصفحات يبقى نفسه. كلُّ ما لم يطابق يبقى تمامًا كما كان — الخطوط نفسها، الإخراج نفسه، الصور نفسها.
  • الإشاراتُ المرجعية والتعليقات والروابط وحقولُ النموذج تنجو جميعها. المستطيلاتُ إضافاتٌ مرسومة؛ ولا يُعاد بناءُ غيرها.
  • النصُّ الأصلي يُحفَظ تحته. راجع القسمَ أعلاه. هذا القيدُ المركزي.
  • التواقيعُ الرقمية تُبطَل. أيُّ تعديلٍ على المستند، بما فيه إضافةُ المستطيلات، يكسر ربطَ التوقيع.
  • الـPDF المشفَّرة يجب فكُّها أوَّلًا. مرِّر عبر unlock-pdf بكلمة السرِّ قبل التنقيح.

إن بدا شيءٌ غير سليم

  • «At least one redaction pattern required». قائمةُ الأنماط كانت فارغة. أدخل كلمةً أو عبارةً واحدةً على الأقل.
  • طابق النمطُ لكنَّه غطَّى نصًّا أكثر من المتوقَّع. الـPDF خزَّن ذلك السطر شظيةً واحدة، والمستطيلُ بحسب الشظية. مقبولٌ غالبًا؛ إن كان مشكلةً، فلا بدَّ من إعادة تصدير المصدر بنصٍّ محذوفٍ بالطريقة الصحيحة.
  • لم يطابق النمطُ ما توقَّعت. ثلاثةُ أسبابٍ معتادة: (1) النصُّ في صورةٍ ممسوحة، لا في طبقة نص — الأداةُ لا ترى نصَّ الصورة؛ مارس OCR أوَّلًا عبر pdf-to-txt أو أداة مخصَّصة. (2) النمطُ يمتدُّ عبر شظايا — جزِّئه إلى أقصر. (3) الـPDF يستخدم محارفَ غير لاتينية بترميزٍ مكسور؛ النسخُ من العارض لرؤية ما هو موجودٌ فعلًا أسرعُ تشخيص.
  • نقَّحت لكنَّ زميلًا استخرج النصَّ بنسخٍ ولصقٍ. يعمل كما هو موثَّق — تنقيحٌ بصريٌّ فقط. للإزالة الفعليَّة أعد التصدير من المصدر.

ملاحظاتٌ عمليَّة

  1. استخدمه للإخفاء البصري، لا لسيناريوهات الخصومة. إخفاءُ اسمٍ في مسوَّدةٍ تُرسَل إلى صديقٍ لن يستخرج: حسن. إخفاءُ اسمٍ في مذكَّرةٍ قضائيَّةٍ سيُشغِّل فيها الطرفُ المقابل أدواتٍ جنائية: ليس بحسن.
  2. أنماطٌ محدَّدةٌ قبل العامَّة. نقِّح +966-11-555-0123، لا 0123. نقِّح [email protected]، لا jane. الأنماطُ المحدَّدة تُفرِط في التغطية أقلَّ وتخفي ما أردتَ بنفس القدر.
  3. تحقَّق بالنسخ. بعد التنقيح افتح النتيجةَ في عارضٍ، حدِّد المنطقةَ المنقَّحة، انسخ. إن خرج النصُّ الأصلي فقد أكَّدتَ القيد — تابع فقط إن كان الإخفاءُ البصريُّ كافيًا.
  4. للإزالة الدائمة، استخدم المصدر. إن كان المستندُ من Word، عدِّله وأعد التصدير. من قاعدة بيانات، استعلم مجدَّدًا بدون الحقول الحسَّاسة. أداةُ تنقيح PDF لحالات غياب المصدر.
  5. الملفُّ الأصلي يبقى دون مساس. ما تنزِّله PDF منقَّحٌ جديد؛ المصدرُ على القرص لا يتغيَّر.

ماذا يحدث لملفك

التنقيحُ يجري في متصفِّحك. الأنماطُ التي تكتبها ومحتوى الملف لا يغادران هذه التبويبة. افتح أدوات المطوِّر وراقب علامةَ التبويب Network أثناء العملية — لا طلباتٍ صادرة تحمل محتوى الملف أو الأنماط. يبقى الـPDF على القرص؛ والنسخةُ المنقَّحة تنزيلٌ جديدٌ بجواره.

الأسئلة الشائعة

أسئلة متكررة

هل سيُشذَّب كل تكرار؟

نعم — نمسح كل صفحة ونغطّي كل تطابق لكل نمط كتبته. لا يوجد وضع \"التكرار الأول فقط\"؛ التشذيب شامل بالتصميم.

هل هو تشذيب على مستوى الطب الشرعي؟

لا. الإصدار الأولي يضع مستطيلات معتمة على كل تطابق — بصرياً مشذّب، لكن النص الأساسي لا يزال في تيار PDF. للتشذيب الجنائي (إزالة النص نهائياً من الملف، وليس مجرد إخفائه)، استخدم أداة سطح مكتب مثل Adobe Acrobat Pro. نحن صريحون بشأن هذا التنازل لتقرر بنفسك.

لماذا التشذيب البصري إذن؟

لمعظم حالات الاستخدام — مشاركة عقد نموذجي، إخفاء رقم هاتف من لقطة شاشة، إخفاء أسماء في معرض أعمال — التشذيب البصري كافٍ وأسرع من تشغيل Acrobat. فقط لا تستخدمه لمستندات سيستخرج منها الخصم النص.

هل يمكنني تشذيب منطقة محددة بدلاً من نص؟

تشذيب اختيار المنطقة (سحب مستطيل على الصفحة) موجود في خارطة الطريق. الإصدار الحالي يعتمد على الكتابة للبحث، وهو رائع لرسائل البريد الإلكتروني والأسماء وأرقام الهواتف وأي نمط قائم على السلاسل.

إلى أين يذهب ملفي؟

إلى لا مكان. يحدث التشذيب بالكامل داخل علامة التبويب هذه. يمكن التحقق في DevTools ← Network: لا يحدث رفع.