ضغط PDF في 2026: ما يعمل فعلًا
لماذا تنكمش بعض ملفات PDF بنسبة 90% بينما بالكاد تتحرك أخرى. دليل عملي لمستويات الضغط، ما يُحذف، ومتى تستخدم ماذا.
تفلت ملف PDF بحجم 25 ميجابايت في ضاغط، تتوقع ملفًا صغيرًا، وتحصل على… 24 ميجابايت. لماذا؟
لأن ضغط PDF ليس شيئًا واحدًا — إنه نصف دزينة من التقنيات المطبقة على نصف دزينة من أنواع البيانات داخل الملف. بعض ملفات PDF نصوص في الغالب (صغيرة بالفعل). بعضها صور في الغالب (الكثير من المكاسب). بعضها يحتوي على ركام غير مرئي (مكاسب سهلة). هذا المقال يشرح ما يحرك الإبرة فعلًا، حتى تستطيع توقّع النتيجة قبل النقر على ضغط.
ما هو فعلًا داخل PDF
ملف PDF شجرة من الكائنات. بعض الكائنات هي:
- تدفقات النصوص — صغيرة بالفعل ؛ رواية من 100 صفحة ربما 500 كيلوبايت. ضغط النص لا يكسب شيئًا تقريبًا.
- الرسوم المتجهة — مخططات وشعارات. صغيرة جدًا.
- الصور المضمّنة — صور وملفات ممسوحة وتوقيعات. شبه دائمًا أكبر العناصر في الملف.
- الخطوط المضمّنة — عادة 100 كيلوبايت إلى 1 ميجابايت لكل خط ؛ PDF كثيف الخطوط قد يحتوي عدة خطوط.
- البيانات الوصفية — XMP، علامات لإمكانية الوصول، تعريفات النماذج. عادة صغيرة.
إذا كان حجم PDF لديك 50 ميجابايت، يمكنك المراهنة أن 95% منه صور. الشيء الوحيد الذي يغيّر حجم الملف بشكل ملموس هو ما تفعله بهذه الصور.
ما يفعله ضاغطنا
ضغط PDF يمشي عبر PDF، يجد كل XObject صورة، ويعيد ضغطها. ثلاثة مستويات:
- شديد: إعادة ترميز كل صورة كـ JPEG بجودة 50، هدف 96 PPI.
- موصى به: JPEG جودة 70، هدف 150 PPI.
- أقل ضغطًا: JPEG جودة 85، هدف 220 PPI.
PPI (بكسل لكل بوصة) مهم لأن معظم الصور «عالية الدقة» في ملفات PDF التُقطت بدقة الطباعة (300 PPI) بينما 96 PPI كافية للشاشات. تنصيف الدقة الخطية يقسم عدد البكسل على أربعة قبل أي فقدان بفعل JPEG.
النص والخطوط والرسوم المتجهة والبنية تمر دون لمس. لا شيء معروض على الشاشة يختفي.
ما نزيله (وما لا نزيله)
افتراضيًا في المستوى الشديد، نُسقط أيضًا بيانات XMP الوصفية — الإدخالات غير المرئية «المؤلف / العنوان / الموضوع» التي يكتبها Adobe عند التصدير. على ملفات PDF حقيقية من Adobe، هذا وحده غالبًا 1–5 كيلوبايت لكل صفحة (نعم، كيلوبايت — XMP في PDF مسهب).
نحن لا نزيل:
- حقول النماذج — النماذج القابلة للملء تستمر بالعمل.
- الروابط والإشارات المرجعية — لا تزال قابلة للنقر.
- البنية الموسومة (شجرة الوصول) — توافق قارئ الشاشة محفوظ في المستويين «موصى به» و «أقل ضغطًا». تُسقط في «شديد» فقط.
- البيانات التي أدخلها المستخدم في النموذج بالفعل.
المستوى الشديد يحذف شجرة البنية لأن بالنسبة لكثير من المستخدمين، يحتاج الملف فقط أن يكون صغيرًا بما يكفي للبريد الإلكتروني — بيانات إمكانية الوصول التي لا يستخدمونها يمكن أن تذهب.
توقعات واقعية
| نوع PDF المصدر | شديد | موصى به | أقل ضغطًا |
|---|---|---|---|
| صفحات كتاب ممسوحة (300 PPI رمادي) | 80–90% أصغر | 60% | 30% |
| تقرير كثيف الصور | 70% | 50% | 25% |
| مستند عمل مختلط | 40–60% | 30% | 15% |
| نص خالص (رواية، RFC) | 0–5% | 0% | 0% |
| PDF محسّن بالفعل | 5–15% | 0% | 0% |
إذا ضغطت في «موصى به» وبالكاد وفّرت شيئًا، فالأرجح أن PDF لديك كان محسنًا بالفعل عند التصدير. لا توجد سحر يتفوق على JPEG بجودة 70% بالفعل.
متى لا تضغط
- الطباعة: إذا كنت ستطبع PDF، اتركه بدقة عالية. الضغط المضبوط للشاشة يبدو ضبابيًا على الورق.
- الأرشفة: مستندات PDF/A لا ينبغي إعادة ترميزها. استخدم أدوات متوافقة مع PDF/A، ليس ضاغطًا عامًا.
- إعادة التحرير لاحقًا: إذا كان شخص سيشغّل OCR على النتيجة، فبكسلات أكثر = تعرف نص أفضل.
الخصوصية
كل شيء يعمل محليًا. PDF لديك يُحلَّل في متصفحك، لا يُرفع أبدًا. ينطبق نفس الشيء على جميع أدواتنا المجانية — خصوصية الملف هي السبب الوحيد لفعل هذا في JS بدلًا من خادم.
جرّب ضاغط PDF — ألصق ملفك وانظر ما يفعل عليه.