دليل OCR للـ PDF
افتح scantext.net/ar/tools/pdf-ocr، ارفع الـ PDF، وScanText يقرأ الصفحة الأولى في المتصفح عند الإمكان — مجاني وبدون حساب. انسخ النص أو حمّل TXT/DOCX؛ المسح الأوضح الاختياري يحذف الملفات خلال نحو 60 ثانية.
📌 يونيو 2026 — فريق ScanText
عندك عقد أو فاتورة أو محاضرة بصيغة PDF ممسوحة، والنص محبوس داخل الصورة — النسخ العادي ما يطلع شيء مفيد. إعادة الكتابة يدوياً لصفحة كاملة متعبة. OCR للـ PDF يقرأ شكل الحروف في الصفحة ويحوّلها لنص تقدر تبحث فيه وتلصقه في الإيميل أو Word. ScanText على scantext.net مصمم لاستخراج نص سريع وصادق. أداة pdf-ocr مجانية بدون تسجيل، تعمل في المتصفح أولاً للخصوصية، وتصدّر TXT أو DOCX لما تحتاج ملف. في v1 نكون واضحين: هذا OCR للصفحة الأولى / صفحة واحدة، مو دفعة كاملة لكل الصفحات بعد. كثير ناس يحتاجون صفحة حرجة من ملف 40 صفحة — والتجربة تبقى سريعة على اللابتوب والجوال بدون اشتراك Pro. هالدليل يشرح وش pdf-ocr يقدم اليوم، الفرق بين وضع المتصفح والمسح الأوضح، متى تستخدم pdf-to-image أو image-to-text، وأخطاء شائعة تضيّع وقتك على المسح الضبابي.
كيف أستخرج نصاً من PDF ممسوح مجاناً؟
الـ PDF الممسوح في الأصل صور لورق. OCR يتعرّف على الحروف في الصور ويطلع نص عادي. تجارب مجانية ومواقع سحابية تخفي حدود الصفحات خلف حسابات؛ ScanText يبقي المسار الأساسي مفتوح على scantext.net بدون تسجيل.
الخطوات: افتح صفحة pdf-ocr، ارفع الملف، اختر لغة المستند (تلقائي يناسب العربي–الإنجليزي المختلط)، وشغّل OCR. راجع المعاينة قبل النسخ — OCR يخلط حروف متشابهة في المسح منخفض الدقة. لصفحة واحدة عاجلة غالباً يكفي. إذا تحتاج صفحة 5 من ملف طويل، صدّر أو قسّم الصفحة بـ pdf-to-image ثم OCR للصورة، أو حضّر PDF بصفحة واحدة وشغّل pdf-ocr من جديد.
نصيحة عملية: صدّر الصفحة بـ 300 DPI إذا برنامج الماسح يدعم. تجنّب تصوير الشاشة بالجوال إلا للضرورة — أنماط البكسل تخرب الدقة. قص الهوامش عشان الترويسات ما تسرق تركيز المحرك عن الفقرة المطلوبة.
هل ScanText يقرأ كل الـ PDF ولا الصفحة الأولى بس؟
بصراحة: في v1 يركّز pdf-ocr على الصفحة الأولى من الملف — OCR لصفحة واحدة. ما نعد بدمج 30 صفحة بضغطة واحدة لأن الأداة ما تشحن هالشي اليوم. مواقع منافسة تعلن صفحات غير محدودة لكن تفرض اشتراكاً لـ DOCX أو الخصوصية؛ ScanText يقول الحد مقدماً عشان تخطط.
مع الملفات متعددة الصفحات: شغّل OCR لكل صفحة على حدة، أو استخدم pdf-to-image لسحب صفحة 2 و3 وهكذا، أو انسخ مباشرة من PDF رقمي فيه نص قابل للتحديد. إذا شغلك أسبوعياً حزم 20 صفحة، أداة دفعة على سطح المكتب قد تستحق — ScanText يبرز لما تحتاج صفحة واحدة الآن في المتصفح بدون تثبيت.
وش يعني OCR في المتصفح أولاً ومتى أحتاج «مسح أوضح»؟
المعالجة في المتصفح هي قصة الخصوصية الافتراضية. لما جهازك يدعمها، OCR يشتغل محلياً وصفحة الـ PDF غالباً ما تطلع من جهازك. مهم لنماذج ضريبية، ملخصات طبية، وعقود موقّعة ما ترفعها لسيرفر عشوائي.
«مسح أوضح» للحالات الصعبة — مسح باهت، علامة مائية، ختم فوق النص. صفحة واحدة قد تمر على الـ API عبر HTTPS؛ ما تُستخدم للتدريب، والنسخ المؤقتة تُحذف خلال نحو 60 ثانية. للبيانات المنظمة جداً، خلّ الوضع الافتراضي واقرأ دليل الخصوصية على ScanText إذا تحتاج تفاصيل للمراجعة.
كيف أصدّر نص OCR إلى TXT أو Word؟
بعد ما يخلص OCR عندك ثلاث خيارات. انسخ للحافظة — للسلاك أو Google Docs. حمّل TXT — للأرشيف والبحث. حمّل DOCX — لما الزميل يبي ملف Word حقيقي، مو صورة داخل مستند.
التنسيق البصري ما ينتقل. الأعمدة والجداول من المسح تصير سطور نص. هذا اللي غالباً يبحث عنه «PDF إلى نص» — البند، المبلغ، الاقتباس. للعربي أو الهندي، تأكد من اتجاه النص في المعاينة قبل التصدير؛ jpg-to-word مفيد إذا بدأت من صورة مصدّرة مو PDF.
ما الأخطاء الشائعة عند استخراج نص من PDF؟
**خطأ 1 — توقع دفعة كاملة في v1.** رفع ملف 50 صفحة وتوقع تصدير الكل مرة واحدة يحبطك. خطّط لصفحة واحدة أو قسّم أولاً.
**خطأ 2 — صورة شاشة بالجوال.** الوهج وشبكة البكسل تدمر الدقة. أعد المسح أو صدّر PDF صحيح.
**خطأ 3 — لغة خاطئة.** تلقائي للنص المختلط؛ عربية أو روسية ثابتة أفضل لما تعرف اللغة.
**خطأ 4 — ملف محمي بكلمة مرور.** إذا العارض ما يفتح الملف بدون كلمة مرور، OCR ما يقدر أيضاً.
**خطأ 5 — تخطي المعاينة.** الأرقام القانونية تحتاج نظرة بشرية قبل الإرسال.
**خطأ 6 — نسيان النص الرقمي.** إذا تقدر تحدد النص في الـ PDF أصلاً، انسخ مباشرة — OCR للصفحات الصورية فقط.
لتقنيات أعمق على الصور واللقطات، راجع كيف تستخرج النص من صورة. إذا عندك JPEG لصفحة واحدة، image-to-text وjpg-to-word أدوات شقيقة تستحق الحفظ.
خلاصة
OCR للـ PDF لازم يكون سريع ومجاني وصادق بالحدود. pdf-ocr على scantext.net يعطيك استخراج الصفحة الأولى بخصوصية المتصفح أولاً، ومسح أوضح اختياري للمسح الصعب، وتصدير TXT/DOCX بست لغات — بدون تسجيل. حضّر صفحة نظيفة، اختر اللغة، راجع المعاينة، واستخدم pdf-to-image لما تحتاج صفحة 2 وما بعدها. النتيجة نص قابل للنسخ من PDF ممسوح بدون إعادة كتابة الصفحة اللي تهمك.
الأدوات
الدليل
FAQ
- ارفع الملف إلى pdf-ocr، شغّل OCR على الصفحة الأولى، ثم انسخ أو حمّل TXT/DOCX. بدون تسجيل وبدون تثبيت برنامج.
بدون حساب · بدون تثبيت
PDF إلى نص (OCR)
ScanText OCR →