OCR

تطبيق OCR على الصور ولقطات الشاشة: استخرج النص من أي صورة

صورة لقائمة طعام بلغة أخرى، أو نموذج ضريبي ممسوح ضوئيًا، أو لقطة شاشة لرسالة خطأ طويلة — يحوّل الـ OCR كل ذلك إلى نص قابل للتحديد والبحث والتحرير. إليك متى تستخدم كل نوع من أنواع الـ OCR.

فريق Pixoate6 دقيقة قراءة

OCR — التعرّف الضوئي على الحروف — هو التقنية التي تحوِّل صورة النص إلى نص فعلي. كانت في السابق بطيئة وعُرضة للأخطاء ومضبوطة للمسوحات النظيفة بأحرف سوداء على خلفية بيضاء. أما OCR الحديث فيتعامل مع لقطات الشاشة وصور الهاتف والقوائم متعددة اللغات والملاحظات المكتوبة بخط اليد والإيصالات الباهتة. والجزء المثير للاهتمام ليس فيما إذا كان عليك استخدام OCR — بل أي وضع من أوضاع OCR تستخدم، لأن الاختيار الخاطئ هو السبب الأكثر شيوعًا للحصول على نتائج سيئة.

الحالات الخمس الشائعة والأداة المناسبة لكل منها

1. لقطة شاشة، وتريد النص الخام منها

رسائل الأخطاء، ومقاطع الكود، وسجلات المحادثات — تريد النص ولا يهمك التنسيق. استخدم تحويل الصورة إلى نص والصق النتيجة. يعمل مع لقطات شاشة الوضع الداكن، وصور الهاتف الضبابية لشاشات الحاسوب المحمول، وأي شيء يمكنك قراءته.

2. صورة لجدول

صورة بالهاتف لجدول بيانات مطبوع، أو لقطة شاشة لجدول على الويب، أو مسح ضوئي لتقرير مطبوع. لا تستخدم OCR للنص العادي — فستنهار الأعمدة. استخدم الصورة إلى Excel للحصول على جدول بيانات منسّق، أو الصورة إلى CSV للبيانات الخام. يكتشف كلاهما شبكة الجدول ويحافظ على الصفوف والأعمدة.

إذا كانت الصورة بالفعل لقطة شاشة نظيفة لجدول، فإن الصورة إلى HTML يمنحك عناصر <table> حقيقية يمكنك إدراجها في صفحة ويب أو تحويلها أكثر باستخدام الجدول إلى JSON.

3. صورة لمستند يحتوي على عناوين وبنية

مقال مجلة أو تقرير مطبوع أو عقد متعدد الصفحات. يفقد OCR النص العادي البنية. استخدم تحويل الصورة إلى Word أو تحويل الصورة إلى Markdown. يمنحك Word ملف ‎.docx يمكنك متابعة تحريره؛ وMarkdown أفضل إذا كان النص متجهًا إلى wiki أو README أو تطبيق ملاحظات.

4. نص بلغة لا تستطيع قراءتها

صورة لقائمة طعام في طوكيو، أو لافتة في القاهرة، أو ملصق في ستوكهولم. لا تُجرِ الـ OCR ثم تترجم يدويًا — استخدم مترجم الصور الذي يجمع بين الـ OCR والترجمة في خطوة واحدة. يخرج النص الأصلي والترجمة، ويتعرّف على نحو 60 لغة.

5. الملاحظات المكتوبة بخط اليد

صور السبّورة البيضاء وصفحات اليوميات وملاحظات المحاضرات. تفشل تقنية OCR العامة مع الخط المتصل — استخدم OCR للخط اليدوي المُحسَّنة للخط اليدوي المتصل والمشوَّش والكتابة البشرية الحقيقية. وتعمل على أفضل وجه مع الحبر الداكن على ورق سادة؛ وكلما زاد التباين، تحسّنت النتيجة.

حالة خاصة واحدة: ملفات PDF الممسوحة التي يجب أن تبقى ملفات PDF

إذا كان لديك ملف PDF ممسوح ضوئيًا تريد إبقاءه بصيغة PDF لكن جعله قابلًا للبحث — لنقل، عقدًا ممسوحًا تحتاج إلى البحث فيه عن بند — فلا تحوّله إلى Word. استخدم PDF قابل للبحث: فهو يضيف طبقة نص مخفية فوق الصورة بحيث يظل ملف PDF يبدو كمسح ضوئي لكن يعمل فيه Ctrl-F والبحث داخل PDF. كما يتيح لك هذا ضغط طبقة الصورة بقوة بعد ذلك دون فقدان النص.

احصل على نتائج OCR أفضل: ثلاث قواعد

  1. التباين هو الملك. يُقرأ الحبر الأسود على خلفية بيضاء بدقة شبه تامة. أما الحبر الباهت والخلفيات المزدحمة والورق المزخرف فكلها تضرّ بالنتيجة. إن كان التقاط الصورة بيدك، فالتقطها بإضاءة مسطّحة ومتساوية مع امتلاء الإطار بالمستند.
  2. المستقيم أفضل من المائل. تصحّح محركات الـ OCR الانحراف الطفيف تلقائيًا، لكن اللقطات المائلة (الملتقطة من عبر المكتب) تفقد الدقة. أمسك الكاميرا موازية للصفحة.
  3. الدقة مهمة إلى حدّ معين. ما يعادل 300 DPI تقريبًا هو النقطة المثلى — أي صورة بعرض 2000 بكسل لصفحة A4. الدقة الأعلى تجعل الـ OCR أبطأ دون أن تجعله أكثر دقة.

تطبيقات OCR متخصّصة ربما لم تكن تعلم بوجودها

  • الإيصالات — استخرج المورّد والإجمالي والضريبة والتاريخ والبنود كملف JSON باستخدام مستخرج الإيصالات. مصمَّم خصيصًا لتقارير المصروفات ومسك الدفاتر.
  • بطاقات العمل — أنشئ ملف vCard جاهزًا للاستيراد إلى جهات الاتصال باستخدام ماسح بطاقات العمل. يوقف تكدّس بطاقات المؤتمرات وتراكمها على مكتبك.

يُعد OCR من أكثر الأدوات تأثيرًا في صندوق أدواتك — فما يستغرق خمس دقائق من قراءة صورة يمكن أن يتحول إلى خمس ثوانٍ. اختر الوضع المناسب للموقف وتخرج النتائج قابلة للتحرير بنظافة من المحاولة الأولى.

قد يعجبك أيضاً