ਚਿੱਤਰਾਂ ਅਤੇ ਸਕ੍ਰੀਨਸ਼ਾਟਾਂ ਨੂੰ OCR ਕਰੋ: ਕਿਸੇ ਵੀ ਤਸਵੀਰ ਵਿੱਚੋਂ ਟੈਕਸਟ ਕੱਢੋ
ਕਿਸੇ ਹੋਰ ਭਾਸ਼ਾ ਵਿੱਚ ਮੀਨੂ ਦੀ ਫੋਟੋ, ਇੱਕ ਸਕੈਨ ਕੀਤਾ ਟੈਕਸ ਫ਼ਾਰਮ, ਇੱਕ ਲੰਮੇ ਗ਼ਲਤੀ ਸੁਨੇਹੇ ਦਾ ਸਕ੍ਰੀਨਸ਼ਾਟ — OCR ਇਹਨਾਂ ਸਭ ਨੂੰ ਚੁਣਨਯੋਗ, ਖੋਜਣਯੋਗ, ਸੰਪਾਦਨਯੋਗ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲ ਦਿੰਦਾ ਹੈ। ਇੱਥੇ ਦੱਸਿਆ ਹੈ ਕਿ ਕਿਹੜਾ OCR ਰੂਪ ਕਦੋਂ ਵਰਤਣਾ ਹੈ।
OCR — ਆਪਟੀਕਲ ਕੈਰੇਕਟਰ ਰੀਕਗਨੀਸ਼ਨ — ਉਹ ਤਕਨਾਲੋਜੀ ਹੈ ਜੋ ਟੈਕਸਟ ਦੀ ਤਸਵੀਰ ਨੂੰ ਅਸਲ ਟੈਕਸਟ ਵਿੱਚ ਬਦਲ ਦਿੰਦੀ ਹੈ। ਪਹਿਲਾਂ ਇਹ ਹੌਲੀ, ਗ਼ਲਤੀ-ਪ੍ਰਵਣ, ਅਤੇ ਸਾਫ਼ ਚਿੱਟੇ ਉੱਤੇ ਕਾਲੇ ਸਕੈਨਾਂ ਲਈ ਟਿਊਨ ਕੀਤੀ ਹੁੰਦੀ ਸੀ। ਆਧੁਨਿਕ OCR ਸਕ੍ਰੀਨਸ਼ਾਟ, ਫ਼ੋਨ ਫੋਟੋਆਂ, ਬਹੁ-ਭਾਸ਼ਾਈ ਮੀਨੂ, ਹੱਥ-ਲਿਖਤ ਨੋਟ ਅਤੇ ਫਿੱਕੀਆਂ ਰਸੀਦਾਂ ਨੂੰ ਸੰਭਾਲ ਲੈਂਦਾ ਹੈ। ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਨਹੀਂ ਕਿ OCR ਵਰਤਣਾ ਹੈ ਜਾਂ ਨਹੀਂ — ਇਹ ਹੈ ਕਿ ਕਿਹੜਾ OCR ਮੋਡ ਵਰਤਣਾ ਹੈ, ਕਿਉਂਕਿ ਗ਼ਲਤ ਚੋਣ ਕਰਨਾ ਮਾੜੇ ਨਤੀਜੇ ਮਿਲਣ ਦਾ ਸਭ ਤੋਂ ਆਮ ਕਾਰਨ ਹੈ।
ਪੰਜ ਆਮ ਸਥਿਤੀਆਂ ਅਤੇ ਹਰੇਕ ਲਈ ਸਹੀ ਟੂਲ
1. ਇੱਕ ਸਕ੍ਰੀਨਸ਼ਾਟ, ਅਤੇ ਤੁਸੀਂ ਸਾਦਾ ਟੈਕਸਟ ਚਾਹੁੰਦੇ ਹੋ
ਗ਼ਲਤੀ ਸੁਨੇਹੇ, ਕੋਡ ਸਨਿੱਪਟ, ਚੈਟ ਲੌਗ — ਤੁਹਾਨੂੰ ਟੈਕਸਟ ਚਾਹੀਦਾ ਹੈ, ਫਾਰਮੈਟਿੰਗ ਦੀ ਪਰਵਾਹ ਨਹੀਂ। image to text ਵਰਤੋ ਅਤੇ ਨਤੀਜਾ ਪੇਸਟ ਕਰੋ। ਡਾਰਕ ਮੋਡ ਸਕਰੀਨਸ਼ਾਟਾਂ, ਲੈਪਟਾਪ ਸਕਰੀਨਾਂ ਦੀਆਂ ਧੁੰਦਲੀਆਂ ਫ਼ੋਨ ਫੋਟੋਆਂ, ਜੋ ਵੀ ਤੁਸੀਂ ਪੜ੍ਹ ਸਕਦੇ ਹੋ, ਉਸ ਉੱਤੇ ਕੰਮ ਕਰਦਾ ਹੈ।
2. ਕਿਸੇ ਟੇਬਲ ਦੀ ਫੋਟੋ
ਛਪੀ ਹੋਈ ਸਪ੍ਰੈੱਡਸ਼ੀਟ ਦੀ ਫ਼ੋਨ ਫੋਟੋ, ਵੈੱਬ ਟੇਬਲ ਦਾ ਸਕ੍ਰੀਨਸ਼ੌਟ, ਛਪੀ ਹੋਈ ਰਿਪੋਰਟ ਦਾ ਸਕੈਨ। ਸਾਦਾ ਟੈਕਸਟ OCR ਨਾ ਵਰਤੋ — ਕਾਲਮ ਟੁੱਟ ਜਾਣਗੇ। ਸਜਾਈ ਹੋਈ ਸਪ੍ਰੈੱਡਸ਼ੀਟ ਲਈ image to Excel ਵਰਤੋ, ਜਾਂ ਕੱਚੇ ਡੇਟਾ ਲਈ image to CSV ਵਰਤੋ। ਦੋਵੇਂ ਟੇਬਲ ਗ੍ਰਿੱਡ ਦੀ ਪਛਾਣ ਕਰਦੇ ਹਨ ਅਤੇ ਕਤਾਰਾਂ ਤੇ ਕਾਲਮਾਂ ਨੂੰ ਸੰਭਾਲ ਕੇ ਰੱਖਦੇ ਹਨ।
ਜੇ ਫੋਟੋ ਪਹਿਲਾਂ ਹੀ ਇੱਕ ਸਾਫ਼ ਟੇਬਲ ਸਕ੍ਰੀਨਸ਼ਾਟ ਹੈ, ਤਾਂ ਇਮੇਜ ਤੋਂ HTML ਤੁਹਾਨੂੰ ਅਸਲ <table> ਐਲੀਮੈਂਟ ਦਿੰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੁਸੀਂ ਕਿਸੇ ਵੈੱਬ ਪੰਨੇ ਵਿੱਚ ਪਾ ਸਕਦੇ ਹੋ ਜਾਂ ਟੇਬਲ ਤੋਂ JSON ਨਾਲ ਹੋਰ ਅੱਗੇ ਬਦਲ ਸਕਦੇ ਹੋ।
3. ਸਿਰਲੇਖਾਂ ਅਤੇ ਢਾਂਚੇ ਵਾਲੇ ਕਿਸੇ ਦਸਤਾਵੇਜ਼ ਦੀ ਫੋਟੋ
ਮੈਗਜ਼ੀਨ ਲੇਖ, ਛਪੀ ਰਿਪੋਰਟ, ਬਹੁ-ਪੰਨਾ ਇਕਰਾਰਨਾਮਾ। ਸਾਦਾ ਟੈਕਸਟ OCR ਢਾਂਚਾ ਗੁਆ ਦਿੰਦਾ ਹੈ। image to Word ਜਾਂ image to Markdown ਵਰਤੋ। Word ਤੁਹਾਨੂੰ ਇੱਕ .docx ਦਿੰਦਾ ਹੈ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਅੱਗੇ ਸੰਪਾਦਿਤ ਕਰ ਸਕਦੇ ਹੋ; ਜੇ ਟੈਕਸਟ ਕਿਸੇ ਵਿਕੀ, README, ਜਾਂ ਨੋਟਸ ਐਪ ਵਿੱਚ ਜਾ ਰਿਹਾ ਹੈ ਤਾਂ Markdown ਬਿਹਤਰ ਹੈ।
4. ਅਜਿਹੀ ਭਾਸ਼ਾ ਵਿੱਚ ਟੈਕਸਟ ਜੋ ਤੁਸੀਂ ਪੜ੍ਹ ਨਹੀਂ ਸਕਦੇ
ਟੋਕੀਓ ਵਿੱਚ ਮੀਨੂ ਦੀ ਫੋਟੋ, ਕਾਇਰੋ ਵਿੱਚ ਕੋਈ ਸਾਈਨ, ਸਟਾਕਹੋਮ ਵਿੱਚ ਕੋਈ ਲੇਬਲ। OCR ਕਰਕੇ ਫਿਰ ਹੱਥੀਂ ਅਨੁਵਾਦ ਨਾ ਕਰੋ — image translator ਵਰਤੋ ਜੋ OCR + ਅਨੁਵਾਦ ਨੂੰ ਇੱਕੋ ਕਦਮ ਵਿੱਚ ਜੋੜਦਾ ਹੈ। ਇਹ ਮੂਲ ਟੈਕਸਟ, ਅਨੁਵਾਦ ਦਿੰਦਾ ਹੈ, ਅਤੇ ~60 ਭਾਸ਼ਾਵਾਂ ਪਛਾਣਦਾ ਹੈ।
5. ਹੱਥ-ਲਿਖਤ ਨੋਟ
ਵ੍ਹਾਈਟਬੋਰਡ ਫੋਟੋਆਂ, ਜਰਨਲ ਪੰਨੇ, ਲੈਕਚਰ ਨੋਟਸ। ਆਮ OCR ਜੋੜਵੀਂ ਲਿਖਾਈ (cursive) ਉੱਤੇ ਅਸਫ਼ਲ ਹੋ ਜਾਂਦਾ ਹੈ — ਹੱਥ-ਲਿਖਤ OCR ਵਰਤੋ ਜੋ ਜੁੜੀ, ਅਟਪਟੀ, ਅਸਲ-ਮਨੁੱਖੀ ਹੱਥ-ਲਿਖਤ ਲਈ ਟਿਊਨ ਕੀਤਾ ਗਿਆ ਹੈ। ਸਾਦੇ ਕਾਗਜ਼ ਉੱਤੇ ਗੂੜ੍ਹੀ ਸਿਆਹੀ ਨਾਲ ਸਭ ਤੋਂ ਵਧੀਆ ਕੰਮ ਕਰਦਾ ਹੈ; ਜਿੰਨਾ ਵੱਧ ਕੰਟਰਾਸਟ, ਉਨਾ ਹੀ ਵਧੀਆ ਨਤੀਜਾ।
ਇੱਕ ਖ਼ਾਸ ਮਾਮਲਾ: ਸਕੈਨ ਕੀਤੀਆਂ PDF ਜਿਨ੍ਹਾਂ ਨੂੰ PDF ਹੀ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ
ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਇੱਕ ਸਕੈਨ ਕੀਤੀ PDF ਹੈ ਜਿਸ ਨੂੰ ਤੁਸੀਂ PDF ਵਜੋਂ ਰੱਖਣਾ ਪਰ ਖੋਜਣਯੋਗ ਬਣਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ — ਮੰਨ ਲਓ, ਇੱਕ ਸਕੈਨ ਕੀਤਾ ਇਕਰਾਰਨਾਮਾ ਜਿਸ ਵਿੱਚ ਤੁਹਾਨੂੰ ਕੋਈ ਧਾਰਾ ਲੱਭਣੀ ਹੈ — ਤਾਂ ਇਸ ਨੂੰ Word ਵਿੱਚ ਨਾ ਬਦਲੋ। ਖੋਜਣਯੋਗ PDF ਵਰਤੋ: ਇਹ ਇਮੇਜ ਉੱਤੇ ਇੱਕ ਛੁਪੀ ਟੈਕਸਟ ਲੇਅਰ ਜੋੜਦਾ ਹੈ ਤਾਂ ਜੋ PDF ਫਿਰ ਵੀ ਸਕੈਨ ਵਾਂਗ ਦਿਖੇ ਪਰ Ctrl-F ਅਤੇ PDF ਖੋਜ ਕੰਮ ਕਰਨ। ਇਹ ਤੁਹਾਨੂੰ ਬਾਅਦ ਵਿੱਚ ਟੈਕਸਟ ਗੁਆਏ ਬਿਨਾਂ ਇਮੇਜ ਲੇਅਰ ਨੂੰ ਜ਼ੋਰਦਾਰ ਢੰਗ ਨਾਲ ਕੰਪ੍ਰੈਸ ਕਰਨ ਦੀ ਵੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।
ਬਿਹਤਰ OCR ਨਤੀਜੇ ਪਾਓ: ਤਿੰਨ ਨਿਯਮ
- ਕੰਟ੍ਰਾਸਟ ਹੀ ਸਭ ਤੋਂ ਅਹਿਮ ਹੈ। ਚਿੱਟੇ ਪਿਛੋਕੜ ਉੱਤੇ ਕਾਲੀ ਸਿਆਹੀ ਲਗਭਗ ਮੁਕੰਮਲ ਤਰ੍ਹਾਂ ਪੜ੍ਹੀ ਜਾਂਦੀ ਹੈ। ਫਿੱਕੀ ਸਿਆਹੀ, ਭਰੇ ਪਿਛੋਕੜ ਅਤੇ ਨਮੂਨੇ ਵਾਲਾ ਕਾਗ਼ਜ਼ — ਇਹ ਸਭ ਨੁਕਸਾਨ ਪਹੁੰਚਾਉਂਦੇ ਹਨ। ਜੇ ਫੋਟੋ ਤੁਹਾਡੇ ਹੱਥ ਵੱਸ ਹੈ, ਤਾਂ ਇਸਨੂੰ ਸਮਤਲ, ਇੱਕਸਾਰ ਰੌਸ਼ਨੀ ਵਿੱਚ ਖਿੱਚੋ ਜਿੱਥੇ ਦਸਤਾਵੇਜ਼ ਪੂਰੇ ਫ੍ਰੇਮ ਨੂੰ ਭਰ ਦੇਵੇ।
- ਸਿੱਧਾ, ਟੇਢੇ ਨਾਲੋਂ ਬਿਹਤਰ ਹੈ। OCR ਇੰਜਣ ਥੋੜ੍ਹੇ ਜਿਹੇ ਟੇਢੇਪਣ ਨੂੰ ਆਪੇ ਠੀਕ ਕਰ ਲੈਂਦੇ ਹਨ, ਪਰ ਝੁਕੀਆਂ ਫੋਟੋਆਂ (ਮੇਜ਼ ਦੇ ਪਾਰੋਂ ਖਿੱਚੀਆਂ) ਸਟੀਕਤਾ ਗੁਆ ਦਿੰਦੀਆਂ ਹਨ। ਕੈਮਰੇ ਨੂੰ ਪੰਨੇ ਦੇ ਸਮਾਨਾਂਤਰ ਫੜੋ।
- ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਇੱਕ ਹੱਦ ਤੱਕ ਹੀ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ। ਲਗਭਗ 300 DPI ਦੇ ਬਰਾਬਰ ਸਭ ਤੋਂ ਵਧੀਆ ਥਾਂ ਹੈ — ਯਾਨੀ A4 ਪੰਨੇ ਦੀ 2000-ਪਿਕਸਲ ਤਸਵੀਰ। ਇਸ ਤੋਂ ਵੱਧ ਰੈਜ਼ੋਲਿਊਸ਼ਨ OCR ਨੂੰ ਹੋਰ ਸਟੀਕ ਬਣਾਏ ਬਿਨਾਂ ਹੌਲੀ ਕਰ ਦਿੰਦਾ ਹੈ।
ਵਿਸ਼ੇਸ਼ OCR ਜਿਸ ਬਾਰੇ ਸ਼ਾਇਦ ਤੁਹਾਨੂੰ ਪਤਾ ਨਾ ਹੋਵੇ ਕਿ ਇਹ ਮੌਜੂਦ ਹੈ
- ਰਸੀਦਾਂ — receipt extractor ਨਾਲ ਵਿਕਰੇਤਾ, ਕੁੱਲ, ਟੈਕਸ, ਮਿਤੀ ਅਤੇ ਲਾਈਨ ਆਈਟਮਾਂ ਨੂੰ JSON ਵਜੋਂ ਕੱਢੋ। ਖ਼ਾਸ ਤੌਰ ਉੱਤੇ ਖ਼ਰਚ ਰਿਪੋਰਟਾਂ ਅਤੇ ਹਿਸਾਬ-ਕਿਤਾਬ ਲਈ ਬਣਾਇਆ ਗਿਆ ਹੈ।
- ਬਿਜ਼ਨਸ ਕਾਰਡ — business card scanner ਨਾਲ ਇੱਕ vCard ਬਣਾਓ ਜੋ Contacts ਵਿੱਚ ਇੰਪੋਰਟ ਕਰਨ ਲਈ ਤਿਆਰ ਹੋਵੇ। ਕਾਨਫ਼ਰੰਸ ਦੇ ਕਾਰਡਾਂ ਦਾ ਢੇਰ ਤੁਹਾਡੇ ਮੇਜ਼ ਉੱਤੇ ਪਿਆ-ਪਿਆ ਖ਼ਰਾਬ ਹੋਣ ਤੋਂ ਬਚਾਉਂਦਾ ਹੈ।
OCR ਤੁਹਾਡੇ ਟੂਲਬਾਕਸ ਦੇ ਸਭ ਤੋਂ ਵੱਧ ਲਾਹੇਵੰਦ ਟੂਲਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ — ਫੋਟੋ ਪੜ੍ਹਨ ਦੇ ਪੰਜ ਮਿੰਟ ਪੰਜ ਸਕਿੰਟ ਬਣ ਸਕਦੇ ਹਨ। ਸਥਿਤੀ ਮੁਤਾਬਕ ਸਹੀ ਮੋਡ ਚੁਣੋ ਅਤੇ ਨਤੀਜੇ ਪਹਿਲੀ ਕੋਸ਼ਿਸ਼ ਵਿੱਚ ਹੀ ਸਾਫ਼-ਸੁਥਰੇ ਸੰਪਾਦਨਯੋਗ ਨਿਕਲਦੇ ਹਨ।
Pixoate