PDF ਤੋਂ Word: ਕਿਹੜਾ ਕਨਵਰਜ਼ਨ ਟੂਲ ਅਸਲ ਵਿੱਚ ਤੁਹਾਡੀ ਫਾਰਮੈਟਿੰਗ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਦਾ ਹੈ?
ਜ਼ਿਆਦਾਤਰ PDF-ਤੋਂ-Word ਕਨਵਰਟਰ ਤੁਹਾਡੇ ਟੇਬਲ ਖ਼ਰਾਬ ਕਰ ਦਿੰਦੇ ਹਨ, ਫ਼ੌਂਟ ਉਲਟ-ਪੁਲਟ ਕਰ ਦਿੰਦੇ ਹਨ, ਜਾਂ ਚਿੱਤਰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਛੱਡ ਦਿੰਦੇ ਹਨ। ਇੱਥੇ ਦੱਸਿਆ ਗਿਆ ਹੈ ਕਿ ਚੰਗਾ ਕਨਵਰਟਰ ਕਿਹੋ ਜਿਹਾ ਹੁੰਦਾ ਹੈ, ਸਕੈਨ ਕੀਤੀਆਂ PDF ਨੂੰ OCR ਦੀ ਲੋੜ ਕਿਉਂ ਹੁੰਦੀ ਹੈ, ਅਤੇ ਹਰ ਕਿਸਮ ਦੀ PDF ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਣਾ ਹੈ।
PDF ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ ਸੀ ਕਿ ਇਹ ਹਰ ਡਿਵਾਈਸ ਉੱਤੇ ਇੱਕੋ ਜਿਹਾ ਦਿਖੇ। ਇਹੀ ਇਸ ਦੀ ਵੱਡੀ ਤਾਕਤ ਹੈ ਅਤੇ ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਇਸ ਨੂੰ ਸੰਪਾਦਿਤ ਕਰਨਾ ਪਰੇਸ਼ਾਨ ਕਰਨ ਵਾਲਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ PDF ਨੂੰ Word ਵਿੱਚ ਬਦਲਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਇੱਕ ਟੂਲ ਨੂੰ ਦਸਤਾਵੇਜ਼ ਦੀ ਰਿਵਰਸ-ਇੰਜੀਨੀਅਰਿੰਗ ਕਰਨ ਲਈ ਕਹਿ ਰਹੇ ਹੁੰਦੇ ਹੋ — ਇਹ ਪਤਾ ਲਗਾਉਣ ਲਈ ਕਿ ਕਿਹੜੇ ਅੱਖਰ ਕਿਹੜੇ ਪੈਰੇ ਨਾਲ ਸਬੰਧਤ ਹਨ, ਟੇਬਲਾਂ ਕਿੱਥੇ ਹਨ, ਸਿਰਲੇਖ ਕੀ ਹਨ, ਅਤੇ ਕੀ ਫੁਟਨੋਟ ਹੈ ਤੇ ਕੀ ਨਹੀਂ। ਕੁਝ ਕਨਵਰਟਰ ਇਹ ਕੰਮ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕਰਦੇ ਹਨ। ਜ਼ਿਆਦਾਤਰ ਮਾੜੀ ਤਰ੍ਹਾਂ ਕਰਦੇ ਹਨ।
ਇੱਥੇ ਇੱਕ ਤੇਜ਼ ਫ਼ੈਸਲਾ ਟ੍ਰੀ ਹੈ, ਅਤੇ ਕੀ ਚੀਜ਼ ਇੱਕ ਕਨਵਰਟਰ ਨੂੰ ਸੱਚਮੁੱਚ ਵਧੀਆ ਬਣਾਉਂਦੀ ਹੈ।
ਪਹਿਲਾ ਸਵਾਲ: ਕੀ PDF ਇੱਕ ਅਸਲੀ PDF ਹੈ ਜਾਂ ਇੱਕ ਸਕੈਨ?
ਜੇ ਤੁਸੀਂ PDF ਰੀਡਰ ਦੇ ਅੰਦਰ ਆਪਣੇ ਮਾਊਸ ਨਾਲ ਟੈਕਸਟ ਚੁਣ ਸਕਦੇ ਹੋ, ਤਾਂ ਇਹ ਅਸਲ ਟੈਕਸਟ ਸਮੱਗਰੀ ਵਾਲੀ ਇੱਕ ਅਸਲੀ PDF ਹੈ। ਜੇ ਤੁਸੀਂ ਨਹੀਂ ਕਰ ਸਕਦੇ — ਜੇ ਟੈਕਸਟ ਇੱਕ ਇਮੇਜ ਵਾਂਗ ਵਿਹਾਰ ਕਰਦਾ ਹੈ — ਤਾਂ ਇਹ ਇੱਕ ਸਕੈਨ ਹੈ, ਭਾਵੇਂ ਇਹ ਅਜਿਹਾ ਨਾ ਲੱਗੇ। ਬਦਲਣ ਦਾ ਰਾਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵੱਖਰਾ ਹੈ।
ਅਸਲੀ PDF ਲਈ
PDF to Word ਏਮਬੈੱਡ ਕੀਤੇ ਟੈਕਸਟ ਅਤੇ ਲੇਆਉਟ ਨੂੰ ਪੜ੍ਹਦਾ ਹੈ, ਫਿਰ ਇਸਨੂੰ ਇੱਕ .docx ਵਜੋਂ ਮੁੜ ਬਣਾਉਂਦਾ ਹੈ। ਚੰਗੇ ਕਨਵਰਟਰ ਪੈਰੇ, ਸਿਰਲੇਖ, ਸੂਚੀਆਂ, ਸਧਾਰਨ ਟੇਬਲ ਅਤੇ ਇਨਲਾਈਨ ਚਿੱਤਰ ਬਰਕਰਾਰ ਰੱਖਦੇ ਹਨ। ਆਮ ਦਫ਼ਤਰੀ ਦਸਤਾਵੇਜ਼ ਸਾਫ਼-ਸੁਥਰੇ ਢੰਗ ਨਾਲ ਸੰਪਾਦਨਯੋਗ ਨਿਕਲਦੇ ਹਨ।
ਸਕੈਨ ਕੀਤੀਆਂ PDF ਲਈ
ਤੁਹਾਨੂੰ ਪਹਿਲਾਂ OCR ਦੀ ਲੋੜ ਹੈ। OCR ਚਾਲੂ ਨਾਲ PDF to text ਤੁਹਾਨੂੰ ਕੱਚਾ ਟੈਕਸਟ ਦਿੰਦਾ ਹੈ; ਫਾਰਮੈਟਿੰਗ ਵਾਲੇ ਢਾਂਚਾਗਤ ਦਸਤਾਵੇਜ਼ ਲਈ, ਹਰ ਪੇਜ 'ਤੇ image to Word ਵਰਤੋ (ਜਾਂ ਪੂਰੀ PDF ਨੂੰ ਚਲਾਓ)। ਆਉਟਪੁੱਟ ਸਕੈਨ ਵਰਗੀ ਬਿਲਕੁਲ ਇੱਕੋ ਜਿਹੀ ਨਹੀਂ ਦਿਖੇਗੀ, ਪਰ ਟੈਕਸਟ ਸੰਪਾਦਨਯੋਗ ਹੋਵੇਗਾ ਅਤੇ ਢਾਂਚਾ ਬਰਕਰਾਰ ਰਹੇਗਾ।
ਕਨਵਰਟਰ ਕੀ ਗ਼ਲਤ ਕਰਦੇ ਹਨ
ਆਮ ਖ਼ਾਮੀਆਂ, ਲਗਭਗ ਉਸੇ ਕ੍ਰਮ ਵਿੱਚ ਜਿਸ ਤਰ੍ਹਾਂ ਉਹ ਵਾਪਰਦੀਆਂ ਹਨ:
- ਟੇਬਲ ਟੈਕਸਟ ਬਾਕਸ ਬਣ ਜਾਂਦੇ ਹਨ। ਮਾੜੇ ਕਨਵਰਟਰ ਹਰ ਸੈੱਲ ਨੂੰ ਇੱਕ ਫਲੋਟਿੰਗ ਤੱਤ ਵਿੱਚ ਬਦਲ ਦਿੰਦੇ ਹਨ। ਟੇਬਲ ਠੀਕ ਦਿਸਦਾ ਹੈ; ਪਰ ਤੁਸੀਂ ਇਸਨੂੰ ਅਸਲ ਵਿੱਚ ਟੇਬਲ ਵਜੋਂ ਸੰਪਾਦਿਤ ਨਹੀਂ ਕਰ ਸਕਦੇ।
- ਬਹੁ-ਕਾਲਮ ਲੇਆਉਟ ਢਹਿ ਜਾਂਦੇ ਹਨ। ਦੋ-ਕਾਲਮ ਵਾਲਾ ਨਿਊਜ਼ਲੈਟਰ ਇੱਕ ਕਾਲਮ ਬਣ ਜਾਂਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਦੋਵਾਂ ਕਾਲਮਾਂ ਦਾ ਟੈਕਸਟ ਬੇਢੰਗੇ ਢੰਗ ਨਾਲ ਆਪਸ ਵਿੱਚ ਮਿਲ ਜਾਂਦਾ ਹੈ।
- ਫ਼ੌਂਟ ਚੁੱਪ-ਚੁਪੀਤੇ ਬਦਲ ਜਾਂਦੇ ਹਨ। ਜੇ ਤੁਹਾਡੀ PDF ਅਜਿਹਾ ਫ਼ੌਂਟ ਵਰਤਦੀ ਹੈ ਜੋ Word ਕੋਲ ਨਹੀਂ ਹੈ, ਤਾਂ ਤੁਹਾਨੂੰ ਉਸ ਨਾਲ ਮਿਲਦਾ-ਜੁਲਦਾ ਕੁਝ ਮਿਲਦਾ ਹੈ — ਪਰ ਉਹੀ ਨਹੀਂ — ਅਤੇ ਤੁਹਾਡੇ ਲਾਈਨ ਬ੍ਰੇਕ ਖਿਸਕ ਜਾਂਦੇ ਹਨ।
- ਫੁਟਨੋਟ ਨਿੱਖੜ ਜਾਂਦੇ ਹਨ। ਫੁਟਨੋਟ ਦਾ ਟੈਕਸਟ ਪੰਨੇ ਦੇ ਹੇਠਾਂ ਇੱਕ ਬੇਮੇਲ ਪੈਰੇ ਵਜੋਂ ਰਹਿ ਜਾਂਦਾ ਹੈ, ਜੋ ਹੁਣ ਮਾਰਕਰ ਨਾਲ ਜੁੜਿਆ ਨਹੀਂ ਰਹਿੰਦਾ।
- ਹੈੱਡਰ ਅਤੇ ਫੁੱਟਰ ਬੌਡੀ ਟੈਕਸਟ ਬਣ ਜਾਂਦੇ ਹਨ। ਪੰਨਾ ਨੰਬਰ, ਹੈੱਡਰ ਅਤੇ ਫੁੱਟਰ ਵਹਾਅ ਦੇ ਵਿਚਕਾਰ ਪੈਰਿਆਂ ਵਜੋਂ ਆ ਜਾਂਦੇ ਹਨ।
ਇੱਕ ਵਧੀਆ ਕਨਵਰਟਰ ਕੀ ਕਰਦਾ ਹੈ
ਮਿਆਰ ਹੈ ਪਛਾਣਨਯੋਗ ਲੇਆਉਟ, ਸੰਪਾਦਨਯੋਗ ਟੇਬਲ, ਸੁਰੱਖਿਅਤ ਸੂਚੀਆਂ, ਅਤੇ ਇਨਲਾਈਨ ਚਿੱਤਰ ਜੋ ਉੱਥੇ ਹੀ ਰਹਿੰਦੇ ਹਨ ਜਿੱਥੇ ਤੁਸੀਂ ਉਨ੍ਹਾਂ ਨੂੰ ਰੱਖਿਆ ਹੈ। Pixoate ਦਾ PDF to Word ਜ਼ਿਆਦਾਤਰ ਦਫ਼ਤਰੀ-ਸ਼ੈਲੀ ਦੀਆਂ PDF ਲਈ ਇਹ ਮਿਆਰ ਪੂਰਾ ਕਰਦਾ ਹੈ: ਇਕਰਾਰਨਾਮੇ, ਰਿਪੋਰਟਾਂ, ਫਾਰਮ, ਚਿੱਠੀਆਂ। ਇਹ ਇੱਕ ਲੇਆਉਟ-ਜਾਣੂ ਪਾਈਪਲਾਈਨ ਵਰਤਦਾ ਹੈ ਜੋ ਟੇਬਲ ਗਰਿੱਡਾਂ ਨੂੰ ਪਛਾਣਦੀ ਹੈ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਟੈਕਸਟ ਬਾਕਸ ਵਜੋਂ ਨਹੀਂ, ਬਲਕਿ ਮੂਲ Word ਟੇਬਲ ਵਜੋਂ ਮੁੜ-ਬਣਾਉਂਦੀ ਹੈ। ਸਿਰਲੇਖ ਆਪਣਾ ਦਰਜਾਬੰਦੀ ਰੱਖਦੇ ਹਨ। ਬੁਲੇਟ ਅਤੇ ਨੰਬਰ ਵਾਲੀਆਂ ਸੂਚੀਆਂ ਸੂਚੀਆਂ ਵਜੋਂ ਆਉਂਦੀਆਂ ਹਨ, ਨਾ ਕਿ ਟੈਕਸਟ ਦੀਆਂ ਅਜਿਹੀਆਂ ਲਾਈਨਾਂ ਵਜੋਂ ਜੋ ਸੂਚੀਆਂ ਵਾਂਗ ਦਿਖਦੀਆਂ ਹਨ।
ਉਲਟ ਦਿਸ਼ਾ ਵਿੱਚ ਜਾਣਾ
ਜੇ ਤੁਸੀਂ ਕਿਸੇ Word ਦਸਤਾਵੇਜ਼ ਤੋਂ PDF ਬਣਾ ਰਹੇ ਹੋ (ਅਤੇ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਇਹ ਬਿਲਕੁਲ Word ਵਾਂਗ ਦਿਖੇ), ਤਾਂ Word ਤੋਂ PDF ਵਰਤੋ। ਇਹ ਇੱਕ ਅਸਲ LibreOffice ਰੈਂਡਰ ਪਾਸ ਚਲਾਉਂਦਾ ਹੈ, ਇਸ ਲਈ ਆਉਟਪੁੱਟ ਉਸ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਜੋ ਤੁਹਾਨੂੰ Word ਵਿੱਚ "Save as PDF" ਉੱਤੇ ਕਲਿੱਕ ਕਰਨ ਨਾਲ ਮਿਲਦਾ — ਫੌਂਟ ਏਮਬੈੱਡ, ਲੇਆਉਟ ਬਰਕਰਾਰ, ਕੋਈ ਹੈਰਾਨੀ ਨਹੀਂ।
ਜਾਣਨ ਯੋਗ ਹੋਰ ਫਾਰਮੈਟ
- PDF to HTML ਜਦੋਂ ਤੁਸੀਂ ਇੱਕ ਵੈੱਬ ਪੰਨਾ ਚਾਹੁੰਦੇ ਹੋ। PDF to HTML ਅਸਲ
<table>ਤੱਤਾਂ ਅਤੇ ਸਿਰਲੇਖਾਂ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਦਾ ਹੈ, ਇਸ ਲਈ ਆਉਟਪੁੱਟ ਪੜ੍ਹਨਯੋਗ HTML ਹੁੰਦੀ ਹੈ, ਨਾ ਕਿ ਮਾਰਕਅੱਪ ਵਿੱਚ ਲਪੇਟਿਆ ਸਕ੍ਰੀਨਸ਼ਾਟ। - PDF to Excel ਜਦੋਂ PDF ਜ਼ਿਆਦਾਤਰ ਟੇਬਲਾਂ ਵਾਲੀ ਹੋਵੇ। PDF to Excel ਹਰ ਟੇਬਲ ਨੂੰ ਜੰਮੇ ਹੋਏ ਹੈੱਡਰਾਂ ਨਾਲ ਉਸਦੀ ਆਪਣੀ ਸ਼ੀਟ ਵਿੱਚ ਕੱਢ ਲੈਂਦਾ ਹੈ।
- PDF to CSV ਉਸ ਕੱਚੇ ਟੇਬਲ ਡਾਟੇ ਲਈ ਜੋ ਤੁਸੀਂ ਕਿਤੇ ਹੋਰ ਇੰਪੋਰਟ ਕਰੋਗੇ। PDF to CSV ਹਰ ਟੇਬਲ ਲਈ ਇੱਕ CSV ਜ਼ਿੱਪ ਕਰ ਦਿੰਦਾ ਹੈ।
- PDF to Images ਜਦੋਂ ਤੁਹਾਨੂੰ ਹਰ ਪੰਨਾ PNG ਵਜੋਂ ਚਾਹੀਦਾ ਹੋਵੇ — ਮੰਨ ਲਓ, ਕਿਸੇ ਸਲਾਈਡ ਡੈੱਕ ਜਾਂ ਪੋਰਟਫੋਲੀਓ ਲਈ। PDF to images ਮੂਲ ਰੂਪ ਵਿੱਚ 200 DPI ਉੱਤੇ ਰੈਂਡਰ ਕਰਦਾ ਹੈ।
ਕਦੋਂ ਬਦਲਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਛੱਡ ਕੇ ਬੱਸ PDF ਹੀ ਭੇਜ ਦੇਣੀ ਚਾਹੀਦੀ ਹੈ
ਜੇ ਪ੍ਰਾਪਤ ਕਰਨ ਵਾਲੀ ਧਿਰ ਨੂੰ ਸਿਰਫ਼ PDF ਪੜ੍ਹਨ ਜਾਂ ਪ੍ਰਿੰਟ ਕਰਨ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਇਸ ਨੂੰ ਨਾ ਬਦਲੋ। ਇਸ ਦੀ ਬਜਾਏ ਇਸ ਨੂੰ PDF ਕੰਪ੍ਰੈਸ ਨਾਲ ਕੰਪ੍ਰੈਸ ਕਰੋ, ਅਤੇ PDF ਸਿੱਧਾ ਭੇਜੋ। ਬਦਲਣਾ ਉਦੋਂ ਲਈ ਹੈ ਜਦੋਂ ਤੁਹਾਨੂੰ ਸੰਪਾਦਨ ਕਰਨ ਦੀ ਲੋੜ ਹੋਵੇ; ਜੇ ਨਹੀਂ, ਤਾਂ ਤੁਸੀਂ ਸਿਰਫ਼ ਇੱਕ ਅਜਿਹਾ ਕਦਮ ਜੋੜ ਰਹੇ ਹੋ ਜੋ ਗੁਣਵੱਤਾ ਗੁਆ ਸਕਦਾ ਹੈ।
Pixoate