సాధారణ కాపీని ఉపయోగించి PDF ఫైల్ నుండి వచనాన్ని సేకరించడం ఎల్లప్పుడూ సాధ్యపడదు. తరచుగా ఇటువంటి పత్రాల పేజీలు వాటి కాగితపు సంస్కరణల యొక్క స్కాన్ చేయబడినవి. అటువంటి ఫైళ్ళను పూర్తిగా సవరించగలిగే టెక్స్ట్ డేటాగా మార్చడానికి, ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) ఫంక్షన్తో ప్రత్యేక ప్రోగ్రామ్లు ఉపయోగించబడతాయి.
ఇటువంటి నిర్ణయాలు అమలు చేయడం చాలా కష్టం మరియు అందువల్ల చాలా డబ్బు ఖర్చు అవుతుంది. మీరు క్రమం తప్పకుండా పిడిఎఫ్ నుండి వచనాన్ని గుర్తించాల్సిన అవసరం ఉంటే, తగిన ప్రోగ్రామ్ను కొనడం చాలా మంచిది. అరుదైన సందర్భాల్లో, ఇలాంటి ఫంక్షన్లతో అందుబాటులో ఉన్న ఆన్లైన్ సేవల్లో ఒకదాన్ని ఉపయోగించడం మరింత తార్కికంగా ఉంటుంది.
ఆన్లైన్ నుండి PDF నుండి వచనాన్ని ఎలా గుర్తించాలి
వాస్తవానికి, పూర్తి స్థాయి డెస్క్టాప్ పరిష్కారాలతో పోల్చితే, OCR ఆన్లైన్ సేవల లక్షణాల పరిధి మరింత పరిమితం. కానీ మీరు అటువంటి వనరులతో ఉచితంగా లేదా నామమాత్రపు రుసుముతో కూడా పని చేయవచ్చు. ప్రధాన విషయం ఏమిటంటే, వారి ప్రధాన పనితో, అవి టెక్స్ట్ గుర్తింపుతో, సంబంధిత వెబ్ అనువర్తనాలు అలాగే భరిస్తాయి.
విధానం 1: ABBYY FineReader ఆన్లైన్
ఆప్టికల్ డాక్యుమెంట్ గుర్తింపు రంగంలో నాయకులలో సేవా అభివృద్ధి సంస్థ ఒకటి. విండోస్ మరియు మాక్ కోసం ABBYY FineReader PDF ని టెక్స్ట్గా మార్చడానికి మరియు దానితో మరింత పని చేయడానికి ఒక శక్తివంతమైన పరిష్కారం.
ప్రోగ్రామ్ యొక్క వెబ్-ఆధారిత అనలాగ్, కార్యాచరణలో దాని కంటే తక్కువ. ఏదేమైనా, ఈ సేవ 190 కంటే ఎక్కువ భాషలలో స్కాన్లు మరియు ఫోటోల నుండి వచనాన్ని గుర్తించగలదు. PDF ఫైళ్ళను వర్డ్, ఎక్సెల్ మొదలైన వాటికి మార్చండి. పత్రాలకు మద్దతు ఉంది.
ABBYY FineReader ఆన్లైన్ ఆన్లైన్ సేవ
- మీరు సాధనంతో పనిచేయడం ప్రారంభించడానికి ముందు, సైట్లో ఒక ఖాతాను సృష్టించండి లేదా మీ ఫేస్బుక్, గూగుల్ లేదా మైక్రోసాఫ్ట్ ఖాతాను ఉపయోగించి లాగిన్ అవ్వండి.
ప్రామాణీకరణ విండోకు వెళ్లడానికి, బటన్ పై క్లిక్ చేయండి "లాగిన్" ఎగువ మెను బార్లో. - లాగిన్ అయిన తర్వాత, బటన్ను ఉపయోగించి కావలసిన PDF- పత్రాన్ని FineReader లోకి దిగుమతి చేయండి “ఫైళ్ళను అప్లోడ్ చేయి”.
అప్పుడు క్లిక్ చేయండి "పేజీ సంఖ్యలను ఎంచుకోండి" మరియు టెక్స్ట్ గుర్తింపు కోసం కావలసిన విరామాన్ని పేర్కొనండి. - తరువాత, పత్రంలో ఉన్న భాషలను, ఫలిత ఫైలు యొక్క ఆకృతిని ఎంచుకుని, బటన్ పై క్లిక్ చేయండి "గుర్తించు".
- ప్రాసెస్ చేసిన తరువాత, దాని వ్యవధి పూర్తిగా పత్రం యొక్క పరిమాణంపై ఆధారపడి ఉంటుంది, మీరు పూర్తి చేసిన ఫైల్ను టెక్స్ట్ డేటాతో దాని పేరుపై క్లిక్ చేయడం ద్వారా డౌన్లోడ్ చేసుకోవచ్చు.
లేదా, అందుబాటులో ఉన్న క్లౌడ్ సేవల్లో ఒకదానికి ఎగుమతి చేయండి.
చిత్రాలు మరియు పిడిఎఫ్ ఫైళ్ళపై అత్యంత ఖచ్చితమైన వచన గుర్తింపు అల్గోరిథంల ద్వారా ఈ సేవను గుర్తించవచ్చు. కానీ, దురదృష్టవశాత్తు, దీని ఉచిత ఉపయోగం నెలకు ప్రాసెస్ చేయబడిన ఐదు పేజీలకు పరిమితం చేయబడింది. మరింత భారీ పత్రాలతో పనిచేయడానికి, మీరు వార్షిక సభ్యత్వాన్ని కొనుగోలు చేయాలి.
అయినప్పటికీ, OCR చాలా అరుదుగా అవసరమైతే, చిన్న PDF ఫైళ్ళ నుండి వచనాన్ని తీయడానికి ABBYY FineReader ఆన్లైన్ గొప్ప ఎంపిక.
విధానం 2: ఉచిత ఆన్లైన్ OCR
వచనాన్ని డిజిటలైజ్ చేయడానికి సరళమైన మరియు అనుకూలమైన సేవ. రిజిస్ట్రేషన్ లేకుండా, గంటకు 15 పూర్తి పిడిఎఫ్ పేజీలను గుర్తించడానికి వనరు మిమ్మల్ని అనుమతిస్తుంది. ఉచిత ఆన్లైన్ OCR 46 భాషలలోని పత్రాలతో పూర్తిగా పనిచేస్తుంది మరియు అధికారం లేకుండా మూడు టెక్స్ట్ ఎగుమతి ఆకృతులకు మద్దతు ఇస్తుంది - DOCX, XLSX మరియు TXT.
నమోదు చేసేటప్పుడు, వినియోగదారు బహుళ పేజీ పత్రాలను ప్రాసెస్ చేసే అవకాశాన్ని పొందుతారు, అయితే ఇదే పేజీల యొక్క ఉచిత సంఖ్య 50 యూనిట్లకు పరిమితం చేయబడింది.
ఉచిత ఆన్లైన్ OCR ఆన్లైన్ సేవ
- PDF నుండి వచనాన్ని “అతిథి” గా గుర్తించడానికి, వనరుపై అధికారం లేకుండా, సైట్ యొక్క ప్రధాన పేజీలో తగిన ఫారమ్ను ఉపయోగించండి.
బటన్ ఉపయోగించి కావలసిన పత్రాన్ని ఎంచుకోండి "ఫైల్", టెక్స్ట్ యొక్క ప్రధాన భాష, అవుట్పుట్ ఫార్మాట్ను పేర్కొనండి, ఆపై ఫైల్ లోడ్ అయ్యే వరకు వేచి ఉండి క్లిక్ చేయండి "Convert". - డిజిటలైజేషన్ ప్రక్రియ ముగింపులో, క్లిక్ చేయండి "అవుట్పుట్ ఫైల్ను డౌన్లోడ్ చేయండి" పూర్తయిన పత్రాన్ని కంప్యూటర్లోని వచనంతో సేవ్ చేయడానికి.
అధీకృత వినియోగదారుల కోసం, చర్యల క్రమం కొంత భిన్నంగా ఉంటుంది.
- బటన్ ఉపయోగించండి "నమోదు" లేదా "లాగిన్" ఎగువ మెను బార్లో, తదనుగుణంగా, ఉచిత ఆన్లైన్ OCR ఖాతాను సృష్టించండి లేదా దానికి లాగిన్ అవ్వండి.
- గుర్తింపు ప్యానెల్లో అధికారం పొందిన తరువాత, కీని నొక్కి ఉంచండి «CTRL», అందించిన జాబితా నుండి మూల పత్రం యొక్క రెండు భాషల వరకు ఎంచుకోండి.
- PDF నుండి వచనాన్ని తీయడానికి మరిన్ని ఎంపికలను పేర్కొనండి మరియు క్లిక్ చేయండి ఫైల్ను ఎంచుకోండి సేవకు పత్రాన్ని అప్లోడ్ చేయడానికి.
అప్పుడు, గుర్తింపు ప్రారంభించడానికి, క్లిక్ చేయండి "Convert". - పత్రాన్ని ప్రాసెస్ చేసే చివరిలో, సంబంధిత కాలమ్లోని అవుట్పుట్ ఫైల్ పేరుతో ఉన్న లింక్పై క్లిక్ చేయండి.
గుర్తింపు ఫలితం వెంటనే మీ కంప్యూటర్ మెమరీలో సేవ్ చేయబడుతుంది.
మీరు ఒక చిన్న PDF- పత్రం నుండి వచనాన్ని సేకరించాల్సిన అవసరం ఉంటే, మీరు పై సాధనాన్ని ఉపయోగించడం సురక్షితంగా ఆశ్రయించవచ్చు. భారీ ఫైళ్ళతో పనిచేయడానికి, మీరు ఉచిత ఆన్లైన్ OCR లో అదనపు అక్షరాలను కొనుగోలు చేయాలి లేదా మరొక పరిష్కారాన్ని ఉపయోగించాలి.
విధానం 3: న్యూఓసిఆర్
DjVu మరియు PDF వంటి ఏదైనా గ్రాఫిక్ మరియు ఎలక్ట్రానిక్ పత్రాల నుండి వచనాన్ని సేకరించేందుకు మిమ్మల్ని అనుమతించే పూర్తిగా ఉచిత OCR- సేవ. గుర్తించబడిన ఫైళ్ళ పరిమాణం మరియు సంఖ్యపై వనరు పరిమితులు విధించదు, రిజిస్ట్రేషన్ అవసరం లేదు మరియు విస్తృత శ్రేణి సంబంధిత విధులను అందిస్తుంది.
NewOCR 106 భాషలకు మద్దతు ఇస్తుంది మరియు తక్కువ-నాణ్యత పత్ర స్కాన్లను కూడా సరిగ్గా ప్రాసెస్ చేయగలదు. ఫైల్ పేజీలో వచన గుర్తింపు కోసం ప్రాంతాన్ని మాన్యువల్గా ఎంచుకోవడం సాధ్యపడుతుంది.
NewOCR ఆన్లైన్ సేవ
- కాబట్టి, అనవసరమైన చర్యలను చేయాల్సిన అవసరం లేకుండా, మీరు వెంటనే వనరుతో పనిచేయడం ప్రారంభించవచ్చు.
ప్రధాన పేజీలోనే సైట్కు పత్రాన్ని దిగుమతి చేయడానికి ఒక ఫారమ్ ఉంది. క్రొత్త ఫైల్కు ఫైల్ను అప్లోడ్ చేయడానికి, బటన్ను ఉపయోగించండి "ఫైల్ ఎంచుకోండి" విభాగంలో "మీ ఫైల్ను ఎంచుకోండి". అప్పుడు పొలంలో "గుర్తింపు భాష (లు)" మూల పత్రం యొక్క ఒకటి లేదా అంతకంటే ఎక్కువ భాషలను పేర్కొనండి, ఆపై క్లిక్ చేయండి "అప్లోడ్ + OCR". - మీకు ఇష్టమైన గుర్తింపు సెట్టింగులను సెట్ చేయండి, మీరు వచనాన్ని సంగ్రహించదలిచిన పేజీని ఎంచుకోండి మరియు బటన్ పై క్లిక్ చేయండి «OCR».
- పేజీని కొంచెం క్రిందికి స్క్రోల్ చేసి, బటన్ను కనుగొనండి «డౌన్లోడ్».
దానిపై క్లిక్ చేయండి మరియు డ్రాప్-డౌన్ జాబితాలో డౌన్లోడ్ చేయడానికి అవసరమైన డాక్యుమెంట్ ఫార్మాట్ను ఎంచుకోండి. ఆ తరువాత, సేకరించిన వచనంతో పూర్తయిన ఫైల్ మీ కంప్యూటర్కు డౌన్లోడ్ చేయబడుతుంది.
సాధనం సౌకర్యవంతంగా ఉంటుంది మరియు అధిక నాణ్యత అన్ని అక్షరాలను గుర్తిస్తుంది. ఏదేమైనా, దిగుమతి చేసుకున్న PDF పత్రం యొక్క ప్రతి పేజీ యొక్క ప్రాసెసింగ్ స్వతంత్రంగా ప్రారంభించబడాలి మరియు అది ప్రత్యేక ఫైల్లో ప్రదర్శించబడుతుంది. మీరు వెంటనే, గుర్తింపు ఫలితాలను క్లిప్బోర్డ్కు కాపీ చేసి, ఇతరులతో కలపవచ్చు.
ఏదేమైనా, పైన వివరించిన స్వల్పభేదాన్ని బట్టి, న్యూఓసిఆర్ ఉపయోగించి పెద్ద మొత్తంలో వచనాన్ని సేకరించడం చాలా కష్టం. చిన్న ఫైళ్ళతో, సేవ బ్యాంగ్తో ఎదుర్కుంటుంది.
విధానం 4: OCR.Space
వచనాన్ని డిజిటలైజ్ చేయడానికి సరళమైన మరియు అర్థమయ్యే వనరు, ఇది PDF పత్రాలను గుర్తించడానికి మరియు ఫలితాన్ని TXT ఫైల్కు అవుట్పుట్ చేయడానికి మిమ్మల్ని అనుమతిస్తుంది. పేజీల సంఖ్యపై పరిమితులు ఇవ్వబడలేదు. ఇన్పుట్ పత్రం యొక్క పరిమాణం 5 మెగాబైట్లకు మించకూడదు.
OCR.Space ఆన్లైన్ సేవ
- సాధనంతో పనిచేయడానికి నమోదు అవసరం లేదు.
పై లింక్ను అనుసరించి, బటన్ను ఉపయోగించి కంప్యూటర్ నుండి పిడిఎఫ్ పత్రాన్ని వెబ్సైట్లోకి అప్లోడ్ చేయండి "ఫైల్ ఎంచుకోండి" లేదా నెట్వర్క్ నుండి - సూచన ద్వారా. - డ్రాప్ డౌన్ జాబితాలో "OCR భాషను ఎంచుకోండి" దిగుమతి చేసుకున్న పత్రం యొక్క భాషను ఎంచుకోండి.
అప్పుడు బటన్ పై క్లిక్ చేసి టెక్స్ట్ రికగ్నిషన్ ప్రాసెస్ ప్రారంభించండి "OCR ప్రారంభించండి!". - ఫైల్ ప్రాసెసింగ్ చివరిలో, ఫీల్డ్లో ఫలితాన్ని చదవండి OCR'ed ఫలితం క్లిక్ చేయండి «డౌన్లోడ్»పూర్తయిన TXT పత్రాన్ని డౌన్లోడ్ చేయడానికి.
మీరు పిడిఎఫ్ నుండి వచనాన్ని సంగ్రహించాల్సిన అవసరం ఉంటే, అదే సమయంలో దాని తుది ఆకృతీకరణ అంత ముఖ్యమైనది కాదు, OCR.Space మంచి ఎంపిక. ఒకే విషయం ఏమిటంటే, పత్రం “ఏకభాష” గా ఉండాలి, ఎందుకంటే ఒకే సమయంలో రెండు లేదా అంతకంటే ఎక్కువ భాషలను గుర్తించడం సేవలో అందించబడదు.
ఇవి కూడా చూడండి: ఫైన్ రీడర్ యొక్క ఉచిత అనలాగ్లు
వ్యాసంలో సమర్పించబడిన ఆన్లైన్ సాధనాలను అంచనా వేస్తూ, ABBYY నుండి వచ్చిన FineReader ఆన్లైన్ OCR ఫంక్షన్ను చాలా ఖచ్చితంగా మరియు సమర్థవంతంగా నిర్వహిస్తుందని గమనించాలి. వచన గుర్తింపు యొక్క గరిష్ట ఖచ్చితత్వం మీకు ముఖ్యమైతే, ఈ ఎంపికను ప్రత్యేకంగా పరిగణించడం మంచిది. కానీ చాలా మటుకు, మీరు కూడా దాని కోసం చెల్లించాల్సి ఉంటుంది.
మీరు చిన్న పత్రాలను డిజిటలైజ్ చేయవలసి వస్తే మరియు సేవలో లోపాలను స్వతంత్రంగా సరిచేయడానికి మీరు సిద్ధంగా ఉంటే, NewOCR, OCR.Space లేదా ఉచిత ఆన్లైన్ OCR ను ఉపయోగించడం మంచిది.