OCR: Aithint Carachtar Optúil

Aitheantas carachtar optúil don aistriúchán.

Seasann OCR d’aitheantas carachtar optúil. Úsáidtear bogearraí OCR chun comhaid ar nós PDFanna nó facsanna a thiontú go doiciméid eagarthóireachta ar nós Microsoft Word. Déantar é seo sula dtugann an obair aistriúcháin faoi.

Is féidir OCR a úsáid freisin chun doiciméid a athchruthú nuair atá do bhunchóipeanna caillte agat.

An Tiontú

Cén fáth a gcaithfimid na comhaid a thiontú?

Ní comhaid eagarthóireachta iad comhaid PDF. Ní iad na comhaid foinse bunaidh iad. Mura féidir linn an comhad a chur in eagar, ní féidir linn é a aistriú. Mar sin, ní mór dúinn iad a thiontú i bhformáid is féidir linn a chur in eagar agus a mhodhnú. Is féidir an próiseas comhshó seo a dhéanamh le OCR. Ceadaíonn bogearraí OCR comhaid PDF a thiontú ina gcomhaid Microsoft Word le haghaidh aistriúcháin. Is féidir leis facsanna a thiontú go formáidí eagarthóireachta freisin.

Cad é OCR?

Próiseas an Aistriúcháin

Sula dtosaíonn an t-aistriúchán ní mór dúinn an comhad a thiontú, lena n-áirítear an leagan amach ag baint úsáide as bogearraí Foilsitheoireachta Deisce (DTP) agus bogearraí OCR. I ndáiríre, athchruthaímid do chomhad i Microsoft Word, leagan amach, téacs, grafaicí gach rud. Déanaimid athbhreithniú ansin ar an doiciméad chun aon earráidí abairte nó earráidí deighleoige a shocrú chun a chinntiú go mbeidh an doiciméad aistrithe foirfe duitse. Is dianphróiseas an-saothair é. Nuair a bheidh sé críochnaithe déanann sé próiseas an aistriúcháin i bhfad níos éasca don aistritheoir.

Cad iad na bealaí éagsúla chun comhad a thiontú?

Ag brath ar an gcaoi ar táirgeadh an PDF, mura bhfuil sa doiciméad ach téacs is féidir a roghnú, is féidir an téacs a chóipeáil agus a ghreamú i ndoiciméad focal. Tá gnéithe slándála ag roinnt PDFanna a chuireann cosc ar chóipeáil agus ar ghreamú.

Más doiciméad scanta é an PDF nó mura féidir an téacs a roghnú, tá gá le bogearraí OCR a úsáid. Déanann an uirlis OCR gach carachtar a scanadh mar íomhá agus déanann sé iarracht é a thiontú ina charachtar eagarthóireachta i Word. Tá sé thart ar 95% cruinn agus déanann sé post iontach. Is é an leagan amach a choinneáil an chuid chrua.

Cén fáth go bhfuil sé níos fearr OCR a sheachaint?

Is é an costas agus an t-am an chúis is mó le OCR a úsáid. Tógann sé am comhad PDF a athrú; beidh tionchar aige ar do sceideal seachadta. Ciallaíonn an t-ualach oibre breise chun doiciméid a thiontú agus a sheiceáil go gcaithfimid costais chomhshó a ghearradh chun an obair seo a dhéanamh.

Is cúis eile é cáilíocht; ag baint úsáide as an bpróiseas comhshó is minic a laghdú ar chaighdeán do dhoiciméid deiridh. Is féidir le híomhánna díghrádú beagán ag brath ar na rúin a úsáidtear. Seachadann muid caighdeán iontach ach is féidir linn caighdeán doiciméad bunaidh foinse a mheaitseáil ag baint úsáide as OCR. Tá sé i gcónaí níos fearr a bheith ag obair le comhaid foinsí bunaidh don aschur cáilíochta is airde.