Softver za prepoznavanje teksta

Pin
Send
Share
Send

U pravilu, kad je riječ o programima za prepoznavanje skeniranog teksta (OCR, optičko prepoznavanje znakova), većina korisnika podsjeća na jedini proizvod - ABBYY FineReader, koji je nesumnjivo lider među takvim softverom u Rusiji i jedan od lidera u svijetu.

Međutim, FineReader nije jedino takvo rješenje: postoje besplatni programi za prepoznavanje teksta, internetske usluge za iste svrhe i, osim toga, takve su funkcije prisutne i u nekim programima za koje znate da su možda već instalirani na vašem računalu . Pokušaću napisati o svemu tome u ovom članku. Svi pregledani programi rade u Windowsima 7, 8 i XP.

Vođa prepoznavanja teksta - ABBYY Finereader

Verovatno ste verovatno čuli za FineReader (izgovara se Fine Reader). Ovaj program je najbolji ili jedan od najboljih za kvalitetno prepoznavanje tekstova na ruskom jeziku. Program se plaća, a cijena dozvole za kućnu upotrebu je nešto manja od 2000 rubalja. Također je moguće preuzeti probnu verziju FineReader-a ili koristiti internetsko prepoznavanje teksta u ABBYY Fine Reader Online (nekoliko stranica možete prepoznati besplatno, a uz naknadu). Sve to dostupno je na službenoj web stranici programera //www.abbyy.ru.

Instalacija probne verzije FineReader-a nije uzrokovala probleme. Softver se može integrirati s Microsoft Officeom i Windows Explorer-om radi lakšeg prepoznavanja. Od ograničenja besplatne probne verzije - 15 dana korištenja i mogućnost prepoznavanja ne više od 50 stranica.

Snimak za testiranje programa za prepoznavanje

Budući da nemam skener, koristio sam snimak s nekvalitetne kamere telefona za provjeru, u kojem sam malo uredio kontrast. Kvaliteta je bezvrijedna, da vidimo ko može podnijeti.

Izbornik FineReader

FineReader može primiti grafičku sliku teksta direktno iz skenera, iz slikovnih datoteka ili fotoaparata. U mom slučaju bilo je dovoljno za otvaranje datoteke sa slikama. Rezultat zadovoljan - samo nekoliko grešaka. Moram reći da je to najbolji rezultat svih testiranih programa pri radu s ovim uzorkom - slična kvaliteta prepoznavanja bila je samo na besplatnoj internetskoj usluzi Free Online OCR (ali u ovom pregledu govorimo samo o softverskim alatima, a ne o mrežnom prepoznavanju).

Rezultat prepoznavanja teksta u programu FineReader

Iskreno govoreći, FineReader vjerovatno nema konkurente za tekst na ćirilici. Prednosti programa nisu samo kvaliteta prepoznavanja teksta, već i široka funkcionalnost, podrška za formatiranje, kompetentan izvoz u brojne formate, uključujući Word docx, pdf i druge značajke. Dakle, ako su zadaci OCR-a nešto sa čime se stalno susrećete, tada ne štedite relativno malu količinu novca i isplatiće se: uštedjet ćete ogromno vrijeme brzo dobivanjem visokokvalitetnog rezultata u FineReader-u. Usput, ne reklamiram ništa - stvarno mislim da bi oni koji trebaju prepoznati više od desetak stranica trebali razmisliti o kupovini takvog softvera.

CuneiForm - program za prepoznavanje slobodnog teksta

Po mom mišljenju, drugi najpopularniji OCR program u Rusiji je besplatni CuneiForm, koji možete preuzeti sa službenog web mjesta //cognitiveforms.ru/products/cuneiform/.

Instalacija programa je također vrlo jednostavna, ona ne pokušava instalirati nijedan softver treće strane (poput mnogih besplatnog softvera). Sučelje je sažet i jasan. U nekim se slučajevima najlakše koristi čarobnjak za koji je prva od ikona u izborniku.

Program koji se nisam nosio s uzorkom koji sam koristio u FineReaderu, ili preciznije, stvorio je nešto loše čitljivo i podcrtava riječi. Drugi pokušaj učinjen je snimkom zaslona teksta s web mjesta samog ovog programa koji je, međutim, morao biti povećan (potrebna su skeniranja rezolucije 200dpi i više, ne čita snimke zaslona s debljinom linije fonta od 1-2 piksela). Ovdje se dobro snašla (dio teksta nije prepoznat, jer je odabran samo ruski).

Prepoznavanje teksta u CuneiForm-u

Stoga možemo pretpostaviti da je CuneiForm ono što biste trebali isprobati, posebno ako imate visokokvalitetne skenirane stranice i želite ih besplatno prepoznati.

Microsoft OneNote je program koji možda već imate

Microsoft Office, počevši od verzije 2007. Do kraja sa trenutnim, 2013. ima program za bilješke - OneNote. Takođe ima značajke prepoznavanja teksta. Da biste ga koristili, jednostavno ubacite skeniranu ili bilo koju drugu sliku teksta u bilješku, desnim klikom na nju i koristite kontekstni izbornik. Napominjem da je zadani jezik prepoznavanja postavljen na engleski.

Prepoznavanje u Microsoft OneNote-u

Ne mogu reći da je tekst savršeno prepoznat, ali, koliko mogu reći, to je nekako bolje čak i nego u CuneiFormu. Plus programa, kao što je već spomenuto, je u tome što je sa velikom vjerovatnoćom on već instaliran na vašem računalu. Iako, naravno, malo je vjerojatno da će ga koristiti ako je potrebno raditi s velikim brojem skeniranih dokumenata, pogodnije je za brzo prepoznavanje posjetnica.

OmniPage Ultimate, OmniPage 18 - mora biti nešto vrlo cool

Ne znam koliko je dobar program za prepoznavanje teksta OmniPage: nema probnih verzija, ne želim ih negdje preuzeti. Ali, ako mu je cijena opravdana, a koštat će oko 5.000 rubalja u verziji za pojedinačnu upotrebu, a ne Ultimate, onda bi to trebalo biti nešto impresivno. Stranica programa: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

Cijena softvera OmniPage

Ako se upoznate s karakteristikama i recenzijama, uključujući izdanja na ruskom jeziku, u njima je primijećeno da OmniPage stvarno omogućuje visokokvalitetno i točno prepoznavanje, uključujući i na ruskom, relativno lako uspoređuje skeniranje loše kvalitete i pruža skup dodatnih alata. Od nedostataka, sučelje nije najprikladnije, posebno za početnike. Ovako ili onako, na zapadnom tržištu OmniPage je direktan konkurent FineReader-u i u engleskoj se ocjeni bore upravo među sobom, pa samim tim, mislim da bi program trebao biti dostojan.

Ovo nisu svi takvi programi, tu su i razne verzije malih besplatnih programa, ali eksperimentirajući s njima otkrio sam dva glavna nedostatka koja su im svojstvena: nedostatak podrške na ćirilici ili raznog, ne baš korisnog softvera u instalacijskom kompletu, pa sam ih zato odlučio ne spomenuti ovdje.

Pin
Send
Share
Send