Internetske usluge za prepoznavanje teksta

Pin
Send
Share
Send

Pozdrav svim čitaocima bloga!

Mislim da su se oni koji često rade za računarom (ne igraju, naime rade) morali baviti prepoznavanjem teksta. Pa, na primjer, skenirali ste odlomak iz knjige i sada morate taj dio umetnuti u svoj dokument. Ali skenirani dokument je slika, a potreban nam je tekst - za to su nam potrebni posebni programi i internetski servisi za prepoznavanje teksta sa slika.

O programima za prepoznavanje već sam pisao u prethodnim postovima:

- skeniranje i prepoznavanje teksta u FineReader-u (plaćeni program);

- Rad u analognom FineReaderu - CuneiForm (besplatan program).

U istom članku želio bih se zaustaviti na internetskim servisima za prepoznavanje teksta. Uostalom, ako vam je potrebno da brzo dobijete tekst sa 1-2 slike - nema smisla smetati u instaliranju različitih programa ...

 

Važno! Kvaliteta prepoznavanja (broj grešaka, čitljivost itd.) Uvelike ovisi o originalnoj kvaliteti slike. Zato pri skeniranju (fotografiranju itd.) Odaberite kvalitetu što je više moguće. U većini slučajeva bit će dovoljna kvaliteta od 300-400 dpi (dpi je parametar koji karakterizira kvalitetu slike. U postavkama gotovo svih skenera obično se navodi ovaj parametar).

 

Online usluge

Da bih pokazao kako usluge rade, napravio sam snimak zaslona jednog od svojih članaka. Ta će slika biti prenesena u sve usluge, čiji je opis predstavljen u nastavku.

1) //www.ocrconvert.com/

Doista mi se sviđa ova usluga zbog svoje jednostavnosti. Stranica je, iako engleski, ali dobro funkcionira s ruskim jezikom. Nema potrebe za registracijom. Da biste započeli prepoznavanje, trebate učiniti 3 akcije:

- učitajte svoju sliku;

- odaberite jezik teksta koji se nalazi na slici;

- pritisnite tipku pokretanja prepoznavanja.

Podrška za formate: PDF, GIF, BMP, JPEG.

Rezultat je predstavljen ispod na slici. Moram reći, tekst je prilično dobro prepoznat. Uz to, vrlo brzo - čekao sam bukvalno 5-10 sekundi.

 

2) //www.i2ocr.com/

Ova usluga funkcionira slično gore. Ovdje također morate preuzeti datoteku, odabrati jezik prepoznavanja i kliknuti tipku za ekstrakt teksta. Usluga radi vrlo brzo: 5-6 sekundi. jedna stranica.

Podržani formati: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Rezultat ove internetske usluge mnogo je prikladniji: odmah vidite dva prozora - u prvom - rezultat prepoznavanja, u drugom - originalnu sliku. Stoga je dovoljno jednostavno vršiti izmjene dok uređujete. Uzgred, prijava u servisu takođe nije potrebna.

 

 

3) //www.newocr.com/

Ova je usluga jedinstvena na više načina. Prvo, podržava "novonastali" DJVU format (usput, puni spisak formata: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Drugo, podržava odabir područja teksta na slici. Ovo je vrlo korisno kada na slici imate ne samo tekstualna područja već i grafička područja koja ne trebate prepoznavati.

Kvaliteta prepoznavanja je iznad prosjeka, nema potrebe za registracijom.

 

4) //www.free-ocr.com/

Vrlo jednostavna usluga za prepoznavanje: prenesite sliku, odredite jezik, unesite captcha (usput, jedinu uslugu u ovom članku gdje to učiniti) i pritisnite gumb za prevođenje slike u tekst. Zapravo sve!

Podržani formati: PDF, JPG, GIF, TIFF, BMP.

 

Rezultat prepoznavanja je srednji. Ima grešaka, ali ne mnogo. Međutim, kada bi kvaliteta originalnog snimka zaslona bila veća, došlo bi do redoslijeda manje pogrešaka.

PS

To je sve za danas. Ako znate zanimljivije usluge prepoznavanja teksta - podijelite u komentarima, bit ću vam zahvalan. Jedan uvjet: poželjno je da se ne morate registrirati, a usluga je besplatna.

Sve najbolje!

Pin
Send
Share
Send