Kako namestiti Tesseract v sistem Windows

Kako Namestiti Tesseract V Sistem Windows



Tesseract je prosto dostopno odprtokodno orodje za prepoznavanje besedila, znano tudi kot OCR (optično prepoznavanje znakov). Uporablja se predvsem za prepoznavanje in ekstrahiranje besedila iz slik. Prebral bo besedilo iz slikovnih podatkov in zapisal izhod v novo datoteko .txt. Tesseract deluje tudi pod Pythonom, saj se uporablja predvsem za prepoznavanje rokopisa iz slik. Uporablja model LSTR (long short-term memory). Tesseract deluje pod licenco Apache 2.0.

V tem spletnem dnevniku bomo podrobneje opisali način namestitve Tesseracta v sistem Windows.







Torej, začnimo!



Kako namestiti Tesseract v Windows?

Tesseract je orodje ukazne vrstice, ki se uporablja za črpanje besedila iz slik. Če želite namestiti Tesseract v sistem Windows, morate slediti spodnjim navodilom.



1. korak: Prenesite namestitveni program Tesseract





Najprej se pomaknite na spodnjo povezavo in prenesite namestitveni program Tesseract v skladu s specifikacijo vašega sistema:

https: // github.com / UB-Mannheim / teserakt / teden



2. korak: Zaženite namestitveni program Tesseract

Obiščite “ Prenosi ” imenik, kamor je prenesen namestitveni program Tesseract. Če želite namestiti Tesseract v sistem Windows, zaženite namestitveni program Tesseract tako, da dvokliknete nanj:

3. korak: Izberite jezik

Namestitveni program Tesseract podpira številne jezike. Za interakcijo z uporabniškim vmesnikom namestitvenega programa izberite » angleščina « kot vaš jezik in kliknite » v redu ”:

4. korak: Namestite Tesseract

Ko to storite, se na zaslonu prikaže čarovnik za nastavitev Tesseract OCR. Za začetek namestitve Tesseracta pritisnite » Naslednji ” gumb:

Sprejeti ' Licenčna pogodba «, kliknite » Strinjam se ” gumb:

Izberite ' Namestitev za vsakogar, ki uporablja ta računalnik ' in pritisnite ' Naslednji ” gumb:

Če želite dodati skriptne podatke ali vključiti drug jezik, označite ustrezna potrditvena polja in pritisnite » Naslednji ”. Ker ne želimo dodatnega podatkovnega skripta ali jezika, bomo nadaljevali s privzeto izbranimi možnostmi:

Izberite mesto namestitve in kliknite » Naslednji ” gumb:

Če ne želite ustvariti bližnjice v meniju Start, označite » Ne ustvarjaj bližnjic « potrditveno polje in pritisnite » Namestite ” gumb:

Po tem se bo začela namestitev Tesseract. Počakajte, da se namestitev konča, in pritisnite » Naslednji ” gumb:

Nazadnje kliknite » Končaj ” gumb:

5. korak: Nastavite spremenljivko okolja

Po namestitvi morate nastaviti spremenljivko okolja za Tesseract. Če želite to narediti, najprej obiščite imenik, v katerega ste namestili Tesseract, in kopirajte pot iz » Naslov ' bar:

Poiščite » Spremenljivke okolja ' v ' Začeti »meni in odpri« Uredite spremenljivke sistemskega okolja ”:

Znotraj nastavitev se pomaknite do » Napredno ' in kliknite na ' Spremenljivke okolja ” gumb:

Izberite ' Pot ' Spremenljivka iz ' Sistemske spremenljivke « in pritisnite » Uredi ” gumb:

Potem ' Uredi spremenljivko okolja « se bo na zaslonu pojavilo okno. Pritisnite ' Novo ” in sem prilepite kopirano pot namestitvenega imenika Tesseract. Nazadnje kliknite » v redu ” gumb:

6. korak: Preverite namestitev Tesseract

Če želite preveriti namestitev Tesseract, odprite ukazni poziv sistema Windows z iskanjem » Ukazni poziv ' v ' Začeti ” meni:

Preverite različico Tesseract s priloženim ukazom:

> teserakt --različica

Spodnji izhod kaže, da smo uspešno namestili različico Tesseract ' v5.2.0 « v sistemu Windows:

Pojdimo naprej in preverimo, kako uporabljati Tesseract v sistemu Windows.

Kako uporabljati Tesseract v sistemu Windows?

Tesseract se uporablja za branje rokopisa ali pridobivanje besedila iz slik. Poglejmo, kako deluje:

1. korak: izberite sliko

Izberite sliko, iz katere želite izvleči besedilo. Kot smo izbrali' 1.png ”:

2. korak: Izvlecite besedilo iz slike

Ko je CMD odprt. Uporabite ' cd ” za spremembo imenika, kjer je shranjena slika. Nato zaženite ' teserakt ' in določite ime slikovne datoteke, kot smo določili ' 1.png ”. ' Besedilo ” Parameter kaže označuje ime izhodne datoteke:

> cd C:\Uporabniki\anuma\OneDrive\Pictures\Shranjene slike
> teserakt 1 .png 'Besedilo'

3. korak: Preverite ekstrakcijo besedila

Če želite preveriti ekstrakcijo besedila, se pomaknite do imenika, kjer obstaja slikovna datoteka. Vidite lahko, da je izhodna datoteka ' Besedilo ” je shranjen tudi tukaj. Dvakrat kliknite na izhodno datoteko, da preverite, ali je teserakt izvlekel besedilo iz slike ali ne:

Vidite lahko, da smo besedilo uspešno ekstrahirali z orodjem ukazne vrstice Tesseract:

Prikazali smo tehniko namestitve in uporabe Tesseract v sistemu Windows.

Zaključek

Če želite namestiti Tesseract v sistem Windows, morate prenesti namestitveni program Tesseract. V ta namen sledite prvi seji tega članka. Nato nastavite spremenljivko okolja Path za uporabo in dostop do Tesseract iz ukaznega poziva Windows. Nato izberite slikovno datoteko in uporabite » Tesseract ” za prepoznavanje in ekstrahiranje besedila iz slike. Tukaj ste se naučili namestiti in uporabljati ' Tesseract « na oknih.