Kā instalēt Tesseract operētājsistēmā Windows

Ka Instalet Tesseract Operetajsistema Windows



Tesseract ir brīvi pieejams atvērtā pirmkoda teksta atpazīšanas rīks, kas pazīstams arī kā OCR (optiskā rakstzīmju atpazīšana). To galvenokārt izmanto, lai identificētu un izvilktu tekstu no attēliem. Tas nolasīs tekstu no attēla datiem un ierakstīs izvadi jaunā .txt failā. Tesseract darbojas arī ar Python, jo to galvenokārt izmanto, lai atpazītu rokrakstu no attēliem. Tas izmanto LSTR (ilgtermiņa īstermiņa atmiņas) modeli. Tesseract darbojas saskaņā ar Apache 2.0 licenci.

Šajā emuārā mēs aprakstīsim Tesseract instalēšanas metodi operētājsistēmā Windows.







Tātad, sāksim!



Kā instalēt Tesseract operētājsistēmā Windows?

Tesseract ir komandrindas rīks, ko izmanto teksta izvilkšanai no attēliem. Lai instalētu Tesseract operētājsistēmā Windows, jums ir jāizpilda tālāk sniegtie norādījumi.



1. darbība: lejupielādējiet Tesseract instalētāju





Pirmkārt, dodieties uz tālāk norādīto saiti un lejupielādējiet Tesseract instalēšanas programmu atbilstoši jūsu sistēmas specifikācijai:

https: // github.com / UB-Manheima / tesrakts / nedēļa



2. darbība: palaidiet Tesseract Installer

Apmeklējiet ' Lejupielādes ” direktorijā, kurā tiek lejupielādēta Tesseract instalēšanas programma. Lai instalētu Tesseract operētājsistēmā Windows, palaidiet Tesseract instalēšanas programmu, veicot dubultklikšķi uz tā:

3. darbība: atlasiet valodu

Tesseract instalētājs atbalsta daudzas valodas. Lai mijiedarbotos ar instalēšanas lietotāja saskarni, izvēlieties ' Angļu ' kā savu valodu un noklikšķiniet uz ' labi ”:

4. darbība. Instalējiet Tesseact

To darot, ekrānā parādīsies Tesseract OCR iestatīšanas vednis. Lai sāktu Tesseact instalēšanu, nospiediet ' Nākamais ” poga:

Lai pieņemtu “ Licences līgums ”, noklikšķiniet uz “ ES piekrītu ” poga:

Izvēlieties ' Instalējiet ikvienam, kas izmanto šo datoru ' opciju un nospiediet ' Nākamais ” poga:

Ja vēlaties pievienot skripta datus vai iekļaut citu valodu, atzīmējiet to atbilstošās izvēles rūtiņas un nospiediet ' Nākamais ” pogu. Tā kā mēs nevēlamies nekādu papildu datu skriptu vai valodu, mēs turpināsim ar noklusējuma atlasītajām opcijām:

Izvēlieties instalēšanas vietu un noklikšķiniet uz ' Nākamais ” poga:

Ja nevēlaties izveidot saīsni izvēlnē Sākt, atzīmējiet “ Neveidojiet īsceļus ' izvēles rūtiņa un nospiediet ' Uzstādīt ” poga:

Pēc tam tiks sākta Tesseract instalēšana. Pagaidiet, līdz instalēšana tiks pabeigta, un nospiediet ' Nākamais ” poga:

Visbeidzot noklikšķiniet uz ' Pabeigt ” poga:

5. darbība: iestatiet vides mainīgo

Pēc instalēšanas jums jāiestata Tesseract vides mainīgais. Lai to izdarītu, vispirms apmeklējiet direktoriju, kurā instalējāt Tesseract, un kopējiet ceļu no ' Adrese ' bārs:

Meklējiet ' Vides mainīgie ' iekš ' Uzsākt izvēlni un atveriet Rediģējiet sistēmas vides mainīgos ”:

Iestatījumos dodieties uz “ Papildu iestatīšanas izvēlni un noklikšķiniet uz Vides mainīgie ” poga:

Izvēlies ' Ceļš 'Mainīgais no ' Sistēmas mainīgie ” paneli un nospiediet „ Rediģēt ” poga:

Pēc tam ' Rediģēt vides mainīgo ” logs parādīsies ekrānā. Nospiediet “ Jauns ” pogu un ielīmējiet šeit nokopēto Tesseract instalācijas direktorija ceļu. Visbeidzot noklikšķiniet uz ' labi ” poga:

6. darbība: pārbaudiet Tesseract instalēšanu

Lai pārbaudītu Tesseract instalēšanu, atveriet Windows komandu uzvedni, meklējot “ Komandu uzvedne ' iekš ' Uzsākt ” izvēlne:

Pārbaudiet Tesseract versiju, izmantojot norādīto komandu:

> tesrakts -- versija

Zemāk dotā izvade norāda, ka esam veiksmīgi instalējuši Tesseract versiju ' v5.2.0 ” operētājsistēmā Windows:

Turpināsim, lai pārbaudītu, kā lietot Tesseract operētājsistēmā Windows.

Kā lietot Tesseract operētājsistēmā Windows?

Tesseract tiek izmantots, lai lasītu rokrakstu vai izvilktu tekstu no attēliem. Apskatīsim, kā tas darbojas:

1. darbība: atlasiet attēlu

Atlasiet attēlu, no kura vēlaties izvilkt tekstu. Kā mēs esam izvēlējušies ' 1.png ”:

2. darbība: izņemiet tekstu no attēla

Kad CMD ir atvērts. Izmantojiet ' cd ” komandu, lai mainītu direktoriju, kurā tiek saglabāts attēls. Pēc tam palaidiet ' tesrakts ' komandu un definējiet attēla faila nosaukumu, kā mēs esam norādījuši ' 1.png ”. ' Teksts ” parametru rādījumi apzīmē izvades faila nosaukumu:

> cd C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesrakts 1 .png 'Teksts'

3. darbība: pārbaudiet teksta izvilkšanu

Lai pārbaudītu teksta izvilkšanu, pārejiet uz direktoriju, kurā atrodas attēla fails. Jūs varat redzēt, ka izvades fails ' Teksts ” arī šeit ir saglabāts. Veiciet dubultklikšķi uz izvades faila, lai pārbaudītu, vai tesserakts ir izvilcis tekstu no attēla vai nē:

Varat redzēt, ka esam veiksmīgi izvilkuši tekstu, izmantojot Tesseract komandrindas rīku:

Mēs esam parādījuši Tesseract instalēšanas un lietošanas paņēmienu operētājsistēmā Windows.

Secinājums

Lai instalētu Tesseract operētājsistēmā Windows, ir nepieciešams lejupielādēt Tesseract instalēšanas programmu. Šim nolūkam izpildiet šī raksta pirmo sesiju. Pēc tam iestatiet Path vides mainīgo, lai to izmantotu un piekļūtu Tesseract no Windows komandrindas. Pēc tam atlasiet attēla failu un izmantojiet ' Tesseact ” komanda, lai atpazītu un izvilktu no attēla tekstu. Šeit jūs esat iemācījušies instalēt, kā arī izmantot ' Tesseact ” uz logiem.