Kā veikt teksta klasifikāciju, izmantojot transformatorus

Šajā laikmetā Transformatori ir visjaudīgākie modeļi, kas ir nodrošinājuši vislabākos rezultātus vairākās NLP (dabiskās valodas apstrādes) darbībās. Sākotnēji tas tika izmantots valodu modelēšanas uzdevumiem, tostarp teksta ģenerēšanai, kā arī klasifikācijai, mašīntulkošanai un daudzām citām darbībām. Bet tagad to izmanto arī objektu atpazīšanai, attēlu klasifikācijai un vairākiem citiem datora redzes uzdevumiem.

Šajā apmācībā mēs sniegsim procedūru teksta klasifikācijas veikšanai, izmantojot transformatorus.

Kā veikt teksta klasifikāciju, izmantojot transformatorus?

Lai veiktu teksta klasifikāciju, izmantojot transformatorus, vispirms instalējiet ' transformatori ” bibliotēku, izpildot norādīto komandu:

! pip uzstādīt transformatori

Kā redzat, norādītā bibliotēka ir veiksmīgi instalēta:

Pēc tam importējiet ' cauruļvads ' no ' transformatori ” bibliotēka:

no transformatoru importa cauruļvada

Šeit “ cauruļvads ” ietvers NLP uzdevumu, kas mums jāveic, un šai darbībai vēlamo transformatora modeli kopā ar marķieri.

Piezīme: Tokenizators tiek izmantots, lai apstrādātu tekstu, kas nodrošina modeļa ievadi, sadalot tekstu marķieros.

Pēc tam izmantojiet ' cauruļvads () ' funkciju un nododiet tai ' nulles šāviena klasifikācija ” kā argumentu. Pēc tam nododiet citu parametru, kas ir mūsu modelis. Mēs izmantojam Facebook ' BART ” transformatora modelis. Šeit mēs neizmantojam marķieri, jo to var automātiski secināt pēc norādītā modeļa:

text_classifier = konveijera ( 'nulles šāviena klasifikācija' , modelis = 'facebook/bart-large-mnli' )

Tagad paziņojiet ' sek ” mainīgais, kas satur mūsu ievadīto tekstu, kas ir jāklasificē. Pēc tam mēs nodrošinām kategorijas, kurās vēlamies klasificēt tekstu un saglabāt mapē “ lab ', kas ir pazīstams kā etiķetes:

sek = 'Korektūra un rediģēšana ir nepieciešami komponenti, lai nodrošinātu satura skaidrību, saskaņotību un bez kļūdām'
laboratorija = [ 'Atjaunināt' , 'kļūda' , 'svarīgs' , 'pārbaude' ]

Visbeidzot, palaidiet cauruļvadu kopā ar ievadi:

teksta_klasifikators ( sek , lab )

Pēc cauruļvada izpildes, kā redzat, modelis paredzēja, ka mūsu sniegtā secība tiks klasificēta:

Papildus informācija: Ja vēlaties paātrināt modeļa veiktspēju, jums ir jāizmanto GPU. Ja jā, tad šim nolūkam varat norādīt konveijeram ierīces argumentu un iestatīt to uz “ 0 ”, lai izmantotu GPU.

Ja vēlaties klasificēt tekstu vairāk nekā vienā secības/ievades teksta priekšrakstā, varat tos pievienot sarakstam un nosūtīt to kā ievadi konveijeriem. Šim nolūkam skatiet koda fragmentu:

sek = [ 'Korektūra un rediģēšana ir nepieciešami komponenti, lai nodrošinātu satura skaidrību, saskaņotību un bez kļūdām' ,
'Šajā modernajā laikmetā SEO optimizācija ir būtiska, lai raksti iegūtu labu vietu un sasniegtu plašāku auditoriju.' ]

teksta_klasifikators ( sek , lab )

Izvade

Tieši tā! Mēs esam apkopojuši vienkāršāko veidu, kā veikt teksta klasifikāciju, izmantojot Transformatorus.

Secinājums

Transformatorus izmanto, lai veiktu valodas modelēšanas uzdevumus, piemēram, teksta ģenerēšanu, teksta klasifikāciju un mašīntulkošanu, kā arī datorredzes uzdevumus, tostarp objektu atpazīšanu un attēlu klasifikāciju. Šajā apmācībā mēs esam ilustrējuši teksta klasifikācijas veikšanas procesu, izmantojot transformatorus.

Kā veikt teksta klasifikāciju, izmantojot transformatorus

Kā veikt teksta klasifikāciju, izmantojot transformatorus?

Secinājums

Kategorija

Populārākas Posts

Kā pārkārtot fotoattēlus albumos Android tālrunī

Kā atspējot pavedienus vietnē Discord Mobile?

Kā pārvaldīt Elasticsearch AWS EC2?

Kā iestatīt pielāgotu tagu programmā Discord Nitro

Kā iegūt PPK failu no AWS EC2 instances

Kā PHP izmantot funkciju is_scalar ().

JavaScript Regex (lietotājvārda pārbaude)

Kā izstrādāt MongoDB, izmantojot JavaScript

Kā instalēt Roblox operētājsistēmā Linux Mint 21

Kā attēlot datus kartē Streamlit?

Saīsiniet virkni JavaScript

Kā atrast vietu diskā operētājsistēmā Linux Mint 21

Kā atinstalēt VirtualBox 7

Kā lietot aizstājvārda komandu operētājsistēmā Linux

Kā mainīt attēla krāsu CSS

Kā iestatīt minimālo un maksimālo augstumu robežvēja pārtraukuma punktiem un multivides vaicājumiem

Kas ir toFixed() JavaScript

Kā atspējot SELinux operētājsistēmā Fedora Linux 39

Kāda ir atšķirība starp publisko, privāto un aizsargāto PHP?

Kā labot “Kļūda, izmantojot / Matricas izmēriem jāsakrīt” MATLAB