Kako izvesti klasifikacijo besedila s pomočjo transformatorjev

V tej dobi so Transformerji najmočnejši modeli, ki so zagotovili najboljše rezultate v več operacijah NLP (Obdelava naravnega jezika). Sprva je bil uporabljen za naloge jezikovnega modeliranja, vključno z ustvarjanjem besedila, pa tudi klasifikacijo, strojnim prevajanjem in številnimi drugimi. Zdaj pa se uporablja tudi za prepoznavanje predmetov, klasifikacijo slik in številne druge naloge računalniškega vida.

V tej vadnici bomo podali postopek za izvedbo klasifikacije besedila s pomočjo Transformers.

Kako izvesti klasifikacijo besedila s pomočjo transformatorjev?

Če želite izvesti klasifikacijo besedila s pomočjo Transformers, najprej namestite » transformatorji ” tako, da izvedete podani ukaz:

! pip namestite transformatorji

Kot lahko vidite, je bila navedena knjižnica uspešno nameščena:

Nato uvozite » cevovod ' Iz ' transformatorji ' knjižnica:

iz uvoznega cevovoda transformatorjev

Tukaj je ' cevovod ” bo vključeval nalogo NLP, ki jo moramo opraviti, in želeni transformatorski model za to operacijo skupaj s tokenizerjem.

Opomba: Tokenizer se uporablja za izvajanje obdelave besedila, ki se zagotovi vnos modela z ločevanjem besedila na žetone.

Po tem uporabite » cevovod() ' funkcijo in ji posredujte ' zero-shot-classification « kot argument. Nato posredujte drug parameter, ki je naš model. Uporabljamo Facebook ' BART ” model transformatorja. Tukaj ne uporabljamo tokenizerja, ker ga je mogoče samodejno sklepati glede na navedeni model:

text_classifier = cevovod ( 'zero-shot-classification' , model = 'facebook/bart-large-mnli' )

Zdaj pa razglasite ' nasl ” spremenljivka, ki vsebuje naše vhodno besedilo, ki ga je treba razvrstiti. Nato podamo kategorije, v katere želimo razvrstiti besedilo, in jih shranimo v » lab «, ki je znan kot oznake:

nasl = 'Lektoriranje in urejanje sta nujni komponenti za zagotavljanje jasnosti, skladnosti in vsebine brez napak.'
laboratorij = [ 'nadgradnja' , 'napaka' , 'pomemben' , 'preverjanje' ]

Končno zaženite cevovod skupaj z vnosom:

besedilni_klasifikator ( nasl , lab )

Kot lahko vidite, je model po izvedbi cevovoda predvidel razvrstitev našega posredovanega zaporedja:

Dodatne informacije: Če želite pospešiti delovanje modela, morate uporabiti GPU. Če je odgovor pritrdilen, potem lahko v ta namen podate argument naprave za cevovod in ga nastavite na ' 0 ” za uporabo GPE-ja.

Če želite razvrstiti besedilo v več kot enem stavku zaporedja/vhodnega besedila, jih lahko dodate na seznam in ga posredujete kot vnos v cevovode. V ta namen si oglejte delček kode:

nasl = [ 'Lektoriranje in urejanje sta nujni komponenti za zagotavljanje jasnosti, skladnosti in vsebine brez napak.' ,
'V tej moderni dobi je SEO optimizacija bistvena za dobro uvrstitev člankov in doseganje širšega občinstva.' ]

besedilni_klasifikator ( nasl , lab )

Izhod

To je to! Zbrali smo najlažji način za izvedbo klasifikacije besedil s pomočjo Transformers.

Zaključek

Transformatorji se uporabljajo za izvajanje nalog jezikovnega modeliranja, kot so generiranje besedila, klasifikacija besedila in strojno prevajanje, kot tudi naloge računalniškega vida, vključno s prepoznavanjem objektov in klasifikacijo slik. V tej vadnici smo ponazorili postopek za izvedbo klasifikacije besedila s pomočjo Transformers.

Kako izvesti klasifikacijo besedila s pomočjo transformatorjev

Kako izvesti klasifikacijo besedila s pomočjo transformatorjev?

Zaključek

Kategorija

Priljubljene Objave

Kako omogočiti dnevnike dostopa za vašo aplikacijo Load Balancer?

Integer Division Java

Kako narediti vohljalo

Kako ustvariti enovrstično zanko For v Pythonu

Kako nastaviti in odpreti Windows Pripovedovalec

Kako spremeniti vrata VNC za oddaljeni dostop Raspberry Pi

Metoda filtra objemanja obraza ().

Kako dodati oznake gradnje Golang

Kako namestiti in uporabljati Docker v sistemu Fedora in CentOS?

Kako filtrirati tabelo v JavaScriptu

window.onload proti document.onload v JavaScriptu

Kako najti in odpreti datoteke z ukaznim pozivom v sistemu Windows 11?

Kako omogočiti oddaljeno namizje na Ubuntu Desktop 22.04 LTS in dostopati do njega iz sistema Windows

Kako analizirati sinusne valovne oblike v izmeničnem tokokrogu

For-Loop v R DataFrame

NumPy Element Wise Division

Kako uporabiti metodo String isEmpty() v Javi?

Kako se overflow:scroll razlikuje od overflow: auto?

Kaj je EOF v programskem jeziku C

Kako prešteti število datotek v imeniku v Linuxu