Kako uporabiti tokenizatorje v transformatorjih objemajočih obrazov?

Obdelava naravnega jezika (NLP) deluje na surovi obliki podatkov. Modeli strojnega učenja se usposabljajo na kompleksnih podatkih, vendar ne morejo razumeti neobdelanih podatkov. Ta neobdelana oblika podatkov mora imeti povezano neko numerično vrednost. Ta vrednost določa vrednost in pomembnost besede v podatkih in na tej podlagi se izvajajo izračuni.

Ta članek ponuja vodnik po korakih o uporabi tokenizatorjev v Hugging Face Transformers.

Kaj je Tokenizer?

Tokenizer je pomemben koncept NLP, njegov glavni cilj pa je pretvoriti neobdelano besedilo v številke. V ta namen obstajajo različne tehnike in metodologije. Vendar je treba omeniti, da vsaka tehnika služi določenemu namenu.
Kako uporabiti tokenizatorje v transformatorjih objemajočih obrazov?

Kako uporabiti tokenizatorje v transformatorjih objemajočih obrazov?

Knjižnico tokenizerja morate najprej namestiti, preden jo uporabite in iz nje uvozite funkcije. Nato usposobite model z uporabo AutoTokenizerja in nato zagotovite vnos za izvedbo tokenizacije.

Hugging Face uvaja tri glavne kategorije tokenizacije, ki so navedene spodaj:

Besedni Tokenizer
Tokenizer na osnovi znakov
Tokenizer na podlagi podbesed

Tukaj je vodnik po korakih za uporabo Tokenizers v Transformers:

1. korak: Namestite transformatorje
Če želite namestiti transformatorje, uporabite ukaz pip v naslednjem ukazu:

! pip namestite transformatorji

2. korak: uvozite razrede
Od transformatorjev, uvoz cevovod , in AutoModelForSequenceClassification knjižnica za izvedbo klasifikacije:

iz cevovoda za uvoz transformatorjev, AutoModelForSequenceClassification

3. korak: Uvozite model
' AutoModelForSequenceClassification ” je metoda, ki spada v Auto-Class za tokenizacijo. The from_pretrained() metoda se uporablja za vrnitev pravilnega razreda modela glede na tip modela.

Tukaj smo navedli ime modela v ' ime modela ” spremenljivka:

ime modela = 'distilbert-base-uncased-finetuned-sst-2-english'
pre_trainingmodel =AutoModelForSequenceClassification.from_pretrained ( ime modela )

4. korak: uvozite AutoTokenizer
Podajte naslednji ukaz za generiranje žetonov s posredovanjem » ime modela « kot argument:

iz transformatorjev uvozite AutoTokenizer

ustvarjeni žeton =AutoTokenizer.from_pretrained ( ime modela )

5. korak: Ustvarite žeton
Zdaj bomo ustvarili žetone na stavku “Obožujem dobro hrano” z uporabo ' ustvarjeni žeton ” spremenljivka:

besede =generatetoken ( 'Obožujem dobro hrano' )
tiskanje ( besede )

Izhod je podan na naslednji način:

Koda za zgoraj Google Co je podana tukaj.

Zaključek

Če želite uporabiti tokenizatorje v Hugging Face, namestite knjižnico z ukazom pip, usposobite model z uporabo AutoTokenizerja in nato zagotovite vnos za izvedbo tokenizacije. Z uporabo tokenizacije dodelite uteži besedam, na podlagi katerih so zaporedne, da ohranite pomen stavka. Ta ocena tudi določa njihovo vrednost za analizo. Ta članek je podroben vodnik o uporabi tokenizatorjev v Hugging Face Transformers.

Kako uporabiti tokenizatorje v transformatorjih objemajočih obrazov?

Kaj je Tokenizer?

Kako uporabiti tokenizatorje v transformatorjih objemajočih obrazov?

Zaključek

Kategorija

Priljubljene Objave

Kako ustvariti navpične drsne trakove z »window.open()« v JavaScriptu?

Kako odpraviti težavo z mapo WindowsApps ni mogoče dostopati v sistemu Windows 10?

Kakšen je namen lastnosti »h-screen« v Tailwindu

Spodnja funkcija PostgreSQL

Ali lahko pride do vdora v račune Discord? Kako ostati varen!

Kako ustvariti zasebni omrežni vmesnik NAT na Proxmox VE 8

Kako spremeniti privzeti iskalnik v iPhonu

8 popravkov za drsenje sledilne ploščice, ki ne deluje

Kako redko prevzeti samo eno datoteko iz skladišča Git?

Razvrstite ključe na zemljevidu s pomočjo JavaScripta

Kaj je event.target v JavaScriptu?

Kako odpraviti težavo »Vleci in spusti VirtualBox ne deluje«?

Kako uporabiti ukaz »describe-subnets« v AWS CLI?

Kako uporabljati Max Heap v Javi?

Kako pridobiti URL slike v Midjourney?

Kako omogočiti in onemogočiti omrežni vmesnik v sistemu Fedora Linux

Kako najti količino pomnilnika Raspberry Pi

SQL Server Ustvari uporabnika

Kako pustiti časovne omejitve za seboj v Node.js?

Kako uporabljati napake. Funkcija New() v Golangu – Primeri