Pande Napolnite Nan z 0

Pande Napolnite Nan Z 0



Znanost o podatkih običajno vključuje manjkajoče podatke. Celotno vrstico je mogoče zavreči ali pa kombinaciji vrstica-stolpec dodati vrednost. Opustitev vrstice/stolpca bi bila nesmiselna, ker odpravi določeno meritev za vsako vrstico. NaN, kar pomeni »Ni številka«, je eden od tipičnih načinov za prikaz vrednosti, ki manjka v naboru podatkov. Da bi dosegli želene rezultate, je ravnanje z NaN precej pomembno. Ugotovimo torej, kako spremeniti vrednosti NaN v vrstici ali stolpcu Pandas DataFrame na 0.

Pande Izpolnite NaN vrednosti

Če ima stolpec v vašem podatkovnem okviru vrednosti NaN ali None, lahko uporabite funkciji »fillna()« ali »replace()«, da jih zapolnite z ničlo (0).

izpolni ()







Vrednosti NA/NaN se izpolnijo s ponujenim pristopom s funkcijo »fillna()«. Uporabite ga lahko ob upoštevanju naslednje sintakse:



Če želite izpolniti vrednosti NaN za en stolpec, je sintaksa naslednja:




Ko morate izpolniti vrednosti NaN za celoten DataFrame, je sintaksa navedena:






Zamenjati()

Za zamenjavo enega samega stolpca vrednosti NaN je podana sintaksa naslednja:




Medtem ko moramo za zamenjavo vrednosti NaN celotnega okvira DataFrame uporabiti naslednjo omenjeno sintakso:


V tem delu pisanja bomo zdaj raziskali in se naučili praktičnega izvajanja obeh metod za zapolnitev vrednosti NaN v našem Pandas DataFrame.

Primer 1: Izpolnite vrednosti NaN z metodo Pandas “Fillna()”.

Ta ilustracija prikazuje uporabo Pandasove funkcije »DataFrame.fillna()« za zapolnitev vrednosti NaN v danem DataFrame z 0. Manjkajoče vrednosti lahko izpolnite v enem stolpcu ali pa jih zapolnite za celoten DataFrame. Tukaj bomo videli obe tehniki.

Za izvajanje teh strategij moramo pridobiti ustrezno platformo za izvajanje programa. Zato smo se odločili za uporabo orodja »Spyder«. Našo kodo Python smo začeli z uvozom nabora orodij »pandas« v program, ker moramo uporabiti funkcijo Pandas za izdelavo podatkovnega okvira in zapolnitev manjkajočih vrednosti v tem podatkovnem okvirju. »pd« se v celotnem programu uporablja kot vzdevek za »pande«.

Zdaj imamo dostop do funkcij Panda. Najprej uporabimo njegovo funkcijo 'pd.DataFrame()', da ustvarimo naš DataFrame. To metodo smo poklicali in jo inicializirali s tremi stolpci. Naslovi teh stolpcev so »M1«, »M2« in »M3«. Vrednosti v stolpcu »M1« so »1«, »Brez«, »5«, »9« in »3«. Vnosi v »M2« so »Brez«, »3«, »8«, »4« in »6«. Medtem ko 'M3' shrani podatke kot '1', '2', '3', '5' in 'Brez'. Potrebujemo objekt DataFrame, v katerega lahko shranimo ta DataFrame, ko se pokliče metoda »pd.DataFrame()«. Ustvarili smo 'manjkajoči' objekt DataFrame in ga dodelili glede na rezultat, ki smo ga dobili od funkcije 'pd.DataFrame()'. Nato smo uporabili Pythonovo metodo »print()« za prikaz DataFrame na konzoli Python.


Ko zaženemo ta del kode, si lahko na terminalu ogledamo DataFrame s tremi stolpci. Tukaj lahko opazimo, da vsi trije stolpci vsebujejo ničelne vrednosti.


Ustvarili smo DataFrame z nekaj ničelnimi vrednostmi, da uporabimo funkcijo Pandas »fillna()« za zapolnitev manjkajočih vrednosti z 0. Naučimo se, kako lahko to storimo.

Po prikazu DataFrame smo priklicali funkcijo Pandas 'fillna()'. Tu se bomo naučili zapolniti manjkajoče vrednosti v enem stolpcu. Sintaksa za to je že omenjena na začetku vadnice. Podali smo ime DataFrame in določili določen naslov stolpca s funkcijo ».fillna()«. Med oklepaji te metode smo podali vrednost, ki bo postavljena na ničelna mesta. Ime DataFrame »manjka« in stolpec, ki smo ga izbrali tukaj, je »M2«. Vrednost med oklepaji »fillna()« je »0«. Nazadnje smo poklicali funkcijo »print()« za ogled posodobljenega DataFrame.


Tukaj lahko vidite, da stolpec »M2« podatkovnega okvira zdaj ne vsebuje manjkajočih vrednosti, ker je vrednost NaN zapolnjena z 0.


Za zapolnitev vrednosti NaN za celoten DataFrame z isto metodo smo poklicali »fillna()«. To je čisto preprosto. Ime DataFrame smo zagotovili s funkcijo 'fillna()' in dodelili vrednost funkcije '0' med oklepaje. Končno nam je funkcija »print()« pokazala izpolnjen DataFrame.


Tako dobimo DataFrame brez vrednosti NaN, saj so vse vrednosti zdaj znova napolnjene z 0.

Primer 2: Izpolnite vrednosti NaN z metodo Pandas »Replace()«.

Ta del članka prikazuje drugo metodo zapolnitve vrednosti NaN v DataFrame. Uporabili bomo funkcijo »replace()« programa Pandas, da zapolnimo vrednosti v enem stolpcu in v celotnem DataFrame.

Kodo začnemo pisati v orodju “Spyder”. Najprej smo uvozili zahtevane knjižnice. Tukaj smo naložili knjižnico Pandas, da omogočimo programu Python uporabo metod Pandas. Druga knjižnica, ki smo jo naložili, je NumPy in jo imenujemo »np«. NumPy obravnava manjkajoče podatke z metodo »replace()«.

Nato smo ustvarili DataFrame s tremi stolpci – »vijak«, »žebelj« in »svrtanje«. Vrednosti v vsakem stolpcu so podane posebej. Stolpec »vijak« ima vrednosti »112«, »234«, »Brez« in »650«. Stolpec »žebelj« ima »123«, »145«, »Brez« in »711«. Nazadnje ima stolpec »drill« vrednosti »312«, »Brez«, »500« in »Brez«. DataFrame je shranjen v objektu DataFrame »tool« in prikazan z uporabo metode »print()«.


DataFrame s štirimi vrednostmi NaN v zapisu lahko vidite na naslednji izhodni sliki:


Zdaj uporabljamo Pandasovo metodo »replace()« za zapolnitev ničelnih vrednosti v enem samem stolpcu DataFrame. Za nalogo smo priklicali funkcijo 'replace()'. Ime DataFrame »orodje« in stolpec »vijak« smo dodali z metodo ».replace()«. Med oklepajema nastavimo vrednost »0« za vnose »np.nan« v DataFrame. Za prikaz izhoda se uporablja metoda »print()«.


Nastali DataFrame nam pokaže prvi stolpec z vnosi NaN, ki so zamenjani z 0 v stolpcu »vijak«.


Zdaj se bomo naučili zapolniti vrednosti v celotnem DataFrame. Poklicali smo metodo »replace()« z imenom DataFrame in podali vrednost, ki jo želimo nadomestiti z vnosi np.nan. Končno smo natisnili posodobljen DataFrame s funkcijo »print()«.


To nam prinese končni DataFrame brez manjkajočih zapisov.

Zaključek

Obravnava manjkajočih vnosov v DataFrame je temeljna in nujna zahteva za zmanjšanje kompleksnosti in kljubovalno ravnanje s podatki v procesu analize podatkov. Pandas nam ponuja nekaj možnosti za obvladovanje te težave. V tem vodniku smo predstavili dve priročni strategiji. Obe tehniki smo uporabili v praksi s pomočjo orodja »Spyder« za izvajanje vzorčnih kod, da vam naredimo stvari nekoliko razumljivejše in lažje. Pridobivanje znanja o teh funkcijah bo izostrilo vaše sposobnosti Pandas.