Pandas Sum Column

Pandas Sum Column



»Ta članek bo prikazal, kako z uporabo Pythona sešteti vse ali določene stolpce v Pandas DataFrame. Funkcija DataFrame.sum() bo uporabljena skupaj z nekaj uporabnimi parametri v številnih primerih te vadnice.«

Ko bo ta vadnica končana, boste morda vedeli, kako:







    • Poiščite vsoto stolpca podatkovnega okvira v Pandas.
    • Dodajanje stolpcev podatkovnega okvirja skupaj
    • Dodajte stolpce v podatkovni okvir Pandas, ki izpolnjujejo podani pogoj.
    • Določite vsoto po združevanju podatkov podatkovnega okvira.

Kako določiti vsoto stolpcev Dataframe?

Funkcija »dataframe.sum()« v Pandas vrne skupno vsoto za določeno os. Če je vnos os indeksa, funkcija doda vrednosti vsakega stolpca posebej, nato pa naredi enako za vsak stolpec in vrne niz, ki shrani vsoto podatkov/vrednosti v vsakem stolpcu. Poleg tega podpira izračun vsote podatkovnega okvira z ignoriranjem manjkajočih vrednosti.



Sintaksa: DataFrame.sum(axis = None, skipna = None, level = None, numeric_only = None, min_count = 0, **kwargs)



Kje,





os: {stolpci (1), indeks (0)}

naročilo: Pri izračunu rezultata prezrite vrednosti NA/null.



raven: Če je podana os hierarhična (večindeks), preštejte na določeno raven indeksa, preden jo pretvorite v serijo.

samo_številsko: Sprejemljivi so samo stolpci float, int in boolean. Če None, poskusite uporabiti vse; če ne, samo številčni podatki. Za serije ni implementirano.

min_count: Število možnih vrednosti, potrebnih za dokončanje operacije. Rezultat bo NA, če bo prisotnih manj vrednosti, ki niso NA, kot min_count.

Vrne: DataFrame (če je navedena raven) ali serija.

Primer # 01: Določanje vsote stolpca Dataframe in vseh stolpcev

Najprej smo zahtevali podatkovni okvir z veljavnimi podatkovnimi tipi, tj. int, float itd., stolpcem ali stolpci, za katere lahko najdemo vsoto podatkov. Podatkovni okvir bo ustvarjen s funkcijo pd.DataFrame().


Zahtevani podatkovni okvir smo ustvarili iz slovarja python znotraj funkcije pd.DataFrame(). V zgoraj ustvarjenem podatkovnem okviru so štirje stolpci »Ime«, »dan1«, »dan2« in »dan3«. Od štirih stolpcev so trije stolpci, tj. »dan1«, »dan2« in »dan3«, številski stolpci z vrednostmi podatkov (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) oziroma (7, 4, 3, 5, 6, 2, 1, 4). Najdemo lahko samo vsoto za te tri stolpce. Vsoto za niz (tj. stolpec) in celoten podatkovni okvir lahko določite z metodo sum(). Začnimo s poučevanjem, kako sešteti vse podatke v stolpcu Pandas.


Za določitev vsote smo uporabili metodo sum() v stolpcu “day2”. Funkcija je vrnila vrednost vsote 28. Podobno kot to lahko določimo vsoto vsakega stolpca Dataframe. To boste dosegli preprosto z uporabo metode sum() v celotnem podatkovnem okviru.


Kot je razvidno, je vsota stolpca 'dan1' 31; za 'dan2' je vrednost vsote 28, medtem ko je za stolpec 'dan3' vrednost vsote 32.

Primer # 02: Uporaba funkcije sum() za skupno seštevanje vrednosti stolpca Dataframe

Kot lahko vidite iz izhoda prejšnjega primera, funkcija ni vrnila dejanskih podatkov stolpca podatkovnega okvira, ki so sestavljali vsoto. Vendar pa lahko z dodelitvijo metode »DataFrame.sum()« stolpcu DataFrame dostopate do vsakega stolpca v DataFrame, vključno s stolpcem vsote. Najprej ustvarimo drug podatkovni okvir za ta primer.


Z uporabo pd.DataFrame() je bil ustvarjen naš podatkovni okvir. Ustvarili smo podatkovni okvir s tremi stolpci: artikel, cena in davek. Postavka stolpca, ki vsebuje vrednosti niza (»pero«, »marker«, »ravnilo«, »radirka«, »svinčnik«, »odložišče«, »spenjalnik«, »zatiči«), cena stolpca, v kateri so shranjene vrednosti (20, 15, 10, 3, 5, 30, 35, 10), stolpec »davek« pa je sestavljen iz vrednosti (8, 5, 3, 3, 4, 10, 5, 2). Zdaj pa seštejmo vrednosti stolpca s ceno in davkom ter shranimo rezultate v nov stolpec, tako da ohranimo izvirne stolpce podatkovnega okvira.


Kot lahko opazite skupaj z novim stolpcem »skupaj«, funkcija vrne tudi izvirne stolpce danega podatkovnega okvira. V stolpcu »skupaj« je shranjena vsota vrednosti stolpcev »cena« in »davek« za vsak podatek »postavka«.

Primer # 03: Uporaba funkcije sum() za določitev vsote določenih stolpcev podatkovnega okvira

Če želite skupaj sešteti več stolpcev podatkovnega okvira, lahko podamo seznam z oznakami stolpcev in nato uporabimo metodo sum() na seznamu, da poiščemo vsoto. Kot v prejšnjih primerih bomo najprej ustvarili podatkovni okvir.


Ustvarili smo naš podatkovni okvir s štirimi stolpci »študenti«, »ocene1«, »ocene2« in »ocene3«. Stolpec »študenti« shranjuje podatke (»Larry«, »James«, »Rob«, »Arya«, »Max«, »Ben«, »Gwen«, »Bill«), stolpec »marks1« pa shranjuje vrednosti (8, 9, 6, 8, 10, 7, 9, 9), v stolpcih »oznake2« in »oznake3« pa so shranjene številske vrednosti (6, 6, 8, 6, 7, 9, 10, 9). ) oziroma (7, 6, 9, 7, 8, 7, 10, 10).


Najprej smo ustvarili predmet seznama z oznakami stolpcev »študenti«, »ocene1« in »ocene3«. Nato se metoda sum() uporabi za seznam. Funkcija je seštela vrednosti stolpcev ocene1 in ocene3 samo zato, ker stolpec »študenti« ni številski, zato funkcija sum() ne more najti vsote za vrednosti stolpca »študenti«. Vsoto vrednosti stolpcev »ocene1« in »ocene3« smo shranili v stolpec »vsota«.

Primer # 04: Dodajte stolpce podatkovnega okvira Pandas, ki izpolnjujejo določen pogoj

V tem primeru bomo dodali vrednosti določenih stolpcev, če izpolnjujejo podani pogoj.


V novo ustvarjenem podatkovnem okviru je 5 stolpcev, tj. »podjetje«, »week1_sales«, »week2_sales«, »week3_sales« in »branchs«. Zdaj pa predpostavimo, da ne želimo dodati vrednosti zadnjega stolpca, ko dodajamo ali iščemo vsoto vrednosti danih vrstic podatkovnega okvira. Recimo, da smo samo želeli dodati vrednosti stolpcev z besedo »teden« v njihovih oznakah. Ustvarite lahko razumevanje seznama, da ugotovite, ali je beseda »teden« prisotna v oznaki stolpca ali ne.


Zdaj smo pridobili stolpce, ki imajo v svojih oznakah besedo »teden«. Stolpce, ki vsebujejo besedo »teden«, lahko povzamemo z uporabo argumenta axis=1 v funkciji sum().


Na ta način lahko varno seštejemo podatke po stolpcih po vrsticah, ne da bi vključili stolpce, ki jih ne želimo.

Primer št. 5: Določite vsoto po združevanju podatkov podatkovnega okvira

Po združevanju podatkov enega ali več stolpcev lahko najdemo tudi vsoto stolpcev podatkovnega okvira. Metoda groupby() bo uporabljena za združevanje podatkov v kategorije znotraj stolpca. Ustvarimo podatkovni okvir, da bomo lahko združili podatke enega od njegovih stolpcev.


Sedaj bomo združili podatke v stolpec »starost« in sešteli vrednosti stolpcev »ocena1« in »ocena2« za vsako kategorijo skupine.


Vidimo lahko, da seštevek podatkov v podatkovnem okviru po prvem združevanju podatkovnih vrednosti po starosti povzroči vsoto po stolpcu, odvisno od starostnih skupin.

Zaključek

V tej vadnici smo vas poskušali naučiti, kako izračunati vsoto podatkovnih okvirov z uporabo metode vsote Pandas. O seštevanju vrednosti po vrsticah in stolpcih smo razpravljali v primerih te objave. Poleg tega ste se naučili, kako pogojno dodati stolpce in kako sešteti vrednosti po grupiranju stolpca podatkovnega okvira. Zdaj boste morda lahko sešteli stolpce podatkovnega okvira skupaj ali sami sešteli vrednosti v stolpcu podatkovnega okvira.