Stolpec Pandas Insert().

Stolpec Pandas Insert



»Python ponuja široko paleto podatkovnih struktur in operacij za obdelavo numeričnih podatkov in podatkov časovnih vrst. DataFrame, ki smo ga ustvarili ali uvozili v Pandas, je mogoče uporabiti za različne namene. Stolpce v podatkovnem okviru je mogoče prilagoditi tudi skupaj z virom podatkov. Pande poenostavijo veliko dolgočasnih in zamudnih opravil, povezanih z obdelavo podatkov. Obstajajo štirje načini za dodajanje stolpca DataFrame v Pandas, vendar v tem članku uporabljamo funkcijo 'insert()' stolpca pande.

Ko zgradimo ali naložimo naš dataFrame v Pandas, lahko želimo doseči vrsto stvari. Na primer, lahko še naprej manipuliramo s podatki, na primer s spreminjanjem stolpcev v podatkovnem okviru. Nato moramo razumeti, kako vključiti stolpce v podatkovni okvir, če večina podatkov prihaja od enega ponudnika podatkov, nekaj podatkov pa od drugega. Stolpec je mogoče enostavno dodati v Pandas dataFrame.«







Metoda Pandas insert().

Zadnji stolpec podatkovnega okvira ustvari druga funkcija. Z uporabo metode »insert()« DataFrame lahko dodate stolpce med trenutne stolpce, namesto da jih dodate na dno pandas DataFrame. Ponuja nam možnost, da dodamo stolpec kjerkoli poljubno, ne le na koncu. Poleg tega ponuja veliko načinov za dodajanje vrednosti za stolpce. Ko morate dodati stolpec na določen položaj ali indeks, je uporabna funkcija pandas »insert()«.



Sintaksa za stolpec Pandas insert().



Primer 1: Vstavljanje stolpca v podatkovni okvir z metodo Pandas insert().

Začnite s prvim primerom članka, v katerem bomo razložili, kako vstaviti stolpec v podatkovni okvir. Z uporabo orodja “spyder” lahko to kodo dokažemo. Najprej ustvarimo podatkovni okvir z imenom 'tečaj'. V tem podatkovnem okviru imamo dva stolpca, »course_title« in »fee«. V stolpcu “course_title” imamo seznam tečajev “python”, “java”, “object_oriented” in “PHP”. V drugem stolpcu 'prispevek' imamo seznam tečajev, ki so '30000', '25000', '15000' in '22000'. Prikaz našega podatkovnega okvira, »tečaj«, z uporabo »pd. DataFrame”.





Nato bomo razpravljali o glavni funkciji kode, ki je pandas »insert() column«. Učinkovita metoda je vključitev novega seznama v podatkovni okvir. Nov stolpec lahko dodate na katero koli določeno mesto z uporabo metode vstavljanja. Ta metoda omogoča tudi ročno dodajanje stolpca v podatkovni okvir, vendar je manj prilagodljivosti.

Skozi celotno vstavljanje pomeni, da se izvorni DataFrame med postopkom neposredno posodobi in da se ne ustvari nov DataFrame. V tem primeru smo našemu podatkovnemu okviru dodali nov stolpec z imenom »Time_duration« z uporabo funkcije »insert()«. Seznam vrednosti, ki jih imamo v tem stolpcu, je »6_months«, »3_months«, »3_months« in »6_months«. V spodnjem programu imamo stolpec »Time_duration« z indeksom, definiranim kot »2«. Ker je naveden indeks, bi DataFrame dobil obseg, ki se začne pri 0 in se povečuje v korakih, kar pomeni, da je ta stolpec prikazan kot tretji stolpec v podatkovnem okviru. DataFrame doda nov stolpec z imenom »Time _duration« z uporabo funkcije »pd.insert()«.



Zdaj pa se pogovorimo o rezultatu programa od zgoraj. Njegov izhod prikazuje podatkovni okvir s tremi stolpci. Dodatni stolpec je dodan na koncu podatkovnega okvira. Z uporabo metode »pd.DataFrame.insert()« lahko dodate stolpec med druge stolpce, namesto da bi jih dodali na koncu pande DataFrame.«Time_duration« je nov stolpec, ki smo ga dodali z uporabo »vstavljanja« funkcijo. Položaj »2« se nanaša na tretji stolpec v DataFrame, saj se položaj začne pri 0. Stolpec je dodan na zadnje mesto v podatkovnem okvirju.

Primer 2:  Dodajanje stolpcev v podatkovni okvir z uporabo funkcije Pandas insert().

Za dodajanje novih stolpcev v podatkovni okvir bomo uporabili metodo »insert()«. Namesto dodajanja dodatnih stolpcev na koncu pand, jih lahko vstavite med obstoječe stolpce. Za ustvarjanje podatkovnega okvira, podobnega prejšnjemu primeru, smo vzeli tri stolpce in jim dodelili vrednosti. V prvem stolpcu »Ime« imamo seznam imen, ki vključujejo »Emma«, »Ella«, »Smith« in »Maxwell«. V drugem stolpcu »Starost« na seznamu vrednosti imamo »29«, »36«, »39« in »33«.

Po tem natisnemo stavek “DataFrame”. Pod stavkom »podatkovni okvir« bomo prikazali podatkovni okvir. Ustvarjamo še en stolpec za podatkovni okvir Pandas s funkcijo »insert()«. Ustvariti je treba seznam, da ga lahko dodamo kot nov stolpec našemu danemu naboru podatkov. Za dodajanje več stolpcev se lahko uporabi tudi metoda »assign()« pandas DataFrame. Vstavljamo nov stolpec z uporabo »df. vstavi'. Dodatni stolpec z imenom »Spol« prikazuje spol kot »Moški« ali »Ženski«.

Natisnimo samo še eno izjavo, »Nov podatkovni okvir«. Pod izjavo »New Dataframe« bo zdaj predstavljen nov podatkovni okvir, ki vsebuje dodatni stolpec, ki smo ga dodali s »pd. vstavi()«. Stolpca s podobnim imenom ni mogoče dodati s funkcijo »insert()«. V primeru, da stolpec že obstaja v podatkovnem okviru, se privzeto prikaže napaka vrednosti.

V tem izhodu je stolpec, ki smo ga ustvarili z uporabo funkcije »insert()«, dodan v podatkovni okvir. Njegov izhod prikaže dva podatkovna okvira; prvi dataFrame je bil ustvarjen s pomočjo »pd.data frame«, v katerem imamo dva stolpca, »Name« in »Age«. Nov stolpec »spol«, ki smo ga dodali s funkcijo »insert()«, je prikazan v drugem podatkovnem okviru, prikazanem spodaj. Ta podatkovni okvir dokazuje, da obstajajo trije stolpci z nekaterimi podatki v njih. Indeks je velikosti '2', kar pomeni, da ima vnose od '0 do 3'. Nov stolpec, ki smo ga dodelili temu podatkovnemu okviru, ima položaj indeksa '3'.

Zaključek

Pogosto uporabljena operacija analize in posodabljanja podatkov je dodajanje stolpcev v DataFrame. Vendar vam Pandas nudi številne možnosti za dokončanje naloge, tako da ponuja štiri različne metode; vendar v našem članku uporabljamo samo eno tehniko, to je stolpec panadas »insert()«. Eden najtežjih delov razširitve DataFrame z novimi stolpci je indeksiranje. Naj na hitro opišemo oba primera. Najprej smo ustvarili podatkovni okvir z naslovom tečaj in dodali stolpca »naziv tečaja« in »prispevek« ter temu stolpcu dodelili vrednosti. S funkcijo »insert()« nato istemu podatkovnemu okvirju dodamo nov stolpec, ki označuje njegov položaj kot »2« v indeksu. V drugem primeru sta prikazana dva podatkovna okvira. Ustvarili smo dva stolpca in navedli nekaj vrednosti v prvem podatkovnem okviru. Nato smo z uporabo funkcije insert() v podatkovni okvir vstavili nov stolpec z imenom »Spol«, prav tako je bil v indeksu postavljen kot »2«; zdaj je spet prikazal tabelo, kot je prikazano v zgornjem drugem primeru.

Ko obvladamo zgornje tehnike, lahko zlahka dodamo nove stolpce v DataFrame.