Pandas Dataframe Unique

Pandas Dataframe Unique



Najbolj priljubljena knjižnica Python, ki se uporablja v podatkovni znanosti, se imenuje Pandas. Programerjem Python ponuja visoko zmogljiva, uporabniku prijazna orodja za analizo podatkov. Ko enkrat razumete temeljne funkcije in kako jih uporabljati, je Pandas močno orodje za spreminjanje podatkov. V 'pandah' so standardne metode za shranjevanje podatkov v obliki tabele DataFrames. Za pridobitev edinstvenih vrednosti v stolpcu DataFrame »pandas« lahko uporabimo nekaj metod »pandas«. Ko moramo pridobiti edinstvene vrednosti v stolpcih DataFrame in ne želimo podvajanja vrednosti v stolpcu »pandas« DataFrame, lahko za to uporabimo metode, ki jih ponuja »pandas«. Oglejmo si takšne metode v tem priročniku, skupaj z nekaj primeri in izhodnimi podatki za pridobitev edinstvenih vrednosti v stolpcu »pande« DataFrame.

Metode za pridobivanje edinstvenih vrednosti v stolpcih »pandas« DataFrame

Uporabimo lahko dve metodi za pridobivanje edinstvenih vrednosti v stolpcih »pandas« DataFrame. Izpustimo podvojene vrednosti in dobimo samo edinstvene vrednosti v stolpcih DataFrames. Metode, ki jih »pande« ponujajo za opravljanje te naloge, so:







  • Z uporabo metode unique().
  • Z uporabo metode drop_dupliactes().

Zdaj bomo uporabili obe metodi v kodah »pandas« za pridobivanje edinstvenih vrednosti v stolpcih DataFrame »pandas«.



Primer št. 01

Aplikacija »Spyder« se tukaj uporablja za generiranje teh kod »pandas« za uporabo tistih metod, ki nam pomagajo pri pridobivanju edinstvenih vrednosti v stolpcih »pandas« DataFrame. Preden ustvarimo DataFrame, moramo uvoziti module 'pandas', ki so potrebni za kodo 'pandas'. Z uporabo izraza »uvoz« in postavitvijo »pande kot pd« uvozimo te module.



Zdaj lahko s pomočjo »pd« hitro pridobimo funkcije ali metode »pande«. Nato vnesemo »Subject_data«, v katerega dodamo »Name«, v »Name« pa dodamo podatke o imenu, ki so »Roman, William, Peter, Smith, John, Milli, Thomas in James«. Nato dodamo podatke o predmetu v »Subj«, ki so »matematika, ekonomija, naravoslovje, matematika, statistika, statistika, statistika in računalništvo«. Nato te »Subject_data« pretvorimo v »Subject_df« DataFrame z uporabo metode »pd.DataFrame()«. Postavimo »Subject_df« v metodo »print()«, da bo prikazan na terminalu.





Zdaj želimo pridobiti edinstvene vrednosti v stolpcu DataFrame »pandas« »Subj«. V ta namen tukaj uporabljamo metodo »unique()« in dodamo ime stolpca in tudi ime DataFrame, kot je prikazano spodaj. To metodo dodamo v »print()«, tako da bo rezultat prikazan tudi na terminalu.



Zdaj pritisnemo »Shift+Enter«, da dobimo rezultat te kode in se upodobi na terminalu in je tudi prikazan tukaj, ki vsebuje DataFrame z vsemi vrednostmi. To je izvirni DataFrame, ki smo ga dodali v kodo in pod njim prikazuje edinstvene vrednosti stolpca »Subj«. Odstrani podvojene vrednosti in prikaže edinstvene vrednosti stolpca »Subj« DataFrame.

Primer št. 02

Ustvarimo »Sample_list«, ki vsebuje nekaj informacij. Vstavimo »Layla, 21, 28, 31, 14 in 39«, ki se bo prikazal kot prvi stolpec, ko bomo ta seznam pretvorili v DataFrame. Nato dodamo »Lusy, 31, 25, 34, 26 in 21« kot drugo vrstico DataFrame. Za tem imamo »Peter, 38, 20, 20, 35 in 24« in »Layla 38, 23, 39 24, 23«, ki bosta tretja in četrta vrstica DataFrame. Vstavimo še tri podatke, in sicer »Stella, 21, 24, 24, 28, 31«, »Layla, 33, 32, 26, 30, 25« in tudi »Peter, 21, 21, 31, 21, 29«. .

Zdaj pretvarjamo »Sample_list« v »DF_Sample«, ki je ime DataFrame tukaj, tako da vnesemo funkcijo »pd.DataFrame()«. Nastavili smo tudi ime stolpcev tega DataFrame in ta imena so 'Ime, Ass_1, Ass_2, Ass_3, Ass_4 in Ass_5'. Nato uporabimo »print()«, ki pomaga pri prikazu DataFrame »DF_Sample«. Zdaj v tem primeru uporabljamo drugo metodo za pridobivanje edinstvenih vrednosti v stolpcu DataFrame. Ta metoda je metoda »drop_duplicates()« za »pande«.

V metodi “drop_duplicates()” nastavimo ime stolpca, kjer želimo pridobiti edinstvene vrednosti v stolpcu DataFrame. Edinstvene vrednosti stolpca »Name« pridobimo tako, da spustimo podvojene vrednosti v tem stolpcu s pomočjo metode »drop_duplicates()« in te edinstvene vrednosti tudi upodobimo s funkcijo »print()« tukaj.

Imena, ki so podvojena, so opuščena in edinstvene vrednosti so upodobljene po uporabi metode »drop_duplicates()«. Opazite lahko, da se ime »Layla« pojavi v treh celicah stolpca »Ime«. Ko pa se za ta stolpec uporabi metoda »drop_duplicates()«, se vse podvojene vrednosti izbrišejo in na zaslonu se prikaže eno ime »Layla«. Po odstranitvi podvojenih vrednosti se je pojavil nov DataFrame, ki vsebuje edinstvene vrednosti v tem stolpcu »Ime«. Na ta način lahko spustimo podvojene vrednosti in pridobimo edinstveno vrednost v stolpcu DataFrame s pomočjo metode 'drop_duplicates()'.

Primer št. 03

Ponovno se uporabi isti DataFrame in zdaj tukaj uporabljamo metodo »unique()«. Z metodo »unique()« postavimo ime stolpca in ime DataFrame, na katerega želimo uporabiti to metodo »unique()« za pridobivanje edinstvenih vrednosti. To bo upodobilo samo enolične vrednosti tega stolpca in teh vrednosti ne bo prikazalo v obliki DataFrame.

Tukaj DataFrame vsebuje sedem vrednosti v stolpcu »Ime«, toda ko za ta stolpec uporabimo metodo »unique()«, so se pojavile samo štiri vrednosti in to so edinstvene vrednosti tega stolpca. Ne upodablja podvojenih vrednosti.

Primer št. 04

DataFrame, ki ga ustvarimo v tem primeru, je »F_G_df«. V ta DataFrame vstavimo »My_fruits« in »my_Vegs«. Stolpec »My_fruits« vsebuje »Jabolko, pomaranča, jabolko, hruška, liči, jabolko, jabolko, hruška in jabolko«. Nato imamo »My_Vegs«, ki vsebuje imena zelenjave, ki so »Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic in Ginger«. Ta DataFrame vsebuje samo dva stolpca.

Zdaj dobimo edinstvene vrednosti v obeh stolpcih s pomočjo metode »unique()«. Omenjamo ime DataFrame. Nato vnesite prvo ime stolpca. Po tem uporabimo metodo append(). V ta dodatek ponovno postavimo ime DataFrame in ime drugega stolpca ter postavimo metodo »unique()«. To bo pridobilo edinstvene vrednosti obeh stolpcev in nato dodalo edinstvene vrednosti obeh stolpcev ter jih prikazalo na zaslonu.

Najprej se upodobi DataFrame, ki vsebuje vse vrednosti. Po tem se uporabi metoda »unique()« in enolične vrednosti obeh stolpcev so upodobljene spodaj. V tej kodi dobimo edinstvene vrednosti v več stolpcih DataFrame z uporabo metode »unique()«.

Zaključek

Celotno razlago pridobivanja edinstvenih vrednosti v stolpcu DataFrame najdete v tem priročniku. Razpravljali smo o metodah »unique()« in »drop_duplicates()«, ki nam pomagata pri pridobivanju edinstvenih vrednosti stolpca DataFrame. Raziskali smo, kako uporabiti te metode v kodi »pandas« z uporabo teh metod tukaj v naših kodah. V tem priročniku smo ilustrirali različne primere in vam pokazali, kako pridobite edinstvene vrednosti enega stolpca z uporabo metode »unique()« in metode »drop_duplicates()«. Raziskali smo tudi, kako v tem priročniku z uporabo metode »unique()« pridobiti edinstvene vrednosti v več stolpcih.