Pandas Dataframe Unique

Najbolj priljubljena knjižnica Python, ki se uporablja v podatkovni znanosti, se imenuje Pandas. Programerjem Python ponuja visoko zmogljiva, uporabniku prijazna orodja za analizo podatkov. Ko enkrat razumete temeljne funkcije in kako jih uporabljati, je Pandas močno orodje za spreminjanje podatkov. V 'pandah' so standardne metode za shranjevanje podatkov v obliki tabele DataFrames. Za pridobitev edinstvenih vrednosti v stolpcu DataFrame »pandas« lahko uporabimo nekaj metod »pandas«. Ko moramo pridobiti edinstvene vrednosti v stolpcih DataFrame in ne želimo podvajanja vrednosti v stolpcu »pandas« DataFrame, lahko za to uporabimo metode, ki jih ponuja »pandas«. Oglejmo si takšne metode v tem priročniku, skupaj z nekaj primeri in izhodnimi podatki za pridobitev edinstvenih vrednosti v stolpcu »pande« DataFrame.

Metode za pridobivanje edinstvenih vrednosti v stolpcih »pandas« DataFrame

Uporabimo lahko dve metodi za pridobivanje edinstvenih vrednosti v stolpcih »pandas« DataFrame. Izpustimo podvojene vrednosti in dobimo samo edinstvene vrednosti v stolpcih DataFrames. Metode, ki jih »pande« ponujajo za opravljanje te naloge, so:

Z uporabo metode unique().
Z uporabo metode drop_dupliactes().

Zdaj bomo uporabili obe metodi v kodah »pandas« za pridobivanje edinstvenih vrednosti v stolpcih DataFrame »pandas«.

Primer št. 01

Aplikacija »Spyder« se tukaj uporablja za generiranje teh kod »pandas« za uporabo tistih metod, ki nam pomagajo pri pridobivanju edinstvenih vrednosti v stolpcih »pandas« DataFrame. Preden ustvarimo DataFrame, moramo uvoziti module 'pandas', ki so potrebni za kodo 'pandas'. Z uporabo izraza »uvoz« in postavitvijo »pande kot pd« uvozimo te module.

Zdaj lahko s pomočjo »pd« hitro pridobimo funkcije ali metode »pande«. Nato vnesemo »Subject_data«, v katerega dodamo »Name«, v »Name« pa dodamo podatke o imenu, ki so »Roman, William, Peter, Smith, John, Milli, Thomas in James«. Nato dodamo podatke o predmetu v »Subj«, ki so »matematika, ekonomija, naravoslovje, matematika, statistika, statistika, statistika in računalništvo«. Nato te »Subject_data« pretvorimo v »Subject_df« DataFrame z uporabo metode »pd.DataFrame()«. Postavimo »Subject_df« v metodo »print()«, da bo prikazan na terminalu.

Zdaj želimo pridobiti edinstvene vrednosti v stolpcu DataFrame »pandas« »Subj«. V ta namen tukaj uporabljamo metodo »unique()« in dodamo ime stolpca in tudi ime DataFrame, kot je prikazano spodaj. To metodo dodamo v »print()«, tako da bo rezultat prikazan tudi na terminalu.

Zdaj pritisnemo »Shift+Enter«, da dobimo rezultat te kode in se upodobi na terminalu in je tudi prikazan tukaj, ki vsebuje DataFrame z vsemi vrednostmi. To je izvirni DataFrame, ki smo ga dodali v kodo in pod njim prikazuje edinstvene vrednosti stolpca »Subj«. Odstrani podvojene vrednosti in prikaže edinstvene vrednosti stolpca »Subj« DataFrame.

Primer št. 02

Ustvarimo »Sample_list«, ki vsebuje nekaj informacij. Vstavimo »Layla, 21, 28, 31, 14 in 39«, ki se bo prikazal kot prvi stolpec, ko bomo ta seznam pretvorili v DataFrame. Nato dodamo »Lusy, 31, 25, 34, 26 in 21« kot drugo vrstico DataFrame. Za tem imamo »Peter, 38, 20, 20, 35 in 24« in »Layla 38, 23, 39 24, 23«, ki bosta tretja in četrta vrstica DataFrame. Vstavimo še tri podatke, in sicer »Stella, 21, 24, 24, 28, 31«, »Layla, 33, 32, 26, 30, 25« in tudi »Peter, 21, 21, 31, 21, 29«. .

Zdaj pretvarjamo »Sample_list« v »DF_Sample«, ki je ime DataFrame tukaj, tako da vnesemo funkcijo »pd.DataFrame()«. Nastavili smo tudi ime stolpcev tega DataFrame in ta imena so 'Ime, Ass_1, Ass_2, Ass_3, Ass_4 in Ass_5'. Nato uporabimo »print()«, ki pomaga pri prikazu DataFrame »DF_Sample«. Zdaj v tem primeru uporabljamo drugo metodo za pridobivanje edinstvenih vrednosti v stolpcu DataFrame. Ta metoda je metoda »drop_duplicates()« za »pande«.

V metodi “drop_duplicates()” nastavimo ime stolpca, kjer želimo pridobiti edinstvene vrednosti v stolpcu DataFrame. Edinstvene vrednosti stolpca »Name« pridobimo tako, da spustimo podvojene vrednosti v tem stolpcu s pomočjo metode »drop_duplicates()« in te edinstvene vrednosti tudi upodobimo s funkcijo »print()« tukaj.

Imena, ki so podvojena, so opuščena in edinstvene vrednosti so upodobljene po uporabi metode »drop_duplicates()«. Opazite lahko, da se ime »Layla« pojavi v treh celicah stolpca »Ime«. Ko pa se za ta stolpec uporabi metoda »drop_duplicates()«, se vse podvojene vrednosti izbrišejo in na zaslonu se prikaže eno ime »Layla«. Po odstranitvi podvojenih vrednosti se je pojavil nov DataFrame, ki vsebuje edinstvene vrednosti v tem stolpcu »Ime«. Na ta način lahko spustimo podvojene vrednosti in pridobimo edinstveno vrednost v stolpcu DataFrame s pomočjo metode 'drop_duplicates()'.

Primer št. 03

Ponovno se uporabi isti DataFrame in zdaj tukaj uporabljamo metodo »unique()«. Z metodo »unique()« postavimo ime stolpca in ime DataFrame, na katerega želimo uporabiti to metodo »unique()« za pridobivanje edinstvenih vrednosti. To bo upodobilo samo enolične vrednosti tega stolpca in teh vrednosti ne bo prikazalo v obliki DataFrame.

Tukaj DataFrame vsebuje sedem vrednosti v stolpcu »Ime«, toda ko za ta stolpec uporabimo metodo »unique()«, so se pojavile samo štiri vrednosti in to so edinstvene vrednosti tega stolpca. Ne upodablja podvojenih vrednosti.

Primer št. 04

DataFrame, ki ga ustvarimo v tem primeru, je »F_G_df«. V ta DataFrame vstavimo »My_fruits« in »my_Vegs«. Stolpec »My_fruits« vsebuje »Jabolko, pomaranča, jabolko, hruška, liči, jabolko, jabolko, hruška in jabolko«. Nato imamo »My_Vegs«, ki vsebuje imena zelenjave, ki so »Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic in Ginger«. Ta DataFrame vsebuje samo dva stolpca.

Zdaj dobimo edinstvene vrednosti v obeh stolpcih s pomočjo metode »unique()«. Omenjamo ime DataFrame. Nato vnesite prvo ime stolpca. Po tem uporabimo metodo append(). V ta dodatek ponovno postavimo ime DataFrame in ime drugega stolpca ter postavimo metodo »unique()«. To bo pridobilo edinstvene vrednosti obeh stolpcev in nato dodalo edinstvene vrednosti obeh stolpcev ter jih prikazalo na zaslonu.

Najprej se upodobi DataFrame, ki vsebuje vse vrednosti. Po tem se uporabi metoda »unique()« in enolične vrednosti obeh stolpcev so upodobljene spodaj. V tej kodi dobimo edinstvene vrednosti v več stolpcih DataFrame z uporabo metode »unique()«.

Zaključek

Celotno razlago pridobivanja edinstvenih vrednosti v stolpcu DataFrame najdete v tem priročniku. Razpravljali smo o metodah »unique()« in »drop_duplicates()«, ki nam pomagata pri pridobivanju edinstvenih vrednosti stolpca DataFrame. Raziskali smo, kako uporabiti te metode v kodi »pandas« z uporabo teh metod tukaj v naših kodah. V tem priročniku smo ilustrirali različne primere in vam pokazali, kako pridobite edinstvene vrednosti enega stolpca z uporabo metode »unique()« in metode »drop_duplicates()«. Raziskali smo tudi, kako v tem priročniku z uporabo metode »unique()« pridobiti edinstvene vrednosti v več stolpcih.

Pandas Dataframe Unique

Metode za pridobivanje edinstvenih vrednosti v stolpcih »pandas« DataFrame

Primer št. 01

Primer št. 02

Primer št. 03

Primer št. 04

Zaključek

Kategorija

Priljubljene Objave

Kako nastaviti posredovanje vrat z Iptables v sistemih, ki temeljijo na Linuxu

Kako prilagoditi obvestila na zaklenjenem zaslonu sistema Windows?

Kako namestiti pakete DEB na Ubuntu/Debian/Linux Mint

Kako ustvariti virtualni stroj Windows 11 na Proxmox VE 8

Kako prešteti število datotek v imeniku v Linuxu

Elasticsearch Multi-Get

Kako konfigurirati samodejne varnostne posodobitve za Debian 11

Sistemski klic Linux chdir v C

Array.size() proti Array.length – JavaScript

Kako narediti URL dekodiranje v Javi

Iskanje poteka v MLflow

Windows 11 Media Player je prispel v Windows 10

Kaj je povezava Trello Anime Rifts

Kako nastaviti večregijsko replikacijo z Amazon Aurora?

Kako najti največjo in najmanjšo vrednost v matriki velikega nabora podatkov v MATLAB

Kako varnostno kopirati slike Windows Spotlight v sistemu Windows 10? - Winhelponline

Kako zgraditi sliko za aplikacijo Java z uporabo datoteke Docker

Kako namestiti orodje za spremljanje sistema Conky na Raspberry Pi

Kako pretvoriti podatke medpomnilnika v format JSON v Node.js?

Statične globalne spremenljivke v C++