Počistite DataFrame v Pandas

Pocistite Dataframe V Pandas



Odstranjevanje podatkov iz Pandas DataFrame se izvede s funkcijo pandas.DataFrame.drop(). Poleg te funkcije lahko izberemo vrstice iz DataFrame, ne da bi upoštevali stolpce/vrstice. To lahko storite tudi z oglatimi oklepaji. V tem priročniku bomo uporabili tudi ključno besedo »del« in funkcijo pop() za brisanje vseh vrstic s ponavljanjem DataFrame z uporabo zanke »for«.

Uporaba Pandas.DataFrame.Drop

Funkcijo pandas.DataFrame.drop() uporabljamo za izpuščanje določenih vrstic ali določenih stolpcev iz Pandas DataFrame. Uporabimo to funkcijo, da izpustimo vse vrstice in stolpce.

Sintaksa :







Sledi sintaksa funkcije pandas.DataFrame.drop(). Uporabljamo samo tri parametre in v tem priročniku razpravljamo le o teh treh. Za to funkcijo obstaja podrobna vadnica:



pande. DataFrame . padec ( nalepke , os , kazalo , stolpce , raven , na mestu , napake )
  1. Parametru »labels« moramo posredovati seznam indeksov vrstic, da iz DataFrame izbrišemo vse vrstice. Prav tako lahko posredujemo atribut DataFrame.index, ki izbere vse indekse vrstic. Podobno moramo v ta parameter posredovati vsa imena stolpcev ali posredovati lastnost DataFrame.columns.
  2. Nastavite parameter »os« na 1, če posredujete stolpce parametru »oznake«. Privzeto je os = 0, ki se nanaša na vrstice.
  3. Izvedemo lahko operacijo (Delete) na obstoječem DataFrame. Nastavite parameter »inplace« na »True«.

Primer 1:

Razmislite o podatkovnem okvirju »Campaign1« s štirimi vrsticami in dvema stolpcema. Najprej izpustite vse vrstice tako, da posredujete indekse vrstic parametru »labels«, nato pa izpustite vse stolpce tako, da posredujete oznake stolpcev parametru »labels«.



uvoz pande

# Ustvari DataFrame - Campaign1 z 2 stolpcema in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )

# Spustite vse vrstice
Kampanja1. padec ( nalepke = [ 0 , 1 , 2 , 3 ] , na mestu = Prav )
tiskanje ( Kampanja1 , ' \n ' )

# Spustite vse stolpce
Kampanja1. padec ( nalepke = [ 'Campaign_Name' , 'Lokacija' ] , na mestu = Prav , os = 1 )
tiskanje ( Kampanja1 , ' \n ' )

Izhod :





Po odstranitvi vrstic se vrstice odstranijo, stolpci pa obstajajo. Po odstranitvi stolpcev je »Campaign1« prazen.



Primer 2:

Uporabite prejšnji DataFrame »Campaign1« in spustite vrstice tako, da parametru »labels« posredujete »Campaign1.index«, nato pa stolpce spustite tako, da parametru »labels« posredujete »Campaign.columns«.

uvoz pande

# Ustvari DataFrame - Campaign1 z 2 stolpcema in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )

# Spustite vse vrstice
Kampanja1. padec ( nalepke = Kampanja1. kazalo , na mestu = Prav )

# Spustite vse stolpce
Kampanja1. padec ( nalepke = Kampanja1. stolpce , na mestu = Prav , os = 1 )
tiskanje ( Kampanja1 )

Izhod :

Po odstranitvi vrstic se vrstice odstranijo, stolpci pa obstajajo. Po odstranitvi stolpcev je »Campaign1« prazen.

Uporaba Iloc[]

Lastnost pandas.DataFrame.iloc[] se uporablja za izbiro podatkov glede na položaj indeksa. To lastnost lahko uporabimo za izbiro 0 vrstic in 0 stolpcev iz DataFrame. Tukaj ne brišemo dejanskega DataFramea, ampak bomo izbrali 0 zapisov.

Sintaksa :

Najprej moramo izbrisati stolpce in nato vrstice.

  1. Izberite 0 stolpcev – DataFrame.iloc[:,0:0]
  2. Izberite 0 vrstic – DataFrame.iloc[0:0]

Primer :

Uporabite isti DataFrame in izberite prazen DataFrame z lastnostjo iloc[].

uvoz pande

# Ustvari DataFrame - Campaign1 z 2 stolpcema in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )

# Spustite vse vrstice
Kampanja1. padec ( nalepke = [ 0 , 1 , 2 , 3 ] , na mestu = Prav )
tiskanje ( Kampanja1 , ' \n ' )

# Spustite vse stolpce
Kampanja1. padec ( nalepke = [ 'Campaign_Name' , 'Lokacija' ] , na mestu = Prav , os = 1 )
tiskanje ( Kampanja1 , ' \n ' )

Izhod :

Uporaba Delove ključne besede

Celotni podatki bodo izbrisani iz DataFrame s ključno besedo »del« s ponavljanjem vseh vrstic znotraj zanke »for«.

uvoz pande

# Ustvari DataFrame - Campaign1 s 4 stolpci in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )

# Uporaba ključne besede del
za jaz v Kampanja1:
od Kampanja1 [ jaz ]
tiskanje ( Kampanja1 )

Izhod :

Zdaj je DataFrame prazen.

Uporaba funkcije Pop().

Celotni podatki bodo izbrisani iz DataFrame s funkcijo pop() s ponavljanjem vseh vrstic znotraj zanke »za«. Ta funkcija je podana znotraj zanke 'for'.

uvoz pande

# Ustvari DataFrame - Campaign1 s 4 stolpci in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )

# Uporaba pop()
za jaz v Kampanja1:
Kampanja1. pop ( jaz )
tiskanje ( Kampanja1 )

Izhod :

Zdaj je DataFrame prazen.

Zaključek

Naučili smo se, kako počistiti Pandas DataFrame z odstranitvijo vrstic in stolpcev. Najprej smo s funkcijo drop() izpustili vrstice iz DataFrame in nato izpustili stolpce, potem ko smo uporabili lastnost iloc[] za izbiro 0 vrstic. Nazadnje smo razpravljali o brisanju zapisov iz DataFrame s ključno besedo »del« in funkcijo pop().