Uporaba Pandas.DataFrame.Drop
Funkcijo pandas.DataFrame.drop() uporabljamo za izpuščanje določenih vrstic ali določenih stolpcev iz Pandas DataFrame. Uporabimo to funkcijo, da izpustimo vse vrstice in stolpce.
Sintaksa :
Sledi sintaksa funkcije pandas.DataFrame.drop(). Uporabljamo samo tri parametre in v tem priročniku razpravljamo le o teh treh. Za to funkcijo obstaja podrobna vadnica:
pande. DataFrame . padec ( nalepke , os , kazalo , stolpce , raven , na mestu , napake )
- Parametru »labels« moramo posredovati seznam indeksov vrstic, da iz DataFrame izbrišemo vse vrstice. Prav tako lahko posredujemo atribut DataFrame.index, ki izbere vse indekse vrstic. Podobno moramo v ta parameter posredovati vsa imena stolpcev ali posredovati lastnost DataFrame.columns.
- Nastavite parameter »os« na 1, če posredujete stolpce parametru »oznake«. Privzeto je os = 0, ki se nanaša na vrstice.
- Izvedemo lahko operacijo (Delete) na obstoječem DataFrame. Nastavite parameter »inplace« na »True«.
Primer 1:
Razmislite o podatkovnem okvirju »Campaign1« s štirimi vrsticami in dvema stolpcema. Najprej izpustite vse vrstice tako, da posredujete indekse vrstic parametru »labels«, nato pa izpustite vse stolpce tako, da posredujete oznake stolpcev parametru »labels«.
uvoz pande
# Ustvari DataFrame - Campaign1 z 2 stolpcema in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )
# Spustite vse vrstice
Kampanja1. padec ( nalepke = [ 0 , 1 , 2 , 3 ] , na mestu = Prav )
tiskanje ( Kampanja1 , ' \n ' )
# Spustite vse stolpce
Kampanja1. padec ( nalepke = [ 'Campaign_Name' , 'Lokacija' ] , na mestu = Prav , os = 1 )
tiskanje ( Kampanja1 , ' \n ' )
Izhod :
Po odstranitvi vrstic se vrstice odstranijo, stolpci pa obstajajo. Po odstranitvi stolpcev je »Campaign1« prazen.
Primer 2:
Uporabite prejšnji DataFrame »Campaign1« in spustite vrstice tako, da parametru »labels« posredujete »Campaign1.index«, nato pa stolpce spustite tako, da parametru »labels« posredujete »Campaign.columns«.
uvoz pande# Ustvari DataFrame - Campaign1 z 2 stolpcema in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )
# Spustite vse vrstice
Kampanja1. padec ( nalepke = Kampanja1. kazalo , na mestu = Prav )
# Spustite vse stolpce
Kampanja1. padec ( nalepke = Kampanja1. stolpce , na mestu = Prav , os = 1 )
tiskanje ( Kampanja1 )
Izhod :
Po odstranitvi vrstic se vrstice odstranijo, stolpci pa obstajajo. Po odstranitvi stolpcev je »Campaign1« prazen.
Uporaba Iloc[]
Lastnost pandas.DataFrame.iloc[] se uporablja za izbiro podatkov glede na položaj indeksa. To lastnost lahko uporabimo za izbiro 0 vrstic in 0 stolpcev iz DataFrame. Tukaj ne brišemo dejanskega DataFramea, ampak bomo izbrali 0 zapisov.
Sintaksa :
Najprej moramo izbrisati stolpce in nato vrstice.
- Izberite 0 stolpcev – DataFrame.iloc[:,0:0]
- Izberite 0 vrstic – DataFrame.iloc[0:0]
Primer :
Uporabite isti DataFrame in izberite prazen DataFrame z lastnostjo iloc[].
uvoz pande# Ustvari DataFrame - Campaign1 z 2 stolpcema in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )
# Spustite vse vrstice
Kampanja1. padec ( nalepke = [ 0 , 1 , 2 , 3 ] , na mestu = Prav )
tiskanje ( Kampanja1 , ' \n ' )
# Spustite vse stolpce
Kampanja1. padec ( nalepke = [ 'Campaign_Name' , 'Lokacija' ] , na mestu = Prav , os = 1 )
tiskanje ( Kampanja1 , ' \n ' )
Izhod :
Uporaba Delove ključne besede
Celotni podatki bodo izbrisani iz DataFrame s ključno besedo »del« s ponavljanjem vseh vrstic znotraj zanke »for«.
uvoz pande# Ustvari DataFrame - Campaign1 s 4 stolpci in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )
# Uporaba ključne besede del
za jaz v Kampanja1:
od Kampanja1 [ jaz ]
tiskanje ( Kampanja1 )
Izhod :
Zdaj je DataFrame prazen.
Uporaba funkcije Pop().
Celotni podatki bodo izbrisani iz DataFrame s funkcijo pop() s ponavljanjem vseh vrstic znotraj zanke »za«. Ta funkcija je podana znotraj zanke 'for'.
uvoz pande# Ustvari DataFrame - Campaign1 s 4 stolpci in 4 zapisi
Kampanja1 = pande. DataFrame ( [ [ 'java kamp' , 'Indija' ] , [ 'linux camp' , 'ZDA' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'python camp' , 'ZDA' ] ] ,
stolpce = [ 'Campaign_Name' , 'Lokacija' ] )
tiskanje ( Kampanja1 , ' \n ' )
# Uporaba pop()
za jaz v Kampanja1:
Kampanja1. pop ( jaz )
tiskanje ( Kampanja1 )
Izhod :
Zdaj je DataFrame prazen.
Zaključek
Naučili smo se, kako počistiti Pandas DataFrame z odstranitvijo vrstic in stolpcev. Najprej smo s funkcijo drop() izpustili vrstice iz DataFrame in nato izpustili stolpce, potem ko smo uporabili lastnost iloc[] za izbiro 0 vrstic. Nazadnje smo razpravljali o brisanju zapisov iz DataFrame s ključno besedo »del« in funkcijo pop().