Notīriet datu rāmi programmā Pandas

Notiriet Datu Rami Programma Pandas



Datu noņemšana no Pandas DataFrame tiek veikta, izmantojot funkciju pandas.DataFrame.drop(). Papildus šai funkcijai mēs varam atlasīt rindas no DataFrame, neņemot vērā kolonnas/rindas. To var izdarīt arī, izmantojot kvadrātiekavas. Šajā rokasgrāmatā mēs izmantosim arī atslēgvārdu “del” un funkciju pop(), lai dzēstu visas rindas, atkārtojot DataFrame, izmantojot cilpu “for”.

Izmantojot Pandas.DataFrame.Drop

Mēs izmantojam funkciju pandas.DataFrame.drop(), lai no Pandas DataFrame izmestu noteiktas rindas vai kolonnas. Izmantosim šo funkciju, lai nomestu visas rindas un kolonnas.

Sintakse :







Tālāk ir norādīta funkcijas pandas.DataFrame.drop() sintakse. Mēs izmantojam tikai trīs parametrus un šajā rokasgrāmatā apspriežam tikai šos trīs. Par šo funkciju ir pieejama detalizēta apmācība:



pandas. DataFrame . piliens ( etiķetes , ass , rādītājs , kolonnas , līmenī , vietā , kļūdas )
  1. Lai dzēstu visas rindas no DataFrame, parametram “labels” ir jānodod rindu indeksu saraksts. Mēs varam arī nodot atribūtu DataFrame.index, kas atlasa visus rindu indeksus. Līdzīgi šim parametram ir jānodod visi kolonnu nosaukumi vai jānodod rekvizīts DataFrame.columns.
  2. Iestatiet parametru “axis” uz 1, ja kolonnas nododat parametram “labels”. Pēc noklusējuma ass = 0, kas attiecas uz rindām.
  3. Mēs varam veikt darbību (Dzēst) ar esošo DataFrame. Iestatiet parametru “inplace” uz “True”.

1. piemērs:

Apsveriet “Campaign1” DataFrame ar četrām rindām un divām kolonnām. Vispirms nometiet visas rindas, nosūtot rindu indeksus parametram “labels”, un pēc tam nometiet visas kolonnas, nosūtot kolonnu etiķetes parametram “labels”.



imports pandas

# Izveidot DataFrame — Campaign1 ar 2 kolonnām un 4 ierakstiem
Kampaņa 1 = pandas. DataFrame ( [ [ 'java nometne' , 'Indija' ] , [ 'linux nometne' , 'ASV' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'pitonu nometne' , 'ASV' ] ] ,
kolonnas = [ 'Campaign_Name' , 'Atrašanās vieta' ] )
drukāt ( Kampaņa 1 , ' \n ' )

# Atmest visas rindas
Kampaņa 1. piliens ( etiķetes = [ 0 , 1 , 2 , 3 ] , vietā = Taisnība )
drukāt ( Kampaņa 1 , ' \n ' )

# Nometiet visas kolonnas
Kampaņa 1. piliens ( etiķetes = [ 'Campaign_Name' , 'Atrašanās vieta' ] , vietā = Taisnība , ass = 1 )
drukāt ( Kampaņa 1 , ' \n ' )

Izvade :





Pēc rindu nomešanas rindas tiek noņemtas, bet kolonnas pastāv. Pēc sleju noņemšanas “Campaign1” ir tukšs.



2. piemērs:

Izmantojiet iepriekšējo “Campaign1” DataFrame un nometiet rindas, parametram “labels” nosūtot “Campaign1.index”, un pēc tam nometiet slejas, parametram “labels” nosūtot “Campaign.columns”.

imports pandas

# Izveidot DataFrame — Campaign1 ar 2 kolonnām un 4 ierakstiem
Kampaņa 1 = pandas. DataFrame ( [ [ 'java nometne' , 'Indija' ] , [ 'linux nometne' , 'ASV' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'pitonu nometne' , 'ASV' ] ] ,
kolonnas = [ 'Campaign_Name' , 'Atrašanās vieta' ] )
drukāt ( Kampaņa 1 , ' \n ' )

# Atmest visas rindas
Kampaņa 1. piliens ( etiķetes = Kampaņa 1. rādītājs , vietā = Taisnība )

# Nometiet visas kolonnas
Kampaņa 1. piliens ( etiķetes = Kampaņa 1. kolonnas , vietā = Taisnība , ass = 1 )
drukāt ( Kampaņa 1 )

Izvade :

Pēc rindu nomešanas rindas tiek noņemtas, bet kolonnas pastāv. Pēc sleju noņemšanas “Campaign1” ir tukšs.

Izmantojot Iloc[]

Rekvizīts pandas.DataFrame.iloc[] tiek izmantots, lai atlasītu datus, pamatojoties uz indeksa pozīciju. Mēs varam izmantot šo rekvizītu, lai no DataFrame atlasītu 0 rindu un 0 kolonnu. Šeit mēs nedzēšam faktisko DataFrame, bet atlasīsim 0 ierakstus.

Sintakse :

Pirmkārt, mums ir jāizdzēš kolonnas un pēc tam rindas.

  1. Atlasīt 0 kolonnu – DataFrame.iloc[:,0:0]
  2. Atlasīt 0 rindu – DataFrame.iloc[0:0]

Piemērs :

Izmantojiet to pašu DataFrame un atlasiet tukšo DataFrame, izmantojot rekvizītu iloc[].

imports pandas

# Izveidot DataFrame — Campaign1 ar 2 kolonnām un 4 ierakstiem
Kampaņa 1 = pandas. DataFrame ( [ [ 'java nometne' , 'Indija' ] , [ 'linux nometne' , 'ASV' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'pitonu nometne' , 'ASV' ] ] ,
kolonnas = [ 'Campaign_Name' , 'Atrašanās vieta' ] )
drukāt ( Kampaņa 1 , ' \n ' )

# Atmest visas rindas
Kampaņa 1. piliens ( etiķetes = [ 0 , 1 , 2 , 3 ] , vietā = Taisnība )
drukāt ( Kampaņa 1 , ' \n ' )

# Nometiet visas kolonnas
Kampaņa 1. piliens ( etiķetes = [ 'Campaign_Name' , 'Atrašanās vieta' ] , vietā = Taisnība , ass = 1 )
drukāt ( Kampaņa 1 , ' \n ' )

Izvade :

Del atslēgvārda izmantošana

Visi dati tiks dzēsti no DataFrame, izmantojot atslēgvārdu “del”, atkārtojot visas rindas cilpas “for” iekšpusē.

imports pandas

# Izveidot DataFrame — Campaign1 ar 4 kolonnām un 4 ierakstiem
Kampaņa 1 = pandas. DataFrame ( [ [ 'java nometne' , 'Indija' ] , [ 'linux nometne' , 'ASV' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'pitonu nometne' , 'ASV' ] ] ,
kolonnas = [ 'Campaign_Name' , 'Atrašanās vieta' ] )
drukāt ( Kampaņa 1 , ' \n ' )

# Izmantojot del atslēgvārdu
priekš i iekšā 1. kampaņa:
no Kampaņa 1 [ i ]
drukāt ( Kampaņa 1 )

Izvade :

Tagad DataFrame ir tukšs.

Funkcijas Pop() izmantošana

Visi dati tiks dzēsti no DataFrame, izmantojot pop() funkciju, atkārtojot visas rindas cilpas 'for' iekšpusē. Šī funkcija ir norādīta cilpas “for” iekšpusē.

imports pandas

# Izveidot DataFrame — Campaign1 ar 4 kolonnām un 4 ierakstiem
Kampaņa 1 = pandas. DataFrame ( [ [ 'java nometne' , 'Indija' ] , [ 'linux nometne' , 'ASV' ] , [ 'c/c++ camp' , 'Indija' ] , [ 'pitonu nometne' , 'ASV' ] ] ,
kolonnas = [ 'Campaign_Name' , 'Atrašanās vieta' ] )
drukāt ( Kampaņa 1 , ' \n ' )

# Izmantojot pop()
priekš i iekšā 1. kampaņa:
Kampaņa 1. pop ( i )
drukāt ( Kampaņa 1 )

Izvade :

Tagad DataFrame ir tukšs.

Secinājums

Mēs uzzinājām, kā notīrīt Pandas DataFrame, noņemot rindas un kolonnas. Pirmkārt, mēs izmetām rindas no DataFrame, izmantojot funkciju drop (), un pēc tam nometām kolonnas pēc tam, kad izmantojām iloc[] rekvizītu, lai atlasītu 0 rindas. Visbeidzot, mēs apspriedām, kā izdzēst ierakstus no DataFrame, izmantojot atslēgvārdu “del” un funkciju pop ().