Pandas Aizpildiet Nan ar 0

Pandas Aizpildiet Nan Ar 0



Datu zinātne parasti ietver trūkstošus datus. Vai nu var atmest visu rindu, vai pievienot vērtību rindas un kolonnas kombinācijai. Rindas/kolonnas nomešana būtu absurda, jo tādējādi katrai rindai tiek izslēgta noteikta metrika. NaN, kas apzīmē “nav skaitlis”, ir viens no tipiskiem veidiem, kā parādīt vērtību, kas trūkst datu kopā. Lai iegūtu plānotos rezultātus, ir ļoti svarīgi rīkoties ar NaN. Tātad, noskaidrosim, kā mainīt NaN vērtības Pandas DataFrame rindā vai kolonnā uz 0.

Pandas Fill NaN vērtības

Ja kolonnai jūsu datu rāmī ir NaN vai None vērtības, varat izmantot funkcijas “fillna()” vai “replace()”, lai tās aizpildītu ar nulli (0).

aizpildīt ()







NA/NaN vērtības tiek aizpildītas ar piedāvāto pieeju, izmantojot funkciju “fillna()”. To var izmantot, ņemot vērā šādu sintaksi:



Ja vēlaties aizpildīt NaN vērtības vienai kolonnai, sintakse ir šāda:




Ja jums ir jāaizpilda NaN vērtības visam DataFrame, sintakse ir tāda, kā norādīts:






Aizvietot()

Lai aizstātu vienu NaN vērtību kolonnu, norādītā sintakse ir šāda:




Tā kā, lai aizstātu visas DataFrame NaN vērtības, mums ir jāizmanto šāda minētā sintakse:


Šajā rakstā mēs tagad izpētīsim un apgūsim abu šo metožu praktisko ieviešanu, lai aizpildītu NaN vērtības mūsu Pandas DataFrame.

1. piemērs: aizpildiet NaN vērtības, izmantojot Pandas “Fillna()” metodi

Šajā ilustrācijā ir parādīts Pandas funkcijas “DataFrame.fillna()” pielietojums, lai aizpildītu NaN vērtības dotajā DataFrame ar 0. Jūs varat aizpildīt trūkstošās vērtības vienā kolonnā vai arī varat tās aizpildīt visam DataFrame. Šeit mēs redzēsim abas šīs metodes.

Lai šīs stratēģijas īstenotu, mums ir jāiegūst piemērota platforma programmas izpildei. Tāpēc mēs nolēmām izmantot rīku “Spyder”. Mēs sākām savu Python kodu, importējot programmā “pandas” rīku komplektu, jo mums ir jāizmanto Pandas funkcija, lai izveidotu DataFrame, kā arī aizpildītu trūkstošās vērtības šajā DataFrame. 'pd' visā programmā tiek izmantots kā 'pandas' aizstājvārds.

Tagad mums ir piekļuve Pandas funkcijām. Mēs vispirms izmantojam tās funkciju “pd.DataFrame()”, lai ģenerētu savu DataFrame. Mēs izmantojām šo metodi un inicializējām to ar trim kolonnām. Šo sleju nosaukumi ir “M1”, “M2” un “M3”. Vērtības kolonnā “M1” ir “1”, “None”, “5”, “9” un “3”. Ieraksti “M2” ir “Nav”, “3”, “8”, “4” un “6”. Kamēr “M3” saglabā datus kā “1”, “2”, “3”, “5” un “Nav”. Mums ir nepieciešams DataFrame objekts, kurā mēs varam saglabāt šo DataFrame, kad tiek izsaukta metode “pd.DataFrame()”. Mēs izveidojām “trūkstošu” DataFrame objektu un piešķīrām to pēc rezultāta, ko ieguvām no funkcijas “pd.DataFrame()”. Pēc tam mēs izmantojām Python metodi “print ()”, lai Python konsolē parādītu DataFrame.


Kad mēs palaižam šo koda daļu, terminālī var skatīt DataFrame ar trim kolonnām. Šeit mēs varam novērot, ka visās trīs kolonnās ir nulles vērtības.


Mēs izveidojām DataFrame ar dažām nulles vērtībām, lai lietotu Pandas funkciju “fillna()”, lai aizpildītu trūkstošās vērtības ar 0. Apskatīsim, kā to izdarīt.

Pēc DataFrame parādīšanas mēs izsaucām Pandas funkciju “fillna()”. Šeit mēs iemācīsimies aizpildīt trūkstošās vērtības vienā kolonnā. Tās sintakse jau ir minēta apmācības sākumā. Mēs norādījām DataFrame nosaukumu un norādījām konkrētās kolonnas nosaukumu ar funkciju “.fillna()”. Starp šīs metodes iekavām mēs norādījām vērtību, kas tiks ievietota nulles vietās. DataFrame nosaukuma “trūkst”, un kolonna, kuru mēs šeit izvēlējāmies, ir “M2”. Vērtība, kas norādīta starp “fillna()” iekavām, ir “0”. Visbeidzot, mēs izsaucām funkciju “print ()”, lai skatītu atjaunināto DataFrame.


Šeit varat redzēt, ka DataFrame kolonnā “M2” tagad nav nevienas trūkstošas ​​vērtības, jo NaN vērtība ir aizpildīta ar 0.


Lai aizpildītu NaN vērtības visam DataFrame ar to pašu metodi, mēs saucām par “fillna ()”. Tas ir pavisam vienkārši. Mēs nodrošinājām DataFrame nosaukumu ar funkciju “fillna ()” un piešķīrām funkcijas vērtību “0” starp iekavām. Visbeidzot, funkcija “print ()” mums parādīja aizpildīto DataFrame.


Tādējādi mēs iegūstam DataFrame bez NaN vērtībām, jo ​​visas vērtības tagad tiek papildinātas ar 0.

2. piemērs. Aizpildiet NaN vērtības, izmantojot Pandas “Replace()” metodi

Šajā raksta daļā ir parādīta cita metode, kā aizpildīt NaN vērtības DataFrame. Mēs izmantosim Pandas funkciju “replace()”, lai aizpildītu vērtības vienā kolonnā un pilnā DataFrame.

Mēs sākam rakstīt kodu rīkā “Spyder”. Pirmkārt, mēs importējām vajadzīgās bibliotēkas. Šeit mēs ielādējām Pandas bibliotēku, lai Python programma varētu izmantot Pandas metodes. Otrā bibliotēka, kuru ielādējām, ir NumPy un aizstāj to ar “np”. NumPy apstrādā trūkstošos datus, izmantojot metodi “aizvietot()”.

Pēc tam mēs izveidojām DataFrame ar trim kolonnām - 'skrūve', 'nagla' un 'urbis'. Vērtības katrā kolonnā ir norādītas attiecīgi. Slejā “Screw” ir vērtības “112”, “234”, “None” un “650”. Kolonnā “Nagla” ir “123”, “145”, “Nav” un “711”. Visbeidzot, kolonnā “Drill” ir vērtības “312”, “None”, “500” un “None”. DataFrame tiek saglabāts DataFrame objektā “rīks” un tiek parādīts, izmantojot metodi “print()”.


DataFrame ar četrām NaN vērtībām ierakstā var redzēt šādā izvades attēlā:


Tagad mēs izmantojam Pandas “replace()” metodi, lai aizpildītu nulles vērtības vienā DataFrame kolonnā. Uzdevumam mēs izmantojām funkciju “aizvietot ()”. Mēs nodrošinājām DataFrame nosaukumu “rīks” un kolonnu “screw” ar metodi “.replace()”. Starp iekavām mēs iestatām vērtību “0” “np.nan” ierakstiem DataFrame. Izvades attēlošanai tiek izmantota metode “print()”.


Iegūtais DataFrame parāda mums pirmo kolonnu ar NaN ierakstiem, kas kolonnā “skrūve” ir aizstāti ar 0.


Tagad mēs iemācīsimies aizpildīt vērtības visā DataFrame. Mēs nosaucām metodi “replace()” ar DataFrame nosaukumu un norādījām vērtību, kuru vēlamies aizstāt ar np.nan ierakstiem. Visbeidzot, mēs izdrukājām atjaunināto DataFrame ar funkciju “print ()”.


Tādējādi mēs iegūstam iegūto DataFrame bez trūkstošiem ierakstiem.

Secinājums

Datu rāmja trūkstošo ierakstu apstrāde ir būtiska un nepieciešama prasība, lai datu analīzes procesā samazinātu sarežģītību un izaicinoši apstrādātu datus. Pandas piedāvā dažas iespējas, kā tikt galā ar šo problēmu. Šajā rokasgrāmatā mēs piedāvājām divas noderīgas stratēģijas. Mēs ar rīka “Spyder” palīdzību pielietojam praksē abas metodes, lai izpildītu paraugu kodus, lai padarītu lietas jums saprotamas un vieglākas. Zināšanu iegūšana par šīm funkcijām uzlabos jūsu Pandas prasmes.