Unikāls Pandas datu rāmis

Unikals Pandas Datu Ramis



Populārākā Python bibliotēka, kas tiek izmantota datu zinātnē, tiek saukta par Pandas. Tas piedāvā Python programmētājiem augstas veiktspējas, lietotājam draudzīgus un datu analīzes rīkus. Kad esat sapratis pamatfunkcijas un to izmantošanu, Pandas ir spēcīgs rīks datu mainīšanai. “Pandās” standarta metodes datu glabāšanai tabulas veidā ir DataFrames. Mēs varam izmantot dažas “pandas” metodes, lai iegūtu unikālās vērtības datu rāmja “pandas” kolonnā. Ja mums ir jāiegūst unikālas vērtības DataFrame kolonnās un mēs nevēlamies, lai vērtības dublētu DataFrame kolonnā “pandas”, mēs varam izmantot metodes, ko nodrošina “pandas”. Apskatīsim šādas metodes šajā rokasgrāmatā, kā arī dažus piemērus un izvadi, lai iegūtu unikālas vērtības DataFrame kolonnā “pandas”.

Metodes unikālu vērtību iegūšanai “pandas” DataFrame kolonnās

Mēs varam izmantot divas metodes, lai iegūtu unikālās vērtības “pandas” DataFrame kolonnās. Mēs atmetam dublētās vērtības un iegūstam tikai unikālās vērtības DataFrames kolonnās. Metodes, ko “pandas” nodrošina šī uzdevuma veikšanai, ir:







  • Izmantojot unikālo () metodi.
  • Izmantojot metodi drop_dupliactes().

Tagad mēs izmantosim abas metodes “pandas” kodos, lai iegūtu unikālās vērtības “pandas” DataFrame kolonnās.



Piemērs # 01

Šeit tiek izmantota lietotne “Spyder”, lai ģenerētu šos “pandu” kodus, lai izmantotu tās metodes, kas palīdz mums iegūt unikālās vērtības “pandas” DataFrame kolonnās. Pirms DataFrame izveides mums ir jāimportē “pandas” moduļi, kas nepieciešami “pandas” kodam. Izmantojot terminu “importēt” un ievietojot “pandas kā pd”, mēs importējam šos moduļus.



Tagad ar “pd” palīdzību varam ātri iegūt “pandas” funkcijas vai metodes. Pēc tam mēs ievietojam “Subject_data”, kurā pievienojam “Vārds”, un “Vārds”, mēs pievienojam vārda datus, kas ir “Roman, William, Peter, Smith, John, Milli, Thomas un James”. Pēc tam sadaļā “Subj” pievienojam priekšmetu datus, kas ir “matemātika, ekonomika, zinātne, matemātika, statistika, statistika, statistika un datori”. Pēc tam mēs konvertējam šo “Subject_data” par “Subject_df” DataFrame, izmantojot metodi “pd.DataFrame()”. Mēs ievietojam “Subject_df” metodē “print ()”, lai tas tiktu parādīts terminālī.





Tagad mēs vēlamies iegūt unikālās vērtības “pandas” DataFrame kolonnā “Subj”. Šim nolūkam mēs izmantojam “unikālo ()” metodi un pievienojam kolonnas nosaukumu un arī DataFrame nosaukumu, kā parādīts zemāk. Mēs pievienojam šo metodi “print ()”, lai rezultāts tiktu parādīts arī terminālī.



Tagad mēs nospiežam “Shift+Enter”, lai iegūtu šī koda rezultātu, un tas tiek renderēts terminālī un tiek parādīts arī šeit, kurā ir DataFrame ar visām vērtībām. Šis ir oriģinālais DataFrame, ko esam pievienojuši kodam, un zem tā tiek parādītas unikālās kolonnas “Subj” vērtības. Tas atmet dublētās vērtības un parāda DataFrame kolonnas “Subj” unikālās vērtības.

Piemērs # 02

Mēs izveidojam “Sample_list”, kurā ir ietverta informācija. Mēs ievietojam “Layla, 21, 28, 31, 14 un 39”, kas parādīsies kā pirmā kolonna, kad mēs pārveidosim šo sarakstu par DataFrame. Pēc tam mēs pievienojam “Lusy, 31, 25, 34, 26 un 21” kā DataFrame otro rindu. Pēc tam mums ir “Peter, 38, 20, 20, 35 un 24” un “Layla 38, 23, 39 24, 23”, kas būs DataFrame trešā un ceturtā rinda. Mēs arī ievietojam vēl trīs datus, kas ir 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' un arī 'Pēteris, 21, 21, 31, 21, 29' .

Tagad mēs pārveidojam “Sample_list” par “DF_Sample”, kas šeit ir DataFrame nosaukums, ievietojot funkciju “pd.DataFrame()”. Mēs arī iestatām šī DataFrame kolonnu nosaukumus, un šie nosaukumi ir “Name, Ass_1, Ass_2, Ass_3, Ass_4 un Ass_5”. Pēc tam mēs izmantojam “print()”, kas palīdz parādīt DataFrame “DF_Sample”. Tagad mēs šajā piemērā izmantojam citu metodi, lai iegūtu unikālās vērtības DataFrame kolonnā. Šī metode ir “pandas” metode “drop_duplicates()”.

Izmantojot metodi “drop_duplicates()”, mēs iestatām kolonnas nosaukumu, kurā vēlamies iegūt unikālās vērtības DataFrame kolonnā. Mēs iegūstam unikālas kolonnas “Nosaukums” vērtības, nometot dublētās vērtības šajā kolonnā, izmantojot metodi “drop_duplicates()”, kā arī renderēt šīs unikālās vērtības, izmantojot funkciju “print()”.

Pēc metodes “drop_duplicates()” izmantošanas tiek atmesti nosaukumi, kas tiek dublēti, un tiek atveidotas unikālas vērtības. Varat atzīmēt, ka nosaukums “Layla” parādās trīs kolonnas “Nosaukums” šūnās. Bet, kad šai kolonnai tiek lietota metode “drop_duplicates()”, visas dublikātu vērtības tiek atmestas un ekrānā parādās viens nosaukums “Layla”. Pēc dublikātu vērtību nomešanas parādījās jaunais DataFrame, kas satur unikālās vērtības šajā kolonnā “Nosaukums”. Tādā veidā mēs varam atmest dublētās vērtības un iegūt unikālo vērtību DataFrame kolonnā, izmantojot metodi “drop_duplicates()”.

Piemērs # 03

Tas pats DataFrame tiek izmantots vēlreiz, un tagad mēs šeit izmantojam “unikālo ()” metodi. Izmantojot metodi “unikāls ()”, mēs ievietojam kolonnas nosaukumu, kā arī DataFrame nosaukumu, kuram mēs vēlamies izmantot šo “unikālo ()” metodi, lai iegūtu unikālās vērtības. Tādējādi tiks atveidotas tikai šīs kolonnas unikālās vērtības, un šīs vērtības netiks rādītas DataFrame formātā.

Šeit DataFrame kolonnā “Nosaukums” ir septiņas vērtības, bet, ja šai kolonnai piemērojam metodi “unikāls()”, ir parādījušās tikai četras vērtības, un tās ir šīs kolonnas unikālās vērtības. Tas neatveido vērtību dublikātus.

Piemērs # 04

DataFrame, ko mēs izveidojam šajā piemērā, ir “F_G_df”. Šajā DataFrame mēs ievietojam “My_fruits” un “my_Vegs”. Slejā “Mani_augļi” ir “Ābols, apelsīns, ābols, bumbieris, ličī, ābols, ābols, bumbieris un ābols”. Tālāk mums ir “My_Vegs”, kurā ir ietverti dārzeņu nosaukumi, kas ir “čilli, bringle, burkāns, kartupelis, kartupelis, burkāns, sīpols, ķiploks un ingvers”. Šajā DataFrame ir tikai divas kolonnas.

Tagad mēs iegūstam unikālās vērtības abās kolonnās, izmantojot metodi “unique()”. Mēs pieminam DataFrame nosaukumu. Pēc tam ievietojiet kolonnas pirmās kolonnas nosaukumu. Pēc tam mēs izmantojam append () metodi. Šajā papildinājumā mēs atkal ievietojam DataFrame nosaukumu un otrās kolonnas nosaukumu un ievietojam metodi “unikāls ()”. Tas iegūs abu kolonnu unikālās vērtības, pēc tam pievienos abu kolonnu unikālās vērtības un parādīs tās ekrānā.

Vispirms tiek renderēts DataFrame, kurā ir visas vērtības. Pēc tam tiek lietota metode “unikālā()” un tālāk tiek atveidotas abu kolonnu unikālās vērtības. Šajā kodā mēs iegūstam unikālās vērtības vairākās DataFrame kolonnās, izmantojot metodi “unique()”.

Secinājums

Pilns skaidrojums par unikālo vērtību iegūšanu DataFrame kolonnā ir atrodams šajā rokasgrāmatā. Mēs esam apsprieduši metodes “unique ()” un “drop_duplicates ()”, kas palīdz mums iegūt unikālās DataFrame kolonnas vērtības. Mēs esam izpētījuši, kā šīs metodes izmantot “pandas” kodā, izmantojot šīs metodes mūsu kodos. Šajā rokasgrāmatā esam ilustrējuši dažādus piemērus un parādījuši, kā iegūt vienas kolonnas unikālās vērtības, izmantojot metodi “unique()”, kā arī metodi “drop_duplicates()”. Mēs esam arī izpētījuši, kā iegūt unikālās vērtības vairākās kolonnās, šajā rokasgrāmatā izmantojot metodi “unikāls()”.