Pandas uz vārdnīcu

Pandas Uz Vardnicu



'Python datu struktūra, ko sauc par vārdnīcu, tiek izmantota, lai saglabātu informāciju kā atslēgu un vērtību pārus. Vārdnīcas objekti ir optimizēti, lai iegūtu datus/vērtības, kad atslēga vai atslēgas ir zināmas. Ņemiet vērā, ka vārdnīcās var būt dublētas atslēgas. Lai efektīvi atrastu vērtības, izmantojot saistīto indeksu, mēs varam pārvērst pandas sēriju vai datu rāmi ar atbilstošu indeksu par vārdnīcas objektu ar atslēgu un vērtību pāriem “indekss: vērtība”. Lai sasniegtu šo uzdevumu, var izmantot metodi “to_dict()”. Šī funkcija ir iebūvēta funkcija, kas atrodama pandas moduļa sēriju klasē. Datu rāmis tiek pārveidots par python sarakstam līdzīgu sēriju datu vārdnīcu, izmantojot metodi pandas.to_dict() atkarībā no orientācijas parametra norādītās vērtības.

Kā pārvērst pandas par Python vārdnīcu?

Ir vairākas metodes, kā pārvērst pandas vārdnīcā. Tomēr, lai pārveidotu Pandas datu rāmi par Python vārdnīcu, mēs Pandas izmantosim metodi to_dict(). Mēs varam orientēt atgriezto vārdnīcas atslēgu un vērtību pārus dažādos veidos, izmantojot funkciju to_dict (). Funkcijas sintakse ir šāda:







Sintakse



pandas.to_dict ( austrumi = 'dikts', iekšā = )



Parametri

orientēties: Kuru datu tipu konvertēt kolonnas (sērijas), norāda virknes vērtība (“dict”, “list”, “records”, “index”, “series”, “split”). Piemēram, atslēgvārds “saraksts” sniegtu saraksta objektu python vārdnīcu ar taustiņiem “Slejas nosaukums” un “Saraksts” (pārveidotās sērijas).





iekšā: klase, var tikt nodota kā instance vai faktiskā klase. Piemēram, klases gadījumu var nodot noklusējuma diktāta gadījumā. Parametra noklusējuma vērtība ir dict.

Atgriešanas veids: Vārdnīca, kas pārveidota no datu rāmja vai sērijas.



01. piemērs: Pandas datu rāmja pārvēršana vārdnīcā

Izmantojot funkcijā pd.DataFrame() esošo sarakstu kopu, mēs izveidosim pamata datu rāmi ar dažām kolonnām un rindām, lai vēlāk to varētu pārvērst par Python vārdnīcu.


Mēs esam izveidojuši savu datu rāmi, nododot sarakstu funkcijā pd.DataFrame(). Iepriekš minētajā datu rāmī mums ir trīs kolonnas “uzņēmums”, “pārdošana” un “ieņēmumi”. Kolonnā uzņēmums esam saglabājuši nejaušu uzņēmumu nosaukumus kā (“A&B”, “Max_tech”, “XT”, “MJ”, “Quanto”, “Mini_X”, “Zomo”, “AU”, “HL” , “ZMX”, “Earny”), kolonna “pārdošana” atspoguļo katra uzņēmuma pārdošanas apjomus kā (“217”, “200”, “199”, “150”, “210”, “216”, “185”. ”, “189”, “202”, “159”, “205”) un kolonnā “ieņēmumi” tiek glabātas vērtības, kas atspoguļo katra uzņēmuma ieņēmumus attiecībā pret attiecīgo pārdošanas apjomu (340000   320000  300000 270000  315000                325 000  50 040 305 000). Tagad mēs savu datu rāmi “df” pārveidosim par python vārdnīcu.


Izmantojot metodi to_dict() df dataframe, mēs esam pārveidojuši pandas datu rāmi vārdnīcā.

02. piemērs: Pandas datu rāmja, kas izveidots no CSV faila, konvertēšana vārdnīcā

1. piemērā mēs izveidojām datu rāmi, izmantojot saraksta korteņus. Tagad mēs izveidosim datu rāmi, izmantojot CSV failu, un pēc tam mēs to pārveidosim vārdnīcā, izmantojot funkciju to_dict ().


Lai lasītu failu kā datu rāmi, mēs esam izmantojuši funkciju pd.read_csv(). Iepriekš redzamajā datu rāmī mums ir divas kolonnas (nosaukums un atzīmes) un septiņpadsmit rindas (no 0 līdz 16). Tagad mēs izmantosim metodi to_dict ().


Funkcija ir pārveidojusi mūsu datu rāmi “df” par Python vārdnīcu.

03. piemērs: pārveidojiet Pandas datu rāmi par vārdnīcu, kas satur vērtību sarakstus

Iepriekšējos piemēros mēs esam pārveidojuši pandas par pitona vārdnīcu, kurā ir vairākas vārdnīcas. Pārvēršot datu rāmi par vārdnīcas objektu, kolonnu etiķetēm ir jākalpo kā vārdnīcas atslēgām, un visi kolonnu dati vai vērtības jāpievieno iegūtajai vārdnīcai kā vērtību saraksts katrai atslēgai.


Mēs esam izveidojuši datu rāmi ar trim kolonnām “nosaukums”, “valsts” un “vecums”. Kolonnā “name” esam saglabājuši datu vērtības (“Anna”, “Marty”, “Carl”, “Mary”, “Cleb”, “Ali”, “Alexa”, “Becky”, “Ryan”). . Savukārt pārējās kolonnas valsts un vecums ir spēcīgas vērtības (“ASV”, “Anglija”, “ASV”, “Francija”, “Krievija”, “Krievija”, “Francija”, “Anglija”, “ASV”) un ( attiecīgi 34, 32, 30, 27, 31, 33, 35, 25, 30). Mēs izveidosim vārdnīcu, kurā būs saraksti, izmantojot parametru “list” metodes to_dict() ietvaros.


Izmantojot saraksta parametru kā argumentu funkcijā to_list (), mēs esam ģenerējuši vārdnīcu, kurā ir vairāki saraksti.

03. piemērs: pārveidojiet Pandas datu rāmi par vārdnīcu, kas satur vērtību sēriju

Kad DataFrame ir jāpārveido par vārdnīcu, kolonnas nosaukums kalpo kā vārdnīcas atslēgas, bet rindas indekss un kolonnas dati kā atbilstošo vārdnīcas taustiņu vērtība.


Mēs esam izveidojuši nepieciešamo datu rāmi, izmantojot pd.DataFrame() metodi. Nesen izveidotajā datu ietvarā mums ir divas kolonnas. Nosaukuma kolonnā datu vērtības tiek saglabātas kā virkne (“Kim”, “Morris”, “Casper”, “Milli”, “Dave”, “Will”, “Billy”), savukārt atzīmju kolonnas sastāv no skaitliskiem datiem kā ( 8, 9, 6, 7, 10, 7, 8). Mēs izmantosim parametru “series” kā virkni funkcijā to_dict ().

04. piemērs: konvertējiet Pandas datu rāmi vārdnīcā bez indeksa un galvenes

Funkcijas to_dict() parametru “split” var izmantot, lai iegūtu datus no DataFrame bez kolonnu galvenēm vai ja mums ir jānoņem no datiem galvenes un rindas indekss. Izmantojot šo parametru, kolonnu etiķetes, rindu indekss un faktiskie dati tiek sadalīti trīs komponentos. Izveidosim datu rāmi, lai mēs varētu to sadalīt trīs daļās, vienlaikus pārvēršot to vārdnīcā.


Mēs esam izveidojuši divas kolonnas ar apzīmējumiem “name” un “age”, kas satur vērtības (“Dave”, “Morris”, “Billy”, “Milli”, “Kim”, “Will”, “Casper”) un (19, 19). , 25, 21, 19, 21, 23) attiecīgi. Pārveidosim tos par python vārdnīcām.


Izmantojot taustiņu “dati”, mēs varam izgūt datus no iegūtās vārdnīcas bez indeksa vai galvenes.

05. piemērs: konvertējiet Pandas datu rāmi vārdnīcā pēc rindas un rindu indeksa

Parametru “record” var izmantot funkcijā to_dict(), lai saglabātu katras datu rāmja rindas datus vairākos atsevišķos vārdnīcas objektos sarakstā vai ja ir nepieciešami dati pa rindām. Tiks atgriezts saraksts ar vārdnīcas objektiem. Vārdnīca ar kolonnas etiķeti kā atslēgu un kolonnas datiem kā katras rindas vērtību.


Mēs esam izveidojuši datu rāmi ar kolonnām “vārds” un “alga”. Slejā “name” ir datu vērtības (“Leo”, “Haris”, “Wanda”, “Mike”, “Kelly”, “Adam”, “Jack”), un algas kolonnā tiek saglabātas vērtības (12000, 12500). , 14000, 11000, 12000, 13000, 12500). Tagad izveidosim sarakstu ar vairākām python vārdnīcām, kurās ir dati par katru rindu.


Indeksa parametru var izmantot arī, lai pārvērstu katras rindas datus no datu rāmja uz vārdnīcu. Tiks atgriezts saraksts ar vārdnīcas vienumiem. Katra rinda ģenerē vārdnīcu. Kur rindas indekss būs atslēga un vērtība būs datu vārdnīca un kolonnas etiķete.

Secinājums

Šajā apmācībā mēs esam apsprieduši, kā mēs varam pārveidot datu rāmi vai pandas objektus python vārdnīcā. Mēs esam redzējuši funkcijas to_dict() sintaksi, lai saprastu šīs funkcijas parametrus un to, kā jūs varat modificēt funkcijas izvadi, norādot funkciju ar dažādiem parametriem. Šīs apmācības piemēros mēs izmantojām to_dict() metodi, kas ir iebūvēta pandas funkcija, lai mainītu pandas objektus uz Python vārdnīcu.