Pandas Reindekss

Pandas Reindekss



“Pandās” mēs varam uzglabāt daudz informācijas tabulas veidā, ko sauc arī par DataFrame. “Pandas” palīdz mums izmantot “DataFrame()” metodi DataFrame konstruēšanai. DataFrame satur indeksus, un mēs varam arī mainīt DataFrame indeksus, izmantojot “pandas” funkcijas. Metode, ko mēs izmantojam DataFrame atkārtotai indeksēšanai, ir “reindex()” metode. Šī metode palīdz mainīt rindas indeksa vērtības, kā arī kolonnu indeksa vērtības. Izmantojot šo metodi, mēs varam mainīt DataFrame noklusējuma indeksu, kā arī mēs varam mainīt indeksu, ko iestatījām, veidojot DataFrame. Mēs izmantosim “reindex()” metodi mūsu “pandas” piemēros šajā apmācībā un padziļināti izskaidrosim šo jēdzienu šeit.

Piemērs # 01

Rīks “Spyder” palīdz mums izstrādāt “pandas” kodu šajā apmācībā, un mēs sākam savu kodu ar atslēgvārdu “import”, kas palīdzēs importēt funkciju “pandas”. Mēs ievietojam “pandas kā pd” pēc “importa” ievadīšanas. Pēc tam mēs izveidojam DataFrame, ierakstot “pd.DataFrame()”. Mēs rakstām šo “pd”, jo “DataFrame()” ir “pandas” metode. “value_df” ir tā mainīgā nosaukums, kurā tiek saglabāts DataFrame. Mēs pievienojam 'RandomName', kas ir kolonnas nosaukums, un 'RandomName' satur 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander un Samuel'.







Pēc tam mums ir “Vērtība_1”, kurā esam ievietojuši “16, 29, 24, 35, 44, 50, 69, 74 un 88”. Pēc tam nāk “Vērtība_2”, un mēs esam pievienojuši “25, 38, 42, 56, 54, 65, 78, 89 un 99”. Tagad nākamais ir “Vērtība_3”, un mēs tajā ievietojam “36, 48, 52, 69, 74, 75, 87, 91 un 69”. Pēc tam ir kolonna “Vērtība_4”, kurā esam ievietojuši “52, 64, 72, 88, 82, 95, 97, 21 un 39”. Pēdējā kolonna šeit ir kolonna “Vērtība_5”, un šajā kolonnā pievienotās vērtības ir “66, 78, 82, 99, 34, 45, 57, 61 un 89”. Pēc tam mēs izmantojam funkciju “print()”, kurā tiek pievienots “Values_df”. Tas tiks izdrukāts terminālī.




Pēc “Shift+Enter” nospiešanas mēs varam viegli iegūt mūsu kodu rezultātu lietotnē “Spyder”. Šeit šis kods atgriež DataFrame ar noklusējuma indeksu. Tagad mēs izmantosim metodi “reindex()”, lai pārindeksētu šo DataFrame “pandas”.




Funkcija “reindex()” šeit tiek izmantota rindas indeksa vērtības pārindeksēšanai. Iepriekš minētajā DataFrame var redzēt, ka tiek parādītas rindas noklusējuma indeksa vērtības, un tagad mēs izmantojam “reindex()” metodi šo rindu indeksu atkārtotai indeksēšanai. Mēs ievietojam DataFrame nosaukumu un pēc tam metodi “reindex()”, kurā ievietojam tās indeksa vērtības, kuras vēlamies pievienot iepriekšminētajam DataFrame. Funkcijā “reindex ()” ievietojam “ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H un ind_I”. Tātad šo rindu indeksi tiks atjaunināti DataFrame, kad mēs izpildīsim šo kodu.






Šajā iznākumā tiek parādītas rindas indeksa vērtības, un varat ņemt vērā, ka DataFrame vērtības šeit netiek rādītas un ir parādījušās “NaN” vērtības. Tas ir tāpēc, ka jaunās indeksa vērtības neatbilst iepriekšējām DataFrame indeksa vērtībām. Ja jaunais indekss un vecais indekss nesakrīt, tas parāda “Nan”. Šīs “NaN” vērtības tiek rādītas pēc noklusējuma, kad mēs mainām indeksu, un tas neatbilst iepriekšējam indeksam.



Piemērs # 02

Tagad mēs mainām kolonnas indeksa vērtības “Value_df”, ko iepriekš izveidojām 1. piemērā. Pēc “Value_df” drukāšanas mēs ievietojam mainīgo “column” un pievienojām tam dažas vērtības. Mēs pievienojam “a_1, b_1, c_1, d_1 un e_1”. Tagad mēs vēlamies pielāgot šīs vērtības kā kolonnu indeksu, tāpēc šim nolūkam mēs izmantojam metodi “reindex()” un ievietojam mainīgā nosaukumu “column”, kurā tiek saglabātas jaunās kolonnas indeksa vērtības un iestatiet arī “ass” uz “kolonnas”, tādējādi tiks atjaunināts kolonnas ass indekss. Mēs ievietojām metodi “reindex()” laukā “print ()”, tāpēc tā tiks renderēta arī terminālī.


Tā kā mēs esam izmantojuši metodi “reindex()”, kolonnu indeksa vērtības, kas atrodas pirmajā DataFrame, tiek atjauninātas, un atjauninātajā DataFrame tiek pievienotas jaunas vērtības. Varat arī atzīmēt, ka visas DataFrame vērtības tiek pārveidotas par “NaN”, jo abas kolonnu indeksa vērtības ir atšķirīgas.

Piemērs # 03

Programmēšanas_dati šajā kodā satur 'P_Languages', kur esam pievienojuši 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java un JavaScript'. Pēc tam mums ir “Stundas”, kurā ievietojam “4_h, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs un 6_hrs”. Pēc tam tiek ievadīts “P_Code”, un mēs ievietojam “11523, 12423, 12321, 11456, 11454, 12267, 13106 un 14123”. Mēs pievienojam mainīgo “p_index” un ievietojam “Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G un Pro_H”.

Šīs vērtības tiks izmantotas kā rindu indeksa vērtības. Mēs mainām “Programming_data” “Programming_df” DataFrame. Mēs arī pievienojam “p_index” šim DataFrame, izmantojot “index” metodi. Mēs ievietojam “Programming_df” un pēc tam metodi “index” un piešķiram tam “p_index”. Tagad iepriekš minētās indeksa vērtības tiek pievienotas kā rindu indeksa vērtības DataFrame. Mēs drukājam arī “Programming_df”.

Pēc tam mainīgajam “new_index” pievienojam dažas jaunas indeksa vērtības, un tās ir “P_1, P_2, P_3, P_4, P_5, P_6, P_7 un P_8”. Tā kā mēs vēlamies atjaunināt rindu indeksa vērtības, mēs izmantojam metodi “reindex()” un kā šīs funkcijas parametru ievietojam “new_index”, kā arī saglabājam atjaunināto DataFrame mapē “newProgramming_df” un ievietojam “newProgramming_df” mapē “ print()” parādīšanai.


Indeksa vērtības tiek atjauninātas, un mēs varam arī teikt, ka esam atkārtoti indeksējuši mūsu izveidoto DataFrame. Visas DataFrame vērtības tiek arī pārveidotas par “NaN”, jo abas indeksa vērtības ir atšķirīgas.

Piemērs # 04

Pašlaik mēs mainām kolonnu indeksa vērtības “Programming_df’s”, kuras iepriekš izstrādājām 3. piemērā. Mēs ievietojam mainīgo “kolonna” un ievietojam tajā jaunas vērtības. 'P_Code', P_Languages, Hours un New' tiek pievienoti mainīgajam 'kolonna'. Pēc tam mēs atkal izmantojam metodi “reindex()”, kurā iestatām mainīgo “kolonna”, kas atjauninās iepriekšējās kolonnas indeksa vērtības un pievienos šīs jaunās kolonnas indeksa vērtības DataFrame.

Šeit varat atzīmēt, ka jaunās vērtības, kuras esam pievienojuši kolonnā, ir tādas pašas kā iepriekš minētajā DataFrame, taču secība ir atšķirīga, tāpēc tā mainīs kolonnu secību un pielāgos visas kolonnas, kā mēs minēts mainīgajā “kolonnā”. Mēs arī pievienojam vēl vienu indeksa vērtību, kas nav iepriekš minētajā DataFrame, kas šeit ir “Jauns”, tāpēc šajā kolonnā tiks parādītas “NaN” vērtības.


Šeit tiek mainīta kolonnu secība, un visas vērtības tiek parādītas tādas, kādas tās ir sākotnējā DataFrame kolonnās, un atjauninātā DataFrame kolonnā “New” ir visas “NaN” vērtības, jo šīs kolonnas nav sākotnējā DataFrame.

Secinājums

Mēs esam iesnieguši šo pamācību, kas palīdz mums detalizēti izprast jēdzienu “pandas reindex”. Mēs esam apsprieduši, kā mēs varam atkārtoti indeksēt DataFrame kolonnu, kā arī rindas indeksa vērtības. Mēs esam paskaidrojuši, ka šim nolūkam tiek izmantota “pandas” funkcija “reindex()”. Mēs esam veikuši dažādus piemērus, kuros esam mainījuši DataFrame rindu indeksa vērtības un arī DataFrame kolonnu indeksa indeksa vērtības. Šajā apmācībā esam atveidojuši visu kodu rezultātus, kā arī tos padziļināti izskaidrojuši.