Pandas Ievietot() kolonnu

Pandas Ievietot Kolonnu



'Python nodrošina plašu datu struktūru un operāciju klāstu skaitlisko un laikrindu datu apstrādei. DataFrame, ko esam izveidojuši vai importējuši Pandas, var izmantot dažādiem mērķiem. Datu rāmja kolonnas var arī pielāgot kopā ar datu avotu. Pandas atvieglo daudzus nogurdinošos un laikietilpīgos uzdevumus, kas saistīti ar datu apstrādi. Ir četri veidi, kā Pandas sistēmā pievienot kolonnu DataFrame, taču šajā rakstā mēs izmantojam pandas kolonnas funkciju “insert()”.

Kad esam izveidojuši vai ielādējuši savu dataFrame programmā Pandas, mēs varētu vēlēties paveikt dažādas lietas. Piemēram, mēs varam turpināt manipulēt ar datiem, piemēram, mainot kolonnas datu rāmī. Tālāk mums ir jāsaprot, kā datu rāmī iekļaut kolonnas, ja lielākā daļa datu nāk no viena datu nodrošinātāja, bet daži dati nāk no cita. Kolonnu var viegli pievienot Pandas dataFrame.







Pandas ievietot() Metode

Datu rāmja pēdējo kolonnu ģenerē cita funkcija. Izmantojot DataFrame “insert()” metodi, varat pievienot kolonnas starp pašreizējām kolonnām, nevis pievienot tās pandas DataFrame apakšā. Tas piedāvā mums iespēju pievienot kolonnu jebkurā vietā, kur mēs izvēlamies, nevis vienkārši beigās. Turklāt tas piedāvā daudzus veidus, kā pievienot kolonnas vērtības. Ja jums ir jāpievieno kolonna noteiktā vietā vai indeksā, pandas funkcija “insert()” ir noderīga.



Sintakse Pandas insert() kolonnai



1. piemērs. Kolonnas ievietošana datu rāmī, izmantojot Pandas insert() metodi

Sāciet ar raksta pirmo piemēru, kurā mēs paskaidrosim, kā datu rāmī ievietot kolonnu. Izmantojot rīku “spyder”, mēs varam pierādīt šo kodu. Pirmkārt, mēs ģenerējam datu rāmi ar nosaukumu “kurss”. Šajā datu rāmī ir divas kolonnas: “course_title” un “fee”. Kolonnā “course_title” ir saraksts ar kursiem “python”, “java”, “object_oriented” un “PHP”. Otrajā kolonnā “maksa” ir saraksts ar kursu maksu, kas ir “30000”, “25000”, “15000” un “22000”. Parādot mūsu dataFrame, “kurss”, izmantojot “pd. DataFrame”.





Tālāk mēs apspriedīsim koda galveno funkciju, kas ir pandas “insert() column”. Tā ir efektīva metode, lai datu rāmī iekļautu jaunu sarakstu. Varat pievienot jaunu kolonnu jebkurā norādītajā vietā, izmantojot ievietošanas metodi. Šī metode ļauj arī manuāli pievienot kolonnu datu rāmim, taču ir mazāka pielāgošanās spēja.

Visa ievietošana nozīmē, ka avota DataFrame tiek tieši atjaunināts procesa laikā un netiek izveidots jauns DataFrame. Šajā gadījumā datu rāmim esam pievienojuši jaunu kolonnu ar nosaukumu “Time_duration”, izmantojot funkciju “insert()”. Vērtību saraksts šajā slejā ir “6_months”, “3_months”, “3months” un “6_months”. Tālāk esošajā programmā ir kolonna “Time_duration” ar indeksu, kas definēts kā “2”. Tā kā indekss ir norādīts, DataFrame tiks piešķirts diapazons, kas sākas ar 0 un palielinās pa soļiem, tāpēc tas nozīmē, ka šī kolonna tiek parādīta kā trešā kolonna datu rāmī. DataFrame pievieno jaunu kolonnu ar nosaukumu “Time _duration”, izmantojot funkciju “pd.insert()”.



Un tagad apspriedīsim programmas rezultātus no augšas. Tā izvadē tiek parādīts datu rāmis, kurā ir trīs kolonnas. Papildu kolonna tiek pievienota datu rāmja beigās. Izmantojot metodi “pd.DataFrame.insert()”, varat pievienot kolonnu starp citām kolonnām, nevis pievienot tās pandas DataFrame beigās.”Time_ duration” ir jauna kolonna, kuru pievienojām, izmantojot “inserting”. funkciju. Pozīcija “2” attiecas uz trešo kolonnu DataFrame, jo pozīcija sākas ar 0. Kolonna tiek pievienota datu rāmja pēdējai vietai.

2. piemērs: kolonnu pievienošana datu rāmim, izmantojot funkciju Pandas insert().

Mēs izmantosim metodi “insert()”, lai datu rāmim pievienotu jaunas kolonnas. Tā vietā, lai pandu beigās pievienotu papildu kolonnas, varat tās ievietot starp esošajām kolonnām. Lai izveidotu datu rāmi, kas ir līdzīgs iepriekšējam piemēram, mēs paņēmām trīs kolonnas un piešķīrām tām vērtības. Pirmajā kolonnā “Vārds” ir saraksts ar vārdiem, kas ietver “Emma”, “Ella”, “Smits” un “Maxwell”. Otrajā slejā “Vecums” vērtību sarakstā ir “29”, “36”, “39” un “33”.

Pēc tam mēs izdrukājam paziņojumu “DataFrame”. Mēs parādīsim datu rāmi zem priekšraksta “datu rāmis”. Mēs izveidojam vēl vienu kolonnu Pandas datu rāmim, izmantojot funkciju “insert()”. Jāizveido saraksts, lai to varētu pievienot kā jaunu kolonnu mūsu dotajai datu kopai. Pandas DataFrame metodi “assign()” var izmantot arī, lai pievienotu vairāk kolonnu. Mēs ievietojam jaunu kolonnu, izmantojot “df. ievietot”. Papildu kolonnā ar nosaukumu “Dzimums” tiek rādīts dzimums kā “Vīrietis” vai “Sieviete”.

Izdrukāsim vēl vienu paziņojumu “New Dataframe”. Jauns datu rāmis tagad tiks parādīts zem paziņojuma “New Dataframe”, kurā būs papildu kolonna, kuru pievienojām ar “pd. ievietot ()” funkciju. Kolonnu ar līdzīgu nosaukumu nevar pievienot, izmantojot funkciju “insert()”. Gadījumā, ja kolonna jau pastāv datu rāmī, pēc noklusējuma tiek parādīta Vērtības kļūda.

Šajā izvadē kolonna, ko izveidojām, izmantojot funkciju “insert()”, tiek pievienota datu rāmim. Tā izvadē tiek parādīti divi datu rāmji; pirmais dataFrame tika izveidots, izmantojot “pd.data frame”, kurā mums ir divas kolonnas “Vārds” un “Vecums”. Jaunā kolonna “dzimums”, ko pievienojām, izmantojot funkciju “insert()”, tiek parādīta otrajā tālāk redzamajā datu rāmī. Šis datu rāmis parāda, ka ir trīs kolonnas ar dažiem datiem. Indeksa izmērs ir “2”, kas nozīmē, ka tajā ir ieraksti no “0 līdz 3”. Jaunās kolonnas, ko piešķīrām šim datu rāmim, indeksa pozīcija ir “3”.

Secinājums

Bieži izmantotā datu analīzes un atjaunināšanas darbība ir kolonnu pievienošana DataFrame. Tomēr Pandas piedāvā daudzas iespējas uzdevuma izpildei, piedāvājot četras dažādas metodes; tomēr mēs savā rakstā izmantojam tikai vienu paņēmienu, proti, panadas kolonnu “insert()”. Viena no grūtākajām daļām DataFrame paplašināšanā ar jaunām kolonnām ir indeksēšana. Ļaujiet mums ātri aprakstīt abus piemērus. Vispirms mēs izveidojām datu rāmi ar nosaukumu Kurss un pievienojām kolonnas “kursa nosaukums” un “maksa”, kā arī piešķīrām šai kolonnai vērtības. Izmantojot funkciju “insert()”, mēs tam pašam datu rāmim pievienojam jaunu kolonnu, norādot tās pozīciju kā “2” indeksā. Otrajā piemērā ir parādīti divi datu rāmji. Mēs esam izveidojuši divas kolonnas un uzskaitījuši dažas vērtības pirmajā datu rāmī. Pēc tam, izmantojot funkciju insert(), datu rāmī ievietojām jaunu kolonnu ar nosaukumu “Dzimums”, tā arī tika pozicionēta kā “2” rādītājā; tagad tas atkal parādīja tabulu, kā parādīts iepriekš minētajā otrajā piemērā.

Pēc iepriekš minēto metožu apguves mēs varam viegli pievienot jaunas kolonnas DataFrame.