Pandas summas kolonna

Pandas Summas Kolonna



'Šis raksts parādīs, kā summēt visas vai atsevišķas kolonnas Pandas DataFrame, izmantojot Python. Funkcija DataFrame.sum() tiks izmantota kopā ar dažiem noderīgiem parametriem daudzos šīs apmācības piemēros.

Kad šī apmācība ir beigusies, jūs, iespējams, zināt, kā:







    • Atrodiet Pandas datu rāmja kolonnas summu.
    • Datu rāmja kolonnu pievienošana kopā
    • Pievienojiet Pandas Dataframe kolonnas, kas atbilst norādītajam nosacījumam.
    • Nosakiet summu pēc datu rāmja datu grupēšanas.

Kā noteikt datu rāmja kolonnu summu?

Funkcija “dataframe.sum()” programmā Pandas atgriež kopējo summu norādītajai asij. Ja ievade ir indeksa ass, funkcija pievieno katras kolonnas vērtības atsevišķi un pēc tam dara to pašu katrai kolonnai, atgriežot sēriju, kurā tiek glabāta datu/vērtību summa katrā kolonnā. Turklāt tas atbalsta datu rāmja summas aprēķināšanu, ignorējot trūkstošās vērtības.



Sintakse: DataFrame.sum (ass = nav, skipna = nav, līmenis = nav, tikai ciparu_ = nav, min_skaits = 0, **kwargs)



kur,





ass: {kolonnas (1), rādītājs (0)}

pasūtīt: Aprēķinot rezultātu, ignorējiet NA/null vērtības.



līmenis: Ja norādītā ass ir hierarhiska (vairāku indeksu), skaitiet līdz noteiktam indeksa līmenim pirms konvertēšanas uz sēriju.

numeric_only: Ir pieņemamas tikai float, int un Būla kolonnas. Ja Nav, mēģiniet izmantot visu; ja nē, tad tikai skaitliskos datus. Sērijām, nav ieviests.

min_count: Iespējamo vērtību skaits, kas nepieciešams, lai pabeigtu darbību. Rezultāts būs NA, ja ir mazāk vērtību, kas nav NA, nekā min_count.

Atgriež: DataFrame (ja norādīts līmenis) vai Series.

01. piemērs: nosakiet datu rāmja kolonnas un visu kolonnu summu

Vispirms mums ir nepieciešams datu rāmis ar derīgajiem datu tipiem, t.i., int, float utt., kolonnu vai kolonnām, kurām mēs varam atrast datu summu. Datu rāmis tiks izveidots, izmantojot funkciju pd.DataFrame().


Mēs esam izveidojuši nepieciešamo datu rāmi no python vārdnīcas funkcijā pd.DataFrame(). Iepriekš izveidotajā datu rāmī ir četras kolonnas “Nosaukums”, “diena1”, “diena2” un “diena3”. No četrām kolonnām trīs kolonnas, t.i., “diena1”, “diena2” un “diena3”, ir ciparu kolonnas ar datu vērtībām (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, attiecīgi 5, 2, 3, 4, 6, 2) un (7, 4, 3, 5, 6, 2, 1, 4). Mēs varam atrast tikai šo trīs kolonnu summu. Summu gan sērijām (t.i., kolonnai), gan visam datu kadram var noteikt, izmantojot sum() metodi. Sāksim, mācot, kā apkopot visus datus Pandas kolonnā.


Lai noteiktu summu, kolonnā “day2” izmantojām metodi summa () . Funkcija ir atgriezusi summas vērtību 28. Līdzīgi tam mēs varam noteikt katras Dataframe kolonnas summu. Vienkārši izmantojot metodi summa () visā datu ietvarā, tas tiks sasniegts.


Kā redzams, ailes “diena1” summa ir 31; “diena2” summas vērtība ir 28, savukārt kolonnai “day3” summa ir 32.

Piemērs # 02: Funkcijas sum() izmantošana, lai apkopotu datu rāmja kolonnas vērtības kopā

Kā redzat no iepriekšējā piemēra izvades, funkcija neatgrieza faktiskos datu rāmja kolonnas datus, kas veidoja summu. Tomēr, piešķirot DataFrame kolonnai metodi “DataFrame.sum()”, varat piekļūt katrai DataFrame kolonnai, tostarp summas kolonnai. Pirmkārt, šim piemēram mēs izveidojam citu datu rāmi.


Izmantojot pd.DataFrame() mūsu datu rāmis ir izveidots. Mēs esam izveidojuši datu rāmi ar trim kolonnām: prece, cena un nodoklis. Kolonnas vienums, kurā ir virknes vērtības (“pildspalva”, “marķieris”, “lineāls”, “dzēšgumija”, “zīmulis”, “starpliktuve”, “skavotājs”, “tapas”), kolonnas cena, kurā tiek glabātas vērtības (20, 15, 10, 3, 5, 30, 35, 10), un kolonna “nodoklis” sastāv no vērtībām (8, 5, 3, 3, 4, 10, 5, 2). Tagad saskaitīsim cenas un nodokļu kolonnas vērtības un saglabāsim rezultātus jaunā kolonnā, saglabājot sākotnējās datu rāmja kolonnas.


Kā var pamanīt līdz ar jauno kolonnu “kopā”, funkcija atgriež arī dotā datu rāmja sākotnējās kolonnas. Kolonnā “kopā” tiek saglabāta sleju “cena” un “nodoklis” vērtību summa attiecībā pret katru “preces” datus.

03. piemērs: funkcijas sum() izmantošana, lai noteiktu norādīto datu rāmja kolonnu summu

Lai summētu vairākas datu rāmja kolonnas, mēs varam norādīt sarakstu ar kolonnu etiķetēm un pēc tam sarakstā lietot metodi sum(), lai atrastu summu. Tāpat kā iepriekšējos piemēros, mēs vispirms izveidosim datu rāmi.


Mēs esam izveidojuši savu datu rāmi ar četrām kolonnām “students”, “marks1”, “marks2” un “marks3”. Kolonnā “students” tiek glabāti dati (“Larry”, “James”, “Rob”, “Arya”, “Max”, “Ben”, “Gwen”, “Bill”), bet kolonnā “marks1” tiek glabāti dati. vērtības (8, 9, 6, 8, 10, 7, 9, 9), savukārt kolonnās “marks2” un “marks3” tiek glabātas skaitliskās vērtības (6, 6, 8, 6, 7, 9, 10, 9). ) un (7, 6, 9, 7, 8, 7, 10, 10) attiecīgi.


Pirmkārt, mēs esam izveidojuši saraksta objektu ar kolonnu etiķetēm “students”, “marks1” un “marks3”. Pēc tam sarakstam tiek piemērota metode summa(). Funkcija ir summējusi atzīmes1 un atzīmes3 kolonnu vērtības tikai tāpēc, ka kolonna “students” nav skaitliska, tāpēc funkcija sum() nevar atrast summu kolonnas “students” vērtībām. Mēs esam saglabājuši kolonnu “marks1” un “marks3” vērtību summu kolonnā “summa”.

04. piemērs: pievienojiet Pandas datu rāmja kolonnas, kas atbilst noteiktam nosacījumam

Šajā piemērā mēs pievienosim norādīto kolonnu vērtības, ja tās atbilst norādītajam nosacījumam.


Jaunizveidotajā datu rāmī ir 5 kolonnas, t.i., “uzņēmums”, “week1_sales”, “week2_sales”, “week3_sales” un “filiāles”. Tagad pieņemsim, ka mēs nevēlamies pievienot pēdējās kolonnas vērtību, kad mēs pievienojam vai atrodam dotā datu rāmja rindu vērtību summu. Pieņemsim, ka mēs vienkārši vēlējāmies pievienot kolonnu vērtības ar vārdu “nedēļa” to etiķetēs. Var izveidot saraksta izpratni, lai noteiktu, vai vārds “nedēļa” ir vai nav kolonnas etiķetē.


Tagad mēs esam ieguvuši kolonnas, kuru etiķetēs ir vārds “nedēļa”. Mēs varam apkopot kolonnas, kurās ir vārds “nedēļa”, izmantojot funkcijā sum () argumentu axis=1.


Tādā veidā mēs varam droši apkopot datus pa kolonnām pa rindām, neiekļaujot nevēlamās kolonnas.

5. piemērs: nosakiet summu pēc datu rāmja datu grupēšanas

Mēs varam atrast arī datu rāmja kolonnu summu pēc vienas vai vairāku kolonnu datu grupēšanas. Metode groupby() tiks izmantota, lai grupētu datus kategorijās kolonnā. Izveidosim datu rāmi, lai varētu grupēt vienas tās kolonnas datus.


Tagad mēs sagrupēsim datus kolonnā “vecums” un summēsim ailes “score1” un “score2” vērtības katrai grupas kategorijai.


Var redzēt, ka, summējot datus datu rāmī pēc datu vērtību pirmās grupēšanas pēc vecuma, atkarībā no vecuma grupām tiek iegūta summa pa kolonnām.

Secinājums

Šajā apmācībā mēs mēģinājām jums iemācīt, kā aprēķināt datu kadru summu, izmantojot Pandas summas metodi. Mēs esam apsprieduši vērtību pievienošanu pa rindām un kolonnām šīs ziņas piemēros. Turklāt jūs uzzinājāt, kā nosacīti pievienot kolonnas un kā summēt vērtības pēc datu rāmja kolonnas grupēšanas. Tagad jūs, iespējams, varēsit summēt datu rāmja kolonnas kopā vai pats summēt vērtības datu rāmja kolonnā.