Pandas standarta novirze

Pandas Standarta Novirze



“Pandas” ir lieliska valoda datu analīzes veikšanai, jo tai ir lieliska uz datiem orientētu python pakotņu ekosistēma. Tas atvieglo abu faktoru analīzi un importēšanu. Standarta novirze ir “tipiska” novirze, kas iegūta no vidējā. To izmanto daudz, jo tas atgriež sākotnējās datu rāmja mērvienības. Pandas izmantoja std() standarta novirzes aprēķināšanai. Standartnovirzi var aprēķināt no dotajām vērtībām, kuras var atrasties datu rāmī rindas vai kolonnas veidā. Mēs ieviesīsim visus iespējamos pandas standarta novirzes izmantošanas veidus. Koda ieviešanai izmantosim rīku “spyder”, kā tas ir rakstīts pitonam draudzīgā vidē.”

Sintakse







“df.std ( )


Datu rāmja standarta novirzes aprēķināšanai tiek izmantota šāda sintakse. “df” datu ietvarā ir “data rāmja” saīsinājums. Ko dara standarta novirze? Tas mēra, cik paplašināti ir nepieciešamie dati. Jo vairāk paplašinātas augstās vērtības, jo lielākai jābūt standarta novirzei.



Atgriezties

Pandas standarta novirze atgriež datu rāmi, ja līmenis ir norādīts, pamatojoties uz prasību.



Ņemiet vērā, ka funkcija “std()” automātiski ignorēs “NaN” vērtības “df”, aprēķinot pandas standarta novirzi. “NaN” var izskaidrot kā “nav skaitlis”, kas nozīmē, ka konkrētajam nav piešķirta vērtība.





Tālāk ir norādītas metodes, kas tiks izpildītas ar pandu standarta novirzes piemēriem:

    • Pandas standartnovirzes aprēķins vienā kolonnā.
    • Pandas standarta novirzes aprēķins vairākās kolonnās.
    • Pandas standartnovirzes aprēķins visām ciparu kolonnām.
    • pandas standarta novirze, izmantojot asi = 1.
    • pandas standarta novirze, izmantojot asi = 0.

Datu rāmja izveide Pandas standarta novirzes aprēķināšanai

Vispirms atveriet 'spyder' programmatūru. Tagad importējiet pandas bibliotēku kā pd. Mēs izveidosim datu rāmi, kas sastāv no rezultātu tabulas ar vārdiem “x”, “y” un “z” ar punktiem “22”, “10”, “11”, “16”, “12”, “45”. ”, “36” un “40”. Mūsu piespēļu vērtības ir “8”, “9”, “13”, “7”, “22”, “24”, “4” un “6”, turklāt atlēkušo bumbu vērtība ir “17”, “ 14”, “3”, “5”, “9”, “8”, “7” un “4”.




Displeji parāda izveidoto datu rāmi atbilstoši kodā piešķirtajām vērtībām:

01. piemērs: Pandas standarta novirzes aprēķins vienā kolonnā

Šajā piemērā mēs aprēķināsim vienas kolonnas standarta novirzi pandu datu ietvarā. Datu ietvarā ir komandas vērtības 'u', 'v' un 'b' ar punktiem '44', '33', '22', '44', '45', '88', '96'. ” un “78”. Piespēļu vērtības ir “7”, “8”, “9”, “10”, “11”, “14”, “18” un “17”, turklāt atlēkušo bumbu vērtības ir “11”, “ 9”, “8”, “7”, “6”, “5”, “4” un “3”. Kolonna “punkti” tiek atlasīta no datu rāmja, lai aprēķinātu vienas kolonnas standarta novirzi.


Izvade parāda standarta novirzi, kas aprēķināta kolonnai “punkti”:

02. piemērs: Pandas standarta novirzes aprēķins vairākās kolonnās

Šajā piemērā mēs izpildīsim pandu standarta novirzes aprēķinus vairākās kolonnās. Šajā datu rāmī dati atkal ir sporta tablo, kurā komandas vērtības ir “n”, “w” un “t” ar rezultātu “33”, “22”, “66”, “55”, “44”, “88”, “99” un “77”. Piespēles kā '9', '7', '8', '11', '16', '14', '12' un '13' un atlēkušās bumbas kā '5', '8', '1', ' 2”, “3”, “4”, “6” un “7”. Šeit mēs aprēķināsim divu kolonnu “punkti” un “atlēkušās bumbas” standarta novirzi, izmantojot funkciju std (), kas tiek lietota datu kadram.


Kā redzam, izvade parāda standarta novirzi attiecīgi 26.944387 punktu kolonnā un 2.449490 atsitiena kolonnā.

03. piemērs: Pandas standarta novirzes aprēķins visām ciparu kolonnām

Tagad mēs esam iemācījušies, kā aprēķināt vienas un vairāku rindu standarta novirzi. Ko darīt, ja mēs nevēlamies norādīt visus kolonnu nosaukumus datu ietvarā un aprēķināt visu datu ietvaru? Tas ir iespējams, vienkārši ieviešot pandas standarta novirzes funkciju, lai rezultātos aprēķinātu visu datu kadru. Datu rāmis šeit sastāv no “l”, “m” un “o” ar punktu vērtībām “33”, “36”, “79”, “78”, “58”, “55”, un divas komandas iegūst vienādu punktu skaitu. tas ir '25'. Piespēles ir “1”, “2”, “3”, “4”, “6”, “9”, “5” un “7”, un to atlēkušās bumbas ir “14”, “10”, “2”. , “5”, “8”, “3”, “6” un “9”. Mēs varam aprēķināt visas standarta kolonnu novirzes pēc pandām datu rāmī, izmantojot pandas “std()” funkciju.


Displejā ir aprēķinātā standarta novirze no visa tālāk norādītā “df”; varam arī pamanīt, ka pandas nav aprēķinājušas standarta novirzi pirmajai kolonnai, kas ir “komanda”, jo tā nav skaitliska kolonna.

04. piemērs: Pandas standarta novirze, izmantojot asi = 0

Šajā piemērā datu rāmjos ir sporta veidu komandas “g”, “h” un “k” ar papildu datiem. Šeit mēs aprēķināsim standarta novirzi, izmantojot asi kā “0”, parametru, ko izmanto pandu standarta novirzē. Šis arguments aprēķina datu rāmja standarta novirzi katrā kolonnā.


Nākamajā izvadē rezultāti tiek parādīti aprēķinātās standartnovirzes kolonnās. Punktu kolonnā aprēķinātā standartnovirze ir “24,0313062”, rezultatīvo piespēļu kolonnā aprēķinātā standarta novirze ir “2,669270”, un atsitiena kolonnas aprēķinātā standartnovirze ir parādīta kā “3,943802”.

05. piemērs: Pandas standarta novirze, izmantojot asi = 1

Šeit mēs izmantosim ass parametru, kas piešķirts kā “1”, lai aprēķinātu pandu standarta novirzi. Kāda ir atšķirība “1” ass? Arguments “1” ass aprēķina datu rāmja skaitlisko vērtību standarta novirzi pa rindām. Datu ietvarā ir trīs komandas kā “s”, “d” un “e”, pievienojot datu kolonnas, kas izveidotas kā komandas punkti, komandas piespēles un komandas atlēkušās bumbas. Visiem virzieniem datu rāmī tiek piešķirtas dažādas vērtības. Šis ass parametrs ir tāds spēles mainītājs, jo līdz tam laikam mums ir jāstrādā pie datiem, kur mēs vēlamies, lai tie būtu kolonnā plus punkts, kas aprēķināts pēc veiktās standarta novirzes.


Šī izvade parāda standarta novirzi, kas aprēķināta datu rāmja rindā:

Secinājums

Pandas standarta novirze ir ļoti tehniska funkcija, kas ir ļoti izdevīga funkcija, jo tā nosaka pandu datu rāmju entuziasma pakta standartnovirzi. Šajā ievadrakstā mēs esam pētījuši pandu standarta novirzes aprēķināšanas metodes. Mēs esam veikuši vienas kolonnas aprēķinus standarta novirzei un vairākām kolonnām, kā arī kopā aprēķinājām visa datu rāmja standarta novirzi. Visas stratēģijas darbojas labi, ja vien tās tiek izmantotas konsekventi un dod vēlamos rezultātus.