Pandas Qcut

Pandas Qcut



'Python' satur daudzas bibliotēkas, un, ja mēs vēlamies analizēt vai manipulēt ar datiem, mēs izmantojam šīs 'Python' bibliotēkas, un 'pandas' ir arī tās bibliotēka. “Pandu” bibliotēka tiek izmantota datu zinātņu jomā, kā arī tā tiek izmantota mašīnmācīšanās aktivitātēs. “Pandas” DataFrame palīdz mums saglabāt datus. “Pandās”, kad vēlamies datu sadalīšanu, mēs izmantojam “qcut()” metodi. Metode “qcut()” tiek izmantota, lai nepārtrauktas funkcijas pārveidotu par kategoriskām. Šajā “qcut()” metodē mēs varam pievienot dažāda veida parametrus, lai iegūtu dažāda veida rezultātus. Šī apmācība ir par “qcut()” metodi, un mēs šeit pilnībā izskaidrosim “qcut()” metodi. Šajā apmācībā mēs jums paskaidrosim, kā mēs veicam datu sadalīšanu, izmantojot funkciju “qcut()” “pandas”.

Piemērs # 01

Šajos kodos mēs izmantosim metodi “qcut()”, un mēs tos izmantosim lietotnē “Spyder”. Kad mums ir jāstrādā ar “pandām”, mēs varam piekļūt tās funkcijām tikai tad, kad savos kodos importējam “pandu” bibliotēku. Vispirms mēs ievietojam “import” un pēc tam rakstām “pandas kā pd”. Tagad mums ir jāpiemēro “qcut()” metode, tāpēc mēs šeit izveidojam DataFrame. Mēs veidojam “Random_df”, kas satur “R_ID, R_name un R_age” kā kolonnas, un arī “R_ID” ievietojam “R_17, R_21, R_24, R_29, R_31, R_34, R_44, R_46, R_50, R_51, R_55, R_61, R_73 un R_81”. Pēc tam kolonnā “R_name” pievienojam “Teodors, Tedijs, Noa, Leo, Aivija, Henrijs, Fredijs, Evelīna, Ava, Vītols, Teo, Oskars, Džeikobs un Hārpere”. Pēc tam ailē “R_age” ievietojam “21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 un 40”. Tagad mēs izmantojam “print(), kas satur “Random_df”, un tas palīdzēs renderēt “Random_df” DataFrame. Mēs tikko esam izveidojuši DataFrame un vēl neizmantojam metodi “qcut()”.








Ikona “Palaist” palīdz mums izpildīt kodus. Nospiežot šo ikonu “Palaist”, šī koda rezultāts tiek parādīts lietotnes “Spyder” terminālī. “Random_df” DataFarme tiek parādīts kā koda rezultāts, kuru esam uzrakstījuši šajā piemērā. Tagad mēs izmantosim metodi “qcut ()” un parādīsim arī tās rezultātu.




Mēs šeit apkopojam datus. Mēs saistām kolonnu “R_age” un ievietojam metodi “pd.qcut()”, kas ir “pandas” metode, kas palīdz datu grupēšanā. Šajā metodē mēs ievietojam DataFrame nosaukumu un arī kolonnas nosaukumu, kurā vēlamies lietot šo “qcut()” metodi. Mēs arī iestatījām “q” vērtību uz “5”, un to izmanto kolonnas “R_age” datu sadalīšanai piecās vienādās kvantilēs. Mēs pievienojam metodi “qcut()” laukā “print ()”, tāpēc tā arī parādīs binning datus terminālī.




Šeit tiek parādīti dati pēc binning, un tas sagriež “R_age” piecās kvantilēs. Tajā tiek parādītas arī kategorijas, kurās ir iekļauti kolonnas “R_age” dati. Kategoriskā sērija ir “R_age” tvertnes.






Mēs varam arī pielāgot šīm tvertnēm etiķeti. Mēs pievienojam šīs tvertņu etiķetes, lai tās būtu viegli interpretējamas. Mēs pievienojam kolonnu “R_age_qcut” “Random_df”, kurā pievienojam šo tvertņu etiķetes. Mēs atkal izmantojam “pd.qcut()” metodi to marķēšanai. Mēs pievienojam tam etiķetes, kas ir “maz, ne tik maz, viduvējas, augstas un visaugstākās”. Pēc tam mēs atkal ievietojam “Random_df” laukā “print ()”.


Visas tvertnes ir marķētas un parādītas šajā iznākumā. Sleja “R_age_qcut” tiek parādīta šajā DataFrame, kurā tiek parādītas marķētās tvertnes.



Piemērs # 02

Lai izveidotu DataFrame, mēs vispirms pievienojam “atzīmes”, kas ir “3, 6, 8, 7, 2, 5, 1, 9, 4, 7 un 8”. Pēc tam mēs pievienojam studentu vārdus “studentiem”, kas ir “Pīters, Bromlijs, Džeimss, Deivids, sabiedrotie, Džons, Džeimss, Samuels, Viljams, Hovards un Aleksandrs”. Pēc tam mēs ģenerējam “Grades_df”, kurā esam pievienojuši metodi “pd.DataFrame()”, un šajā metodē mēs ievietojam “Std_name”, kas parādīsies kā kolonnas nosaukums, un piešķiram tam “students” vērtības. Pēc tam mēs iestatām “Students_grades” kā DataFrame kolonnas nosaukumu un arī šeit piešķiram “atzīmes”, ko esam izveidojuši iepriekš. Pēc tam mums ir “print ()”, kurā drukāšanai pievienojam “Grades_df”.


Šī koda rezultātā tiek parādīts DataFrame, kurā ir divas kolonnas. Tagad mēs izmantosim metodi “qcut()” kolonnai “Students_grades”, lai grupētu šīs kolonnas vērtību datus.


Mēs pievienojam jaunu kolonnu “grade”, kurā kolonnai “Students_grades” esam lietojuši “pd.qcut()”, kā arī “q” vērtībai esam izmantojuši “4”, tāpēc tā tiks izgriezta. datus četrās vienādās kvantilēs. Pēc tam mēs šeit norādām šīs kvantiles, ievietojot vērtības “q”, kas ir “0, .4, .8 un 1”. Pēc tam mēs arī to parādām. Tagad mēs apzīmējam šos apvienotos datus, un šeit pievienotās iezīmes ir “D, C, A un B”, un tās arī tiek saglabātas kolonnā “Novērtējums”.


Šeit dati pēc binēšanas tiek parādīti kolonnā “Novērtējums”, un kolonnas “Students_grades” dati tiek sagriezti četrās vienādās kvantilēs.


Šajā iznākumā tiek parādīts DataFrame, ko iegūstam pēc metodes “qcut()” piemērošanas un kvantiļu norādīšanas.


Tagad pēc etiķešu pievienošanas šīm tvertnēm tiek atveidotas arī šajā iznākumā kolonnā “Novērtējums”, un jūs varat redzēt, ka tas piešķir etiķetes atbilstoši tvertnes vērtībām.

Piemērs # 03

CSV faila datiem varam izmantot arī metodi “qcut()”. Šim nolūkam mēs vispirms nolasām CSV faila datus, izmantojot metodi “read_csv()”. Mēs nolasām faila “office2.csv” datus, un pēc tam šī faila dati tiek ievietoti “Office_df”. Šī metode konvertēs “office2” faila datus DataFrame un saglabās to “Office_df”. Pēc tam mēs arī parādām šos datus, ievietojot “Office_df” laukā “print ()”. Pēc tam mēs pievienojam jaunu kolonnu ar nosaukumu “Units_qcut”, kurai kolonnai “Units” izmantojam funkciju “pd.qcut()”.

Turklāt mēs iestatām mainīgā “q” vērtību uz “5”, kas sadalīs datus piecās vienādās kvantilēs. Dati pēc sagriešanas 5 vienādās kvantilēs tiek saglabāti kolonnā “Units_qcut”, un šī kolonna tiek pievienota arī “Office_df” un “Office_df” šeit atkal tiek renderēta, izmantojot “print()”. Mēs tagad apzīmējam šos saliktos datus, pievienojot etiķetes ar metodi “qcut()”, kas ir “1. vienība, 2. vienība, 3. vienība, 4. vienība un 5. vienība”, un saglabājam tās arī slejā “Labels”. . Mēs arī renderējam šo datu rāmi, kuram ir pievienota sleja “Labels”.


Dati, ko iegūstam pēc faila “office2.csv” lasīšanas, tiek atveidoti DataFrame formā. Pēc tam tiek pievienota kolonna “Units_qcut”, kurā tiek parādītas kolonnas “Units” saliktās vērtības. Pēc tam tiek pievienota arī sleja “Labels”, kas piešķir etiķetes šīm apvienotajām vērtībām. Tas viss tiek darīts, izmantojot “qcut()” metodi “pandas”.

Secinājums

Šajā apmācībā mēs esam sīki izskaidrojuši metodi “qcut()”, kas palīdz grupēt datus “pandās”. Mēs esam apsprieduši, ka dati tiek apvienoti saskaņā ar kvantiles “q” vērtību, ko esam pievienojuši “qcut()” metodē, kā arī esam pielāgojuši etiķetes šiem atdalītajiem datiem. Mēs esam izpētījuši metodi “qcut()” un izmantojuši šo metodi DataFrame kolonnām, kā arī esam izmantojuši šo “qcut()” metodi CSV faila datiem pēc CSV failu nolasīšanas. Mēs esam iesnieguši visu šajā apmācībā esošo kodu iznākumu, lai skaidri izskaidrotu un parādītu metodes “qcut ()” rezultātu.