Pandas Lasīt teksta failu

Pandas Lasit Teksta Failu



“Izmantojot “pandas”, mēs varam viegli izlasīt teksta failu, izmantojot “pandas” metodi. “Pandas” sniedz mums iespēju lasīt teksta failu. “Pandas” piedāvā dažādas iebūvētas metodes teksta faila lasīšanai. Mēs apspriedīsim visas metodes šajā apmācībā, kā arī visus šeit esošos parametrus un detalizēti izskaidrosim tos. Mēs arī lasīsim teksta failu “pandas”, izmantojot “pandas” metodes mūsu kodos šeit.

Metodes teksta faila lasīšanai “pandas”

“Pandās” mums ir trīs metodes, kas palīdz mums lasīt teksta failu. Šeit mēs esam izdarījuši arī dažus piemērus, kuros lasām teksta failu. Metodes, ko piedāvā “pandas”, ir aplūkotas tālāk:







    • Izmantojot pd.read_csv() metodi.
    • Izmantojot pd.read_table() metodi.
    • Izmantojot pd.read_fwf() metodi.

Tagad mēs šajā apmācībā izskaidrojam visu šo metožu sintaksi un arī detalizēti apspriežam visu metožu parametrus.



Read_csv() sintakse



pd.read_csv ( “faila nosaukums.txt”, sept ='''', galvene = Nav, vārdus = [ Kolonnas_nosaukums1, Kolonnas_nosaukums2, Kolonnas_nosaukums2, ………….. ] )


Šajā metodē mēs vispirms pievienojam teksta faila nosaukumu, kura datus vēlamies nolasīt, un tas ir šīs metodes pirmais parametrs. Pēc tam mēs ievietojam “sep”, kas šajā metodē ir atdalītājs, un kā rakstzīmi ievietojam atstarpi, lai tā uzskatītu atstarpi par atdalītāju. Pēc tam mums ir galvenes parametrs, un tiek izmantota šī parametra vērtība “Nav”, tāpēc tiks izveidota noklusējuma galveni, un, ja mēs nepievienosim šo parametru, tiks ņemta vērā teksta faila pirmā rindiņa. kā galveni. Parametrā “nosaukumi” mēs varam pievienot kolonnu nosaukumus, kas mums jāpievieno kā galvene.





Read_table() sintakse

pd.read_table ( 'faila nosaukums.txt' , norobežotājs = '' )


Šajā metodē kā pirmo parametru ievietojam teksta faila faila nosaukumu. Atdalītājā ievietojot “ ”, kā atdalītāju tiks izmantota atstarpes rakstzīme.



Read_fwf() sintakse

pd.read_fwf ( 'faila nosaukums.txt' )


Šī metode aizņem tikai vienu parametru, kas ir teksta faila nosaukums.

Tagad mēs izmantosim šīs metodes, lai lasītu teksta failus “pandas” kodos un parādītu teksta faila datus terminālī.

Piemērs # 01

Šeit ir lietotne 'Spyder', kurā mēs esam veikuši visus šos kodus, kas ir parādīti šajā apmācībā. Teksta fails, kura datus mēs vēlamies lasīt, ir parādīts zemāk. Mēs izmantosim metodi “read_csv()”, lai lasītu šo teksta failu “pandas”.


Vispirms mēs importējam “pandas” bibliotēku, jo vēlamies izmantot “read_csv()” metodi, un tā ir “pandas” metode. Mēs piekļūstam šai metodei tikai tad, kad esam importējuši “pandu” bibliotēku. Šeit mēs pieminam “pandas kā pd”, tāpēc šis “pd” tiek ievietots kopā ar tā izmantošanas metodes nosaukumu. Pēc tam šeit izveidojam mainīgo “df”, kas tiek izmantots teksta faila datu glabāšanai pēc lasīšanas. Šeit mēs ievietojam metodi “pd.read_csv()”, kas palīdz nolasīt teksta failu un konvertēt teksta faila datus DataFrame un saglabāt to mainīgajā “df”.

Šeit mēs esam nodevuši faila nosaukumu, kas ir “myData.txt”, un pēc tam mēs izmantojam “sep” un šim “sep” piešķiram tukšo rakstzīmi. Tātad šī tukšā rakstzīme darbojas kā atdalītājs teksta failā. Pēc tam mēs izmantojām zemāk esošo “print ()”, ko izmanto teksta faila datu drukāšanai. Tas parādīs teksta faila datus DataFrame formā.


Lai izpildītu šo kodu, mums ir jānospiež “Shift+Enter”, un izvade tiks atveidota terminālī “Spyder’s”. Iepriekš minētā koda rezultāts tiek parādīts dotajā ekrānuzņēmumā, un jūs varat redzēt, ka teksta faila dati tiek parādīti kā DataFrame, un mūsu teksta faila pirmā rindiņa šeit tiek parādīta kā šī DataFrame kolonnu nosaukumi. Tas arī atdala datus, kur teksta failā ir atstarpes rakstzīme.

Piemērs # 02

Šeit ir parādīts teksta fails, kuru mēs lasīsim šajā piemērā, un mēs atkal izmantosim metodi “read_csv()”, bet ar citiem parametriem.


Tiek izmantota “pandas” metode “pd.read_csv()”, un šeit mēs nododam trīs parametrus. Pirmkārt, mēs ievietojam faila nosaukumu, kas ir “Record.txt”. Otrais parametrs ir “sep” parametrs un piešķir tam tukšo rakstzīmi, un tad mums ir trešais parametrs, kurā mēs iestatām “galveni” un pielāgojam to uz “Nav”, tāpēc tas izveidos DataFrame noklusējuma galveni. kad mēs izpildām šo kodu. To visu esam saglabājuši mainīgajā “My_Record” un drukāšanai funkcijā “print()” pievienojuši arī “My_Record”.


Visi dati tiek saglabāti DataFrame, un tas atdala datus, kur teksta faila datos ir atstarpes rakstzīme. Šeit arī tika izveidota DataFrame noklusējuma galveni, jo mēs noregulējām parametru “header” uz “Nav”.

Piemērs # 03

Tiek parādīts šī piemēra teksta fails, un mēs atkal izmantosim metodi “read_csv()” ar modificētiem parametriem.


Šajā kodā četri parametri šeit tiek nodoti “pandas” metodei “pd.read_csv()”. Teksta faila nosaukums ir pirmais parametrs. Parametram “sep” otrajā parametrā tiek dota tukša rakstzīme. Parametrs “header” ir iestatīts uz “Nav” trešajā argumentā, un kā ceturtais parametrs esam iestatījuši “names”, kas pēc teksta faila lasīšanas parādīsies kā DataFrame kolonnu nosaukumi, un šie kolonnu nosaukumi ir “COL_1, COL_2, COL_3, COL_4 un COL_5”. Visa šī informācija ir saglabāta mainīgajā “My_Record”, un “My_Record” ir pievienota arī metodei “print()”, lai tā tiktu drukāta terminālī.


Visa teksta faila informācija šeit tiek atveidota kā DataFrame, kā arī atdala datus, kur teksta failā ir pievienotas atstarpes. Tas arī attiecīgi pievieno kolonnu nosaukumus, kurus esam pievienojuši iepriekš kodā.

Piemērs # 04

Šis ir teksta fails, ko mēs lasīsim šajā piemērā, izmantojot citu metodi — metodi “pd.read_table()”.


Šeit ir pievienota metode “pd.read_table()”, lai lasītu teksta failu, un mēs pievienojam “ABC.txt”, kas ir teksta faila nosaukums. Šī metode palīdz nolasīt teksta failu, kā arī mēs esam pielāgojuši parametru “atdalītājs” atstarpes rakstzīmei, tāpēc tā darbosies arī tāpat kā iepriekš paskaidrotais atdalītājs. Pēc tam visi teksta faila dati tiek saglabāti mainīgajā “My_Data” un arī šeit izdrukāti.


Mūsu teksta faila sākotnējā rinda šeit tiek parādīta kā DataFrame kolonnu nosaukumi, un teksta faila dati tiek drukāti kā DataFrame. Turklāt tas atdala teksta faila datus, kur tajā atrodas atstarpes rakstzīme.

Piemērs # 05

Tagad teksta failā ir dati, kas tiek parādīti zemāk. Šoreiz mēs izmantosim “read_fwf()” un parādīsim, kā tas atveido datus pēc teksta faila lasīšanas.


Kā mēs zinām, šī “read_fwf()” metode aizņem tikai vienu parametru, kas ir faila nosaukums, kuru mēs vēlamies lasīt. Mēs šeit pievienojam “textfile.txt”, kas ir mūsu teksta faila nosaukums, un piešķiram šo pandas metodi mainīgajam “File_Data”, kurā tiks saglabāti šī teksta faila dati. Tad mēs ievietojam “print(File_Data)”, lai tas arī izdrukātu šos datus.


Šeit tiek parādīti visi teksta faila dati. Tas neatdalīja datus, kur ir atstarpes rakstzīmes, jo šajā funkcijā nav tādu parametru kā “Sep” vai “delimiter”.

Secinājums

Šajā apmācībā ir paskaidrots, kā lasīt teksta failu “pandas” un kādas metodes tiek izmantotas teksta faila lasīšanai “pandās”. Mēs esam apsprieduši visas metodes, kas mums palīdz lasīt teksta failu “pandas”. Šajā apmācībā esam izpētījuši trīs dažādas “pandu” metodes, kā lasīt mūsu teksta failus “pandās”. Šeit mēs arī sīki esam izskaidrojuši visu metožu sintaksi, kā arī visu metožu parametrus, un šajā apmācībā esam izlasījuši daudzus teksta failus, izmantojot dažādas metodes ar visiem iespējamiem parametriem.