XLSX uz CSV programmā Python

Xlsx Uz Csv Programma Python



Pēdējos gados Python ir kļuvusi par vienu no dominējošajām programmēšanas valodām. Python kopiena ir ievērojami paplašinājusies Python popularitātes un lietderības rezultātā. Šajā rakstā mēs detalizēti aplūkosim, kā izmantot Python, lai pārveidotu XLSX par CSV. Mēs apzināmies, ka Excel faili bieži tiek izmantoti finanšu analīzes veikšanai, datu kārtošanai, datu ievadīšanai, uzskaitei, datu pārvaldībai, diagrammu un grafiku veidošanai utt. Tomēr datu importēšanai un eksportēšanai mēs galvenokārt dodam priekšroku CSV failiem. Viena no metodēm ir strukturēto datu pārsūtīšana, izmantojot vienkārša teksta failu.

Kas ir Xslx fails?

Veidojot izklājlapas jaunākajās Excel versijās, Microsoft kā noklusējuma faila tipu izmanto XLSX failu. Līdzīgi kā Word DOCX faila tipam, mēs varam atvērt XLSX failus, izmantojot dažādas lietojumprogrammas/programmas.

Kas ir CSV fails?

CSV faila formāts ir tas, ko mēs varam izmantot, lai saglabātu tabulas datu vērtības izklājlapās un datu bāzēs. Tabulas dati, teksts vai teksts, tiek saglabāti kā vienkāršs teksts CSV failā. Ieraksts CSV failā ir datu vērtība, kas saglabāta katrā faila rindā. Katram ierakstam var būt vairāk nekā viens lauks, kas ir atdalīts ar komatiem.







Galvenās atšķirības starp XLSX un CSV failiem

Lietotāji bieži izmanto CSV un XLSX aizstājamus, un viņi parasti nezina, kādas ir atšķirības starp tiem, kādas ir to pamatīpašības un kā tie darbojas. Tas kalpo tikai kā informācijas avots lietotājam. Gandrīz katrs uzņēmums un korporācija izmanto abus, lai palīdzētu lietotājiem pārvaldīt, atjaunināt un uzglabāt lietotāja datus. Tālāk ir norādītas dažas galvenās atšķirības starp XLSX un CSV failiem, kas jums jāzina.



  • CSV formātā tabulas dati tiek saglabāti norobežojošā teksta failā ar paplašinājumu .csv. Tā kā Excel vai XLSX fails ir izklājlapa, kurā faili tiek glabāti tā patentētajā formātā, proti. xls vai XLSX.
  • Excel faili ir bināri faili, kas satur datus katrā darbgrāmatas darblapā. Savukārt CSV ir vienkāršs un vienkāršs teksta formāts ar datu vērtību secību, kas atdalīta ar komatiem.
  • Datu darbības nevar veikt ar CSV failiem. Tomēr tos var veikt Excel failos.
  • CSV faili ir ātrāki un izmanto mazāk atmiņas nekā XLSX faili. Tomēr, importējot datus, programma Excel izmanto vairāk atmiņas.
  • Ja salīdzinām CSV ar Excel, mēs varam atvērt CSV failus jebkurā Windows teksta redaktorā, savukārt Excel failus nevar atvērt.

Kā XLSX failu var pārveidot par CSV, izmantojot Python?

XLSX failu var pārveidot par CSV failu programmā Python, izmantojot dažādas metodes. Python ietver dažādus moduļus un funkcijas, kas var mums palīdzēt veikt šo uzdevumu. Šeit mēs apskatīsim dažas metodes, kuras var izmantot, lai Python XLSX failus pārveidotu par CSV failiem.



Priekšnosacījumi, lai veiktu Excel uz CSV konvertēšanu

Prasību instalēšana ir pirmais solis. Šajā apmācībā mēs izmantojam tādus moduļus kā Pandas, CSV un Openpyxl utt. Python Pandas pakotne ļauj manipulēt un analizēt datus. Pandas ir labi pazīstama bibliotēka Python programmētāju vidū. Excel failus var lasīt un rakstīt, izmantojot Python pakotni, kas pazīstama kā Openpyxl. Mēs ar šo bibliotēku tieši nesadarbosimies. Tā vietā Pandas iekšēji izmanto Openpyxl.





Izmantojot PyPI repozitoriju, mēs varam instalēt abas pakotnes:

1. metode: XLSX konvertēšana uz CSV, izmantojot Pandas moduli

1. piemērs: viena XLSX faila konvertēšana uz CSV



Pandas ir atvērtā koda modulis, kas izveidots Python programmēšanas valodai, lai manipulētu un analizētu datus. Lai strādātu ar laika rindām un skaitliskām tabulām, Pandas nodrošina dažādas funkcionalitātes un funkcijas. Izmantojot pandas, var nolasīt, filtrēt un pārkārtot gan mazas, gan lielas datu kopas. Un rezultātus var iegūt dažādos formātos, piemēram, Excel, JSON un CSV. Mēs izmantojam Pandas metodi read_excel(), lai lasītu Excel failu, un metodi to_csv(), lai pārveidotu DataFrame par CSV failu.

Mēs izdrukājam savu .csv failu kā DataFrame, kā redzams izvadē. Iepriekšējais skripts pārvērš mūsu XLSX failu CSV formātā un izveido failu “salary.csv” pašreizējā direktorijā.

2. piemērs: XLSX faila (ar vairākām lapām) konvertēšana uz CSV

Nākamajā piemērā mēs vispirms nolasām Excel faila lapu nosaukumus. Pēc tam atsevišķu lapu nosaukumi tiek cilāti un saglabāti kā atsevišķi CSV faili. Skripts saglabā CSV failus tajā pašā vietā.

Mēs izmantojam XLSX faila paraugu, kurā ir divas vai vairākas darblapas vai izklājlapas.

Kā redzams, mūsu XLSX fails sastāv no divām lapām (1. lapa un 2. lapa). Tagad mēs rakstām kodu, lai pārveidotu šo XLSX failu par CSV.

Izvade:

Skripts veiksmīgi konvertēja XLSX failu ar divām lapām vienā CSV failā ar vienu lapu.

3. piemērs: vairāku XLSX failu konvertēšana atsevišķos CSV failos

Apsveriet scenāriju, kurā vairāki Excel faili savā darba direktorijā ir jāpārvērš CSV formātā. Jūs varētu izmantot šo metodi. Mēs sākam, pieņemot, ka katrā failā ir tikai viena lapa. Pēc tam mēs paplašinām savu metodi, lai apstrādātu vairākus failus un vairākas lapas. Nākamais Python kods izmanto glob standarta moduli. Mēs saskaņojam failu ceļus, izmantojot modeļus ar Glob. Tas atbilst visiem failiem ar paplašinājumu .xlsx darba direktorijā. Pēc tam mēs izstrādājam funkciju, kas nolasa Excel failus un saglabā tos kā CSV failus. Mēs izsaucam šo funkciju katrā atrastā faila ceļā.

Šis iepriekšējais skripts pārvērš visus xlsx failus pašreizējā direktorijā CSV failos.

Tagad mēs pārveidojam XLSX failus ar vairākām izklājlapām CSV formātā. Šī, visticamāk, ir grūtākā daļa. Trīs Excel faili atrodas mūsu darba direktorijā. Turklāt daži no tiem sastāv no vairāk nekā vienas lapas. Mūsu mērķis ir:

  1. Izveidojiet direktoriju katram izklājlapas failam,
  2. Pārvērtiet Excel failu lapas uz CSV, un tās jāglabā jaunizveidotajā direktorijā.

Skripts pārvērš XLSX ar vienu un vairākām lapām atsevišķos CSV failos un saglabā tos jaunos direktorijos ar tādu pašu nosaukumu.

Lai izgūtu katru Excel failu, kas atrodas pašreizējā direktorijā, tiek izmantota funkcija glob. Pēc tam katram XLSX failam tiek izveidotas mapes, izmantojot funkciju os.mkdir. Pēc tam katrai lapai jaunajā direktorijā tiek izveidots CSV fails, pārvelkot lapas nosaukumu.

2. metode: XLSX konvertēšana uz CSV, izmantojot Openpyxl un CSV moduļus

Šajā metodē mēs izmantosim openpyxl un CSV moduļus, lai pārveidotu XLSX failus CSV formātā. Lai lasītu un rakstītu 2010 xlsx, xlsm, xltx un xltm failus, var izmantot Python moduli openpyxl. CSV modulis ietver klases, kas ļauj lasīt un rakstīt CSV formāta tabulas datus.

Lai lasītu vai ielādētu mūsu xlsx failu, mēs izmantojam openpyxl moduļa funkciju load_workbook(). Varat izmantot šo funkciju, ja jums ir jāraksta vai jālasa esošs XLSX/Excel fails programmā Python. Pēc Excel aktivizēšanas mēs izmantojam funkciju csv.writer(), lai izveidotu CSV failu. Pēc tam tiek izmantota cilpa, lai saglabātu datus CSV faila datu šūnās. Mēs pārveidojam failu example.xlsx par manu failu.csv, kā redzams šajā attēlā:

Secinājums

Šajā apmācībā mēs sniedzām jums īsu ievadu par XLSX failiem un CSV failiem. Mēs izskaidrojām galvenās atšķirības starp abiem failu formātiem. Mēs apspriedām divas metodes ar vairākiem piemēriem, lai mācītu, kā XLSX failus ar vienu vai vairākām lapām var pārvērst CSV failos. Mēs ieviesām piemēru, lai vienlaikus pārvērstu vairākus XLSX failus CSV failos. Datu konvertēšana no Excel uz CSV var būt vienkārša vai sarežģīta. Ja jums ir tikai viens fails ar nelielu skaitu lokšņu, tas ir vienkārši. Bet, ja nē, tas var būt grūti.