iconv komanda operētājsistēmā Linux

Iconv Komanda Operetajsistema Linux



Pirms šī raksta ieviešanas noteikti atjauniniet savu Linux datoru. Atjaunināšanai izmantojiet Linux utilītu “apt” ar atslēgvārdu “update” un palaidiet šo instrukciju, izmantojot “sudo” privilēģijas. Lai gan tagad varam pāriet uz ieviešanu, mēs vēlētos jaunināt arī šo sistēmu, t.i., jaunināšana samazinātu kļūdu rašanās iespēju, un sistēma spētu precīzāk atrisināt problēmas. Tāpēc izmantojiet utilītu “apt” instrukcijā “upgrade”.

Tagad apskatīsim Linux utilītu iconv tās termināļa konsolē. Tātad, mēs esam izpildījuši instrukciju “iconv” ar karogu “-l”, lai mūsu termināļa ekrānā parādītu visas zināmās un visbiežāk izmantotās kodētās rakstzīmju kopas. Tas parādīs kodētās rakstzīmju kopas kopā ar to aizstājvārdiem. Mazliet ritinot uz leju, varat redzēt garu kodēto rakstzīmju kopu sarakstu.







Tagad ir pienācis laiks sākt ar komandas iconv ieviešanu operētājsistēmā Linux. Pirmkārt, mums mūsu sistēmā ir nepieciešami dažāda veida faili, lai pārveidotu viena veida failus cita veida failos. Tādējādi mēs izmantojam “pieskāriena” vaicājumu konsoles terminālī, lai izveidotu trīs dažādus failus, t.i., Java tipa, C tipa un teksta veida. Uzskaitot pašreizējo direktoriju saturu, tajā atradīsit jaunizveidotos failus.



Pēc tam mēs apskatīsim katra faila veidu atsevišķi, izmantojot vaicājumu “fails”, kā arī katra faila nosaukumu. Šim vaicājumam ir nepieciešama opcija “-I”, lai katram failam atsevišķi parādītu kodēšanas rakstzīmju kopas veidu. Ja esat aizmirsis izmantot opciju “-I”, izmantojiet karodziņu “—mime”. Gan karodziņi “-I”, gan “-mime” darbojas vienādi.



Tagad, izpildot instrukciju “fails” “txt” tipa failam, mēs saņēmām “US-ASCII” rakstzīmju tipa kodējumu. Izmantojot tos pašus norādījumus Java un C failiem, tas parāda, ka abos failos ir “BINARY” rakstzīmju tipa kodējums. Līdz ar to šī instrukcija parāda, ka visi šie trīs faili ir tukši.





Tagad mēs ilustrēsim ikonas instrukcijas izmantošanu konsolē, lai konvertētu noteiktu rakstzīmju kopas kodējuma failu uz citu rakstzīmju kopas kodējumu. Pirms tam mums failiem jāpievieno kāds kods vai dati. Tāpēc esam pievienojuši Java kodu failam text.java, C kodu failam text.c un teksta datus failā test.txt. Cat vaicājums tika izmantots šeit, lai parādītu visu trīs failu saturu, kā parādīts tālāk:



Tagad, kad dati ir veiksmīgi pievienoti, mēs atkal redzēsim šo failu rakstzīmju kopas kodējumu. Tātad, mēs esam izmēģinājuši to pašu faila instrukciju apvalkā ar karogu “-I” un failu nosaukumiem, t.i., test.txt, test.java un test.c. Palaižot šos trīs norādījumus atsevišķi visiem trim failiem, tiek parādīts, ka rakstzīmju kopas kodējums ir atjaunināts Java un C failiem, bet teksta failam paliek nemainīgs, t.i., US-ASCII. Java un C failu kodējums iepriekš bija “binārs”; tagad tas ir “US-ASCII”. Tas arī parāda, ka teksta fails satur vienkāršu teksta datus, bet pārējos divos koda failos kā saturs ir skripti.

Ir pienācis laiks veikt faktisko uzdevumu, kas nepieciešams šim rakstam, t.i., konvertēt vienu kodējumu uz citu, izmantojot čaulas komandu iconv. Tādējādi mēs esam izmantojuši instrukciju “iconv” čaulas terminālī ar “sudo” privilēģijām. Šajā komandā opcija “-f” apzīmē “no”, bet opcija “-t” apzīmē “uz”, t.i., no viena kodējuma uz citu.

Pēc opcijas “-f” ir jānorāda failam jau esošais kodējums, t.i., US-ASCII. Kamēr pēc opcijas “-t”, jums ir jānorāda kodējums, kuru vēlaties aizstāt ar veco kodējumu, t.i., UNICODE. Lai izveidotu tā objekta attēlu, ir jānorāda faila nosaukums, kas tiek izmantots kā avots ar opciju –o. Objekta attēls būtu cits fails, t.i., “new.c”, tāda paša veida, bet ar jauno kodējumu un tiem pašiem datiem.

Pēc šīs instrukcijas izpildīšanas jūs saņemsiet jaunu failu tajā pašā direktorijā, t.i., saskaņā ar vaicājumu “ls”. Tagad mēs pārbaudīsim rakstzīmju kopas kodējumu jaunam failam, kas ģenerēts, izmantojot ikonu instrukciju. Mēs atkal izmantosim “faila” instrukciju ar opciju “-I” un jauno faila nosaukumu, t.i., new.c.

Jūs redzēsit, ka šī jaunā faila rakstzīmju kopa atšķiras no vecā faila rakstzīmju kopas, t.i., rakstzīmju kopas UTF-16LE. Tas ir tāpēc, ka esam pārtulkojuši US-ASCII kodējumu uz UNICODE kodējumu, izmantojot mūsu new.c faila ikonv instrukciju. Vaicājumā “kaķis” failā tika parādīts tas pats C kods, bet sākās ar dažām unikoda rakstzīmēm, kā jau parādīts.

Ļoti līdzīgā veidā mēs mainīsim teksta faila test.txt kodējumu. Faila instrukcija parāda, ka tam ir US-ASCII rakstzīmju kopas kodējums. Komanda iconv ir izmantota tādā pašā formātā, lai konvertētu faila test.txt kodējumu no US-ASCII uz TURKISH8. Jūs redzēsit, ka tas nemaina US-ASCII uz turku.

Pēc tam mēs izmantojām to pašu komandu, lai aptvertu tā paša faila rakstzīmju kopas kodējumu no US-ASCII līdz UTF-32. Šoreiz tas darbojas. Tas ir tāpēc, ka dažkārt var rasties problēmas, pārveidojot vienu kodējuma kopu citā, vai arī otrs kodējums to neatbalsta.

Secinājums

Šajā rakstā tika apspriests, kā izmantot iconv Linux instrukcijas, lai pārveidotu vienu kodēšanas rakstzīmju kopu citā, izmantojot to aizstājvārdus. Tādā veidā mums bija jāizveido daži dažāda veida faili.