Parauga() funkcija R

Parauga Funkcija R



Programmā R mēs iegūstam nejauši izlases vērtības no vektora vai saraksta, izmantojot funkciju sample (). Tas ļauj mums nejauši atlasīt datu apakškopu, kas ir noderīga daudzās statistikas lietojumprogrammās. Ja ievade ir saraksts funkcijā sample(), tad arī izvade būs saraksts ar tādu pašu elementu skaitu, bet ar atlasītajiem elementiem. Šajā rakstā ir parādīta R funkcija paraugs () ar implementāciju, kas nosaka dažādus argumentus.

1. piemērs: funkcijas Sample() izmantošana ar datu argumentu

R funkcija paraugs() ir jānodrošina ar izlases datiem, lai nejauši ģenerētu skaitli. Parauga dati ir nepieciešamais funkcijas sample() arguments, kura kods ir norādīts šādi:

datiX < - c ( 10 , divdesmit , 30 , 40 , piecdesmit , 60 , 70 , 80 , 90 , 100 )

paraugs ( datiX , 3 )

paraugs ( datiX , 3 )

Šeit mēs vispirms ģenerējam veselu skaitļu elementu vektorus mainīgajā “dataX”. Pēc tam mēs kodā divreiz izsaucam funkciju sample () un nododam tai iepriekš ģenerēto “dataX” vektoru kā argumentu. Pirmo reizi izmantojot paraugu (dataX, 3), no vektora “dataX” tiek ņemts nejaušs trīs elementu paraugs. Rezultāti ir nejauša trīs elementu permutācija no “dataX”. Pēc tam mēs atkal izmantojam paraugu (a, 5), kas ņem vēl vienu neatkarīgu nejaušu trīs elementu paraugu no “dataX” vektora. Šoreiz rezultāts ir pilnīgi atšķirīgs no iepriekšējā.







Izvade parāda dažādus elementus, divreiz izsaucot parauga () funkciju. Ņemiet vērā, ka katru reizi, kad veidojam paraugu nejauši, tiek iegūti dažādi vektoru elementi:





2. piemērs: funkcijas Sample() izmantošana ar aizstāšanas argumentu

Turklāt mums ir funkcijas paraugs () arguments “aizstāt”, kas ņem loģiskās vērtības. Līdzīgu elementu var atlasīt vairāk nekā vienu reizi, ja elements ir atlasīts ar aizstāšanas opciju TRUE. Tomēr, ja vērtība ir iestatīta uz FALSE, var būt tikai viena katra elementa atlase, kas izraisa elementu izlasi bez aizstāšanas.





nejaušie_skaitļi = c ( vienpadsmit , 25 , 12 , 89 , Četri, pieci , 16 , 67 , 38 , 96 , 55 , 73 )

paraugs ( nejaušie_skaitļi , 4 , aizvietot = PATIESA )

paraugs ( nejaušie_skaitļi , 5 , aizvietot = PATIESA )

Šeit mēs vispirms definējam vektoru ar dažām skaitliskām vērtībām mainīgajā “random_numbers”. Pēc tam mēs izsaucam parauga () funkciju, kur “random_numbers” tiek nodots kā arguments. Vērtība “4” ir norādīta funkcijai sample (), kas norāda, ka tā atlasa tikai četras nejaušas vērtības no vektoriem “random_numbers”.

Pēc tam funkcijā sample() esošā aizvietot=TRUE norāda, ka katru vērtību var atlasīt vairāk nekā vienu reizi. Pēc tam mēs atkal izvietojam parauga () funkciju, kas šoreiz atlasa “5” nejaušas vērtības no vektoriem. Līdzīgi mēs iestatījām aizstāšanas argumentu ar “TRUE” kā iepriekš vairākām atlases opcijām katrai vērtībai.



Kā redzam, pirmajā izvadā tiek parādīts 4 nejauši atlasītu elementu vektors no vektora “random_numbers”. Tomēr nākamajā izvadē tiek parādīts nejauši atlasītu elementu vektors “5”:

3. piemērs: funkcijas Sample() izmantošana ar lieluma argumentu

Nākamais arguments, ko iztur parauga () funkcija, ir “izmērs”. “Izmērs” ir neobligāts parametrs, kas norāda ņemamo paraugu vērtību. Funkcijas sample() kods ar parametru “size” ir norādīts šādi:

vektori < - 1 : 10

paraugs ( vektori , Izmērs = 5 )

Šeit skaitlisks vektors ir definēts kā veselu skaitļu secība no 1 līdz 10 mainīgajā “vektori”. Funkcija paraugs () tiek izmantota nejaušai elementu atlasei no vektora. Kā redzam, funkcijai sample () ir divi argumenti. Pirmais arguments ir vektori, no kuriem mēs iegūstam paraugu. Nākamais arguments ir izmērs, kas norādīts ar vērtību “5”, kas norāda, ka no vektora ir jāizvēlas tikai pieci elementi.

Tādējādi atlasītie elementi tiek atgriezti nejaušā secībā kā jauns vektors šādā izvadā:

4. piemērs: funkcijas Sample() izmantošana R sarakstam

Turklāt funkciju sample() var izmantot sarakstam R. Šī piemēra sadaļa iegūst nejaušas vērtības no saraksta.

R_list < - sarakstu ( 1 : 4 ,

913 ,

c ( 'X' , 'YYY' , 'LABI' ) ,

'ZZZ' ,

5 )

rezultāts < - R_list [ paraugs ( 1 : garums ( R_list ) , Izmērs = 4 ) ]

rezultāts

Šeit “R_list” saraksts ir definēts ar dažāda veida elementiem, tostarp skaitļu vektoru, vienu skaitli, rakstzīmju vektoru, virkni un citu skaitli. Pēc tam mēs izveidojam “rezultāta” mainīgo, kurā tiek izsaukta funkcija sample ().

Funkcijā sample () mēs iestatām izteiksmi “1:length(R_list)”, kas norāda indeksu vektorus, kuriem jāizlasa. Tālāk mums ir arguments “lielums”, lai norādītu parauga elementu skaitu, kas ir “4”. Tāpēc “R_list” ģenerē trīs nejauši atlasītus elementus no saraksta “R_list”. Tā kā elementi sarakstā “R_list” ir dažāda veida, tad arī iegūtie elementi “rezultātā” var būt dažāda veida.

Izvade attēlo jauno sarakstu, kurā ir nejauša sākotnējā saraksta apakškopa:

5. piemērs: funkcijas Sample() izmantošana ar Prob argumentu

Turklāt mums ir parauga () funkcijas parametrs “prob”. Arguments “prob” norāda vektorā atlasītā elementa varbūtību. Ņemiet vērā, ka tiek pieņemts, ka visiem elementiem ir vienāda iespējamība, ja netiek izmantots arguments “prob”.

mani_dati = c ( 31 , 99 , 5 , 24 , 72 )

paraugs ( mani_dati , Izmērs = 10 , aizvietot = PATIESA ,

prob = c ( 0.5 , rep ( 0.1 , 4 ) ) )

Šeit ciparu vektoru elementi tiek apzīmēti ar “my_data”. Nākamajā darbībā mēs izsaucam funkciju sample (), kurā “my_data” tiek nodots nejauši atlasītiem 10 elementiem. Pēc tam tiek definēts arguments “lielums”, kas norāda, ka nejauši atlasāmajai vērtībai ir jābūt “10” izmēram. Pēc tam mēs piešķiram “TRUE” argumentam “aizstāt”, kas nozīmē, ka katrs atlasītais elements tiek aizstāts ar vektoru pirms nākamā atlasīšanas. Trešais arguments, kas definēts funkcijā paraugs(), ir “prob”, kas nosaka katra elementa atlases varbūtību vektorā “my_data”. Pirmā elementa varbūtība ir iestatīta uz “0,5”. Pārējiem četriem vektora elementiem varbūtība ir “0,1”.

Šāda izvade tiek izgūta ar lielāko vektoru pirmā elementa varbūtību, kā paredzēts:

6. piemērs. Funkcijas Sample() izmantošana joslas diagrammas renderēšanai

Visbeidzot, funkcija sample () tiek izmantota, lai izveidotu joslas diagrammu R, lai vizualizētu kategoriskā mainīgā sadalījumu ar noteiktu varbūtības sadalījumu.

parauga_dati = c ( 1 , 2 , 3 )

barplots ( tabula ( paraugs ( parauga_dati , Izmērs = 500 , aizvietot = PATIESA , prob = c ( .30 , .60 , .10 ) ) ) )

Šeit pēc “sample_data” definēšanas ar veselas skaitļa vērtības vektoru mēs ģenerējam joslu diagrammu, izvietojot funkciju sample (). Pirmkārt, mēs izsaucam barplot, kas izsauc table() funkciju, lai izveidotu iegūtā parauga biežuma tabulu. Pēc tam mēs norādām funkciju sample() funkcijā table(), kur no veselu skaitļu vektora no 1 līdz 3 tiek iegūta nejauša izlase ar izmēru 1000. Pēc tam arguments “prob” tiek izmantots, lai norādītu katra vesela skaitļa atlases varbūtību. .

Kā redzams tagad, joslas diagramma tiek atveidota tālāk ar trim joslām, pa vienai katram veselam skaitlim, un joslu augstums ir saistīts ar veselo skaitli, kas parādās paraugā:

Secinājums

Mēs esam redzējuši, kā darbojas sample() funkcija, izmantojot dažādus piemērus. Funkcija sample () tiek izmantota ar dažādiem argumentiem, ja ir nepieciešami parauga dati, un visi pārējie argumenti ir neobligāti un tiek izsaukti īpašos gadījumos. Tomēr funkcija sample () ir noderīga statistiskajā analīzē vai strādājot ar lielām datu kopām.