7. nodaļa. Paraugkopu salīdzināšana

7.1 Teorētiskais pamatojums

Viens no biežākajiem uzdevumiem eksperimentos vai pētījumos, ir salīdzināt divu vai vairāku paraugkopu datus savā starpā, lai varētu izdarīt secinājumus par to līdzību vai atšķirību. Piemēri varētu būt augu biomasas salīdzināšana starp divām augšanas vietām, mātīšu un tēviņu proporcijas salīdzināšana starp divām populācijām, utt. Paraugkopu salīdzināšanai ir jāizvēlas pareizās metodes, jo katram datu veidam atbilstošāks kāds konkrēts tests. Pirmais dalījums statistiskajiem testiem ir parametriskajās un neparametriskajās metodēs. Parametriskās metodes pieņem, ka dati nāk no ģenerālkopas, kas normālajam sadalījumam, toties neparemetriskajiem testiem normalitāte nav būtiska. Parametriskās metodes strādā ar novērojumu vērtībām, bet neparemetriskās metodes ar šo vērtību rangiem, tāpēc parametriskās vērtības parasti ir jutīgas pret ekstrēmām vērtībām. Kā svarīgākās paramtriskās metodes paraugkopu salīdzināšanai jāizceļ T-tests, F-tests un Levena tests. No neparametriskajiem testiem jāmin Mann-Whitney-Wilcoxon tests un Wilcoxon tests atkarīgiem novērojumiem. Kvalitatīvu (kategorijas) datu analīzei būtiskākais tests ir \(\chi^2\) tests.

7.1.1 T-tests

Visbiežāk lietotais tests divu paraugkopu salīdzināšanai ir T-tests jeb Stjūdenta t-tests. Tomēr pirms šī tests pielietošanas ir jāņem vērā vairāki tā pieņēmumi:

  • Paraugkopas dati nāk no ģenerālkopas, kas atbilst normālajam sadalījumam. Nelielas nobīdes no normālā sadalījuma varētu neietekmēt rezultātu interpetāciju, bet jāņem vērā, ka tests ir ļoti jutīgs pret ekstrēmām vērtībām.
  • Paraugkopu dispersijas ir homogēnas (līdzīgas). Ja dispersijas ir atšķirīgas, tad var izmantot T-testu ar Welch modifikāciju.
  • Paraugkopu novērojumi ir neatkarīgi. Ja paraugkopu novērojumi ir atkarīgi, tad jāizmanto speciāla T-testa modifikācija atkarīgiem novērojumiem.

T-testa gadījumā Nulles hipotēze apgalvo, ka starp divu paraugkopu vidējie aritmētiskie ir vienādi (to starpība ir 0). Testa veikšanai aprēķina lielumu t (\ref{eq:tte}), ko pēc tam salīdzina ar teorētiski sagaidāmo t vērtību no Stjūdenta sadalījuma pie noteiktā brīvības pakāpju skaita.

\begin{equation} t=\frac{\overline{X_1}-\overline{X_2}}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} \label{eq:tte} \end{equation}

, kur \(\overline{X_1}\) un \(\overline{X_2}\) - pirmās un otrās paraugkopas vidējie aritmētiskie, \(s_1^2\) un \(s_2^2\) - pirmās un otrās paraugkopas dispersijas, \(n_1\) un \(n_2\) - pirmās un otrās paraugkopas paraugkopas apjoms.

Nulles hipotēze ir spēkā, ja \(t_{n_1+n_2-2,\alpha/2}<t<t_{n_1+n_2-2,1-\alpha/2}\), vai arī, ja testā iegūtā p-vērtība ir lielāka par noteikto \(\alpha\) vērtību. Pretējā gadījumā ir jāakceptē alternatīvā hipotēze par to, ka pastāv statistiski būtiska atšķirība starp abu paraugkopu vidējiem aritmētiskajiem.

7.1.1.1 T-tests atkarīgām paraugkopām

Gadījumos, ja paraugkopas savā starpā ir atkarīgas vai saistītas, tad ir jāizmanto tam pielāgots t-tests (\ref{eq:tteatk}). Piemēri atkarīgām vai saistītām paraugkopām būtu, vienu un to pašu cilvēku asinsspiediens pirms un pēc fiziskās slodzes, vai arī asinsspiedens labajā un kreisajā rokā tiem pašiem cilvēkiem. Saistītu pāru dati būtu bērna un vecāka asinsspiedieni vairākiem šādiem pāriem. Atkarīgu paraugkopu gadījumā ir jāaprēķina starpības starp katriem diviem atkarīgajiem/saistītajiem novērojumiem - d. Nulles hipotēze apgalvo, ka vidējā starpība starp pāriem ir vienāda ar 0. \begin{equation} t=\frac{\overline{d}}{s_d/\sqrt{n}} \label{eq:tteatk} \end{equation}

,kur \(\overline{d}\) - vidējā vērtība pāru starpībām, n - pāru skaits, \(s_d\) - pāru starpības standartnovirze, kuru aprēķina pēc formulas \(s_d=\sqrt{\sum(d_i-\overline{d})^2/(n-1)}\).

Nulles hipotēze ir spēkā, ja \(t_{n-1,\alpha/2}<t<t_{n-1,1-\alpha/2}\), vai arī, ja testā iegūtā p-vērtība ir lielāka par noteikto \(\alpha\) vērtību. Pretējā gadījumā ir jāakceptē alternatīvā hipotēze par to, ka atkarīgo/saistīto pāru vidējā starpība būtiski atšķiras no 0.

7.1.1.2 T-tests vienai paraugkopai

T-testu ir iespējams ir iespējams veikt arī vienai paraugkopai, ja merķis ir noskaidrot vai paraugkopas vidējais aritmētiskais ir vienāds ar iepriekš zināmi vidējā aritmētiskā vērtību (ģenerālkopas) vidējais aritmētiskais). Šajā gadījumā izmanto modificētu T-testa formulu (). \begin{equation}\label{ttevie} t=\frac{\overline{x}-\mu}{\frac{s}{\sqrt(n)}} \end{equation}

,kur \(\overline{x}\) – paraugkopas vidējais aritmētiskais, \(\mu\) – ģenerālkopas vidējais aritmētiskais, s – paraugkopas standartonivrze, n – paraugkopas novērojumu skaits.

Nulles hipotēze ir spēkā, ja \(t_{n-1,\alpha/2}<t<t_{n-1,1-\alpha/2}\), vai arī, ja testā iegūtā p-vērtība ir lielāka par noteikto \(\alpha\) vērtību. Pretējā gadījumā ir jāakceptē alternatīvā hipotēze par to, ka pastāv statistiski būtiska atšķirība starp paraugkopas un ģenerālkopas vidējiem aritmētiskajiem.

7.1.2 Dispersiju salīdzināšana

Lai salīdzinātu variēšanu (dispersiju) starp divām paraugkopām, biežāk izmantotais tests ir F-tests (\ref{eq:Ftes}). Nulles hipotēze šajā gadījumā apgalvo, ka divām paraugkopām variēšana (dispersija) ir vienāda. Nulles hipotēzes pārbaudīšanai, iegūta F vērtība tiek salīdzināta ar teorētisko F vērtību no atbilstošā sadalījuma. F testa pieņēmums ir, ka paraugkopu dati atbilst normālajam sadalījumam. Attiecīgi uz testa rezultātiem ir jāskatās uzmanīgi, ja atbilstība normālajam sadalījumam ir aptuvena. \begin{equation} F=\frac{s_1^2}{s_2^2} \label{eq:Ftes} \end{equation}

,kur \(s_1^2\) un \(s_2^2\) attiecīgi pirmās un otrās paraugkopas dispersijas.

Nulles hipotēze ir spēkā, ja \(F_{n_1-1,n_2-1,\alpha/2}<F<F_{n_1-1,n_2-1,1-\alpha/2}\), vai arī, ja testā iegūtā p-vērtība ir lielāka par noteikto \(\alpha\) vērtību. Pretējā gadījumā ir jāakceptē alternatīvā hipotēze par to, ka pastāv statistiski būtiska atšķirība starp paraugkopu dispersijām.

Gadījumā, ja ir jāsalīdzina vairāk kā divu paraugkopu dispersijas, tad var izmantot, piemēram, Levene testu. Šī testa priekšrocība ir tā, ka datiem nav jāseko normālajam sadalījumam.

7.1.3 Wilcoxon tests neatkarīgiem novērojumiem

Gadījumos, ja dati neatbilst normālajam sadalījumam, bet nepieciešams salīdzināt vērtības starp divām paraugkopām, var izmantot neparmetrisko Mann-Whitney-Wilcox testu, sauktu arī par Mann-Whitney U testu, vai arī Wilcoxon testu neatkarīgiem novērojumiem. Testam ir divi galvenie pieņēmumi: (a) novērojumi abās paraugkopas ir neatkarīgi; (b) novērojumu datus ir iespējams saranžēt (sakārtot no augošā/dilstošā secībā).

Testu pamatā ir vērtību sarenžēšana starp abām paraugkopām un šo rangu salīdzināšana. Nulles hipotēze apgalvo, ka starp abām paraugkopām rangu izvietojums ir nejauš un šīs paraugkopas ir līdzīgas (to mediānas ir vienādas).

Lai pārbaudīti Nulles hipotēzi, tiek saskaitīti rangi mazākajā paraugkopā –T. Ja nulles hipotēze ir spēkā, tad T piederēs pie normālā sadalījuma ar vidējo vērtību \(n_1 \overline{R}\) un standartnovirzi \(s_R\), kur \(\overline{R}\) ir vidējā rangu vērtība, \(n_1\) un \(n_2\) - pirmās un otrās paraugkopas apjoms.

7.1.4 Wilcoxon tests atkarīgiem novērojumiem

Īpaša Wilcoxon testa formula ir jāizmanto gadījumos, ja dati starp abām paraugkopām ir atkarīgas. Šajā gadījumā ranžētas tiek novērojumu starpības (to absolūtās vērtības), nevis paši novērojumi.

7.1.5 \(\chi^2\) tests

\(\chi^2\) testu izmanto gadījumos, ja jāparbauda kvalitatīvu (kategorijas) datu atbilstību iepriekš zināmam sadalījumam, vai arī jāsalīdzina savā starpā kvalitātīvu datu paraugkopas. Piemēri kvalitatīviem datiem būtu mātīšu un tēviņu skaits populācijā, zirņu pazīmju attiecībā ģenētiskos pētījumos. Visos gadījumos no sākuma dati ir jāapkopo pa kategorijām, jāiegūst empīriskais sadalījums.

Testam ir vairāki pieņēmumi: (a) paraugkopas apjoms ir pietiekami liels (diemžēl nav vienota viedokļa, bet vēlams būtu tuvu vismaz 100); (b) pietiekami liels novērojumu skaits katrā “šūnā” - ja ir 2*2 tabula, tad vismaz 5 novērojumi katrā šūnā, ja lielāka tabula, tad vismaz 80% šūnu jābūt vismaz 5 novērojumiem. Ja šos pieņēmumus nav iespējams izpildīt, tad jāizmanto precīzāki testi.

7.1.5.1 Atbilstība sadalījumam

Ja ir nepieciešams pārbaudīt empīriskā sadalījuma atbilstību sagaidāmajam sadalījumam, tad Nulles hipotēze apgalvos, ka empīriskias sadalījums atbilst sagaidāmajam sadalījumam (starp tiem nav atšķirības). Nulles hipotēzes pārbaudīšanai ir jāaprēķina \(\chi^2\) vērtība (\ref{eq:chisad}) un jāsalīdzina to ar teorētisko vērtību. \begin{equation} \chi^2=\sum\limits_{i=1}^n \frac{(O_i-E_i)^2}{E_i} \label{eq:chisad} \end{equation}

, kur \(O_i\) - empīriskā (novērotā) frekvence konkrētajā klasē, \(E_i\) - sagaidāmā (teorētiskā) frekvence konkrētajā klasē, n - klašu skaits.

Nulles hipotēze ir spēkā, ja \(\chi^2<\chi^2_{(R-1)(C-1),1-\alpha}\) (R - rindiņu skaits, C - kolonnu skaits), vai arī, ja testā iegūtā p-vērtība ir lielāka par noteikto \(\alpha\) vērtību. Pretējā gadījumā ir jāakceptē alternatīvā hipotēze par to, ka pastāv statistiski būtiska atšķirība starp empīrisko un teorētisko sadalījumu.

7.1.5.2 Paraugkopu salīdzinājums

Divi vai vairāku paraugkopu sadalīdzināšanai, izmanto to pašu formulu (\ref{eq:chisad}), tikai šajā gadījumā sagaidāmās frekvences E aprēķina, kā \((n_R \cdot n_C)/n\), kur \(n_R\) un \(n_C\) attiecīgi ir atbilstošās rindiņas un kolonnas frekvenču summa, bet n ir kopējā frekvenču summa. Nulles hipotēze nosaka, ka novērojumi ir neatkarīgi un starp tiem nav saistības.

7.2 Paraugkopu salīdzināšana programmā R

7.2.1 Datu sagatavošana

Kā pirmais fails piemēriem izmantots niedres2.txt, kas satur informāciju par niedru lapu garumu un platumu trīs parauglaukumos - divos parauglaukumos ir pa 17 novērojumiem, bet vienā parauglaukumā ir 16 novērojumi.

niedr<-read.table(file="niedres2.txt",header=T,sep="\t",dec=".")
str(niedr)
## 'data.frame':    50 obs. of  3 variables:
##  $ garums : num  31.6 23.2 39.2 37.4 21.1 37 24.7 31.3 37.4 39.7 ...
##  $ platums: num  2.5 2.3 2.1 5.8 2.2 4.1 3.5 4.2 2.5 2.8 ...
##  $ paraug : Factor w/ 3 levels "Austr","Riet",..: 1 1 1 1 1 1 1 1 1 1 ...
summary(niedr)
##      garums         platums        paraug  
##  Min.   :11.90   Min.   :0.400   Austr:17  
##  1st Qu.:31.07   1st Qu.:2.500   Riet :17  
##  Median :38.40   Median :3.900   Ziem :16  
##  Mean   :37.59   Mean   :3.892             
##  3rd Qu.:45.30   3rd Qu.:5.100             
##  Max.   :59.00   Max.   :7.100

No datu objekta niedr izveidots otrs objekts niedr2, kas satur novērojumus tikai no Austrumu un Rietumu parauglaukumiem. Tomēr apskatot ar funkciju str() jaunizveidotās datu tabulas struktūru redzams, ka joprojām tiek uzskatīts, ka kolonnā paraug ir trīs iespējamie līmeņi. Lai “nomestu” nevajadzīgo faktora līmeni, jāizmanto funkcija droplevels(). Pēc šīs darbības kolonnai paraug paliek tikai divi līmeņi.

niedr2<-niedr[niedr$paraug=="Austr" | niedr$paraug=="Riet",]
str(niedr2)
## 'data.frame':    34 obs. of  3 variables:
##  $ garums : num  31.6 23.2 39.2 37.4 21.1 37 24.7 31.3 37.4 39.7 ...
##  $ platums: num  2.5 2.3 2.1 5.8 2.2 4.1 3.5 4.2 2.5 2.8 ...
##  $ paraug : Factor w/ 3 levels "Austr","Riet",..: 1 1 1 1 1 1 1 1 1 1 ...
niedr2<-droplevels(niedr2)
str(niedr2)
## 'data.frame':    34 obs. of  3 variables:
##  $ garums : num  31.6 23.2 39.2 37.4 21.1 37 24.7 31.3 37.4 39.7 ...
##  $ platums: num  2.5 2.3 2.1 5.8 2.2 4.1 3.5 4.2 2.5 2.8 ...
##  $ paraug : Factor w/ 2 levels "Austr","Riet": 1 1 1 1 1 1 1 1 1 1 ...

7.2.2 Divu neatkarīgu paraugkopu salīdzināšana ar parametriskajām metodēm

Paraugkopu salīdzināšanas piemēram izmantota informācija par niedru lapu garumu divos parauglaukumos. Pirmais solis paraugkoku salīdzināšanai ir to dispersiju salīdzināšana. Tam var izmantot funkciju var.test(), kas veic F testu divu paraugkopu dispersiju salīdzināšanai. Funkcijai kā argumenti jānorāda kolonna, kurā ir visi dati, un kolonna, kurā ir dalījuma līmeņi. Analīzes rezultātos parādās gan F vērtība (dispersiju dalījums), gan arī ticamības intervāls šim dalījumum, brīvības pakāpju skaits un atbilstošā p-vērtība.

var.test(niedr2$garums~niedr2$paraug)
## 
##  F test to compare two variances
## 
## data:  niedr2$garums by niedr2$paraug
## F = 0.89492, num df = 16, denom df = 16, p-value = 0.827
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.3240865 2.4711930
## sample estimates:
## ratio of variances 
##          0.8949191

Secinājums: pie būtiskuma līmeņa \(\alpha=0,05\) nav statistiski būtiskas atšķirības starp abu paraugkopu dispersijām, jo p-vērtība ir lielāka par noteikto būtiskuma līmeni (0,826>0,05).

Vidējo aritmētisko salīdzināšanai izmanto funkciju t.test(), kurai arī kā argumenti jānorāda kolonna, kurā ir visi dati, un kolonna, kurā ir dalījuma līmeņi. Papildus jānorāda arī arguments var.equal=TRUE, lai norādītu, ka dispersijas ir homogēnas (par to pārliecinājās iepriekšējā testā.). Rezultātos norāda t-vērtību, brīvības pakāpju skaitu, atbilstošo p-vērtību. Tā pat tiek norādīts abu paraugkopu vidējais aritmētiskais, kā arī šo vidējo aritmētisko starpības ticamības intervāls.

t.test(niedr2$garums~niedr2$paraug,var.equal=TRUE)
## 
##  Two Sample t-test
## 
## data:  niedr2$garums by niedr2$paraug
## t = -2.4034, df = 32, p-value = 0.02221
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -13.899897  -1.147161
## sample estimates:
## mean in group Austr  mean in group Riet 
##            33.52941            41.05294

Secinājums: pie būtiskuma līmeņa \(\alpha=0,05\) pastāv statistiski būtiska atšķirība starp abu paraugkopu vidējiem aritmētiskajiem, jo iegūtā p-vērtība ir zemāka par noteikto būtiskuma līmeni (0,022<0,050).

T-testu programmā R var arī veikt nepieņemot dispersiju vienādību (tas pat ir noklusētais uzstādījums). Šajā gadījumā t-tests tiek veikts ar Velča korekciju (mainās brīvības pakāpju skaits).

t.test(niedr2$garums~niedr2$paraug)
## 
##  Welch Two Sample t-test
## 
## data:  niedr2$garums by niedr2$paraug
## t = -2.4034, df = 31.902, p-value = 0.02223
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -13.900666  -1.146392
## sample estimates:
## mean in group Austr  mean in group Riet 
##            33.52941            41.05294

7.2.3 Vairāku neatkarīgu paraugkopu salīdzināšana ar parametriskajām metodēm

Vairāk kā divu paraugkopu salīdzināšanas piemēram izmantota oriģinālā niedr datu tabula, kurā bija visi trīs parauglaukumi. Vairāku dispersiju salīdzināšanai var izmantot funkciju leveneTest() no paketes car. Arī šai funkcijai kā mainīgie jānorāda kolonna ar datiem un kolonna ar dalījuma līmeņiem. Analīzes rezultāts atšķiras no tā, ko dot var.test(). Rezultātā ir norādīts brīvības pakāpju skaits, iegūtā F vērtīva un atbilstošā p-vērtība (norādīta kolonnā Pr(>F)).

library(car)
leveneTest(niedr$platums~niedr$paraug)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.7235 0.4904
##       47

Secinājums: visi trīs paraugkopu dispersijas ir homogēnas (atšķirības nav būtiskas) pie būtiskuma līmeņa \(\alpha=0,05\), jo p-vērtības ir lielāka par noradīto būtiskuma līmeņa (0,49>0,05).

Vidējo aritmētisko salīdzināšanai atkal jāizmanto t-tests, tikai šajā gadījumā jāizmanto funkcija pairwise.t.test(), kas veiks t-testus starp jebkuriem diviem līmeņiem (parauglaukumiem), kā arī vienlaicīgi pielāgos p-vērtības, lai samazinātu 1. tipa kļūdas rašānās iespēju veicot atkārtotos testus. Vēl viena šīs funkcijas īpatnība ir tā, ka mainīgo atdalīšanai izmanto komatu nevis tildes zīmi. Analīzes rezultātos norādītas p-vērtības katram no salīdzinājumiem, kā arī norādīta kāda p-vērtību pielāgošanas metode izmantota (to var mainīt).

pairwise.t.test(niedr$platums,niedr$paraug)
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  niedr$platums and niedr$paraug 
## 
##      Austr Riet 
## Riet 0.013 -    
## Ziem 0.016 0.859
## 
## P value adjustment method: holm

Secinājums: pie būtiskuma līmeņa \(\alpha=0,05\) pastāv statistiski būtiska atšķirība starp Austrumu un Rietumu, kā arī Austrumu un Ziemeļu parauglaukumu lapu platumu vidējām vērtībām, jo atbilstošās p-vērtības ir mazākas par noteikto būtiskuma līmeni (0,013<0,050 un 0,016<0,050), toties nav statistiski būtiskas atšķirības starp Rietumu un Ziemeļu parauglaukumu lapu platumiem (0,859>0,050).

7.2.4 Atkarīgu paraugkopu salīdzināšana ar parametriskām metodēm

Kā piemērs atkarīgu paraugkopu salīdzināšanai izmantots datu fails rokas.txt, kas satur informāciju par labās un kreisās rokas spēku 25 cilvēkiem. Tā kā ir pieejama informācija par viena un tā paša cilvēkā labās un kreisās rokas spēku, tas šādus datus attiecīgi pieņemam par atkarīgiem.

Ja dati atbilst visiem pieņēmumiem, tad var izmantot T-testu modifikāciju atkarīgiem datiem. Programmā R tam izmanto atkal funkciju t.test(), kurai kā arguments jānorāda divas datu kolonnas, kā arī paired=TRUE. Galvenais nosacījums, lai datu objekts būtu sagatavots pareizi - abās kolonnās objektu secībai jābūt vienādai.

rokas<-read.table(file="rokas.txt",header=TRUE,sep="\t",dec=".")
str(rokas)
## 'data.frame':    25 obs. of  2 variables:
##  $ laba  : num  32.9 39.7 26.9 38.8 58 50.6 31.4 68.7 65.2 31.8 ...
##  $ kreisa: num  21.9 39.2 29.9 34.8 48.7 51.4 34.5 56.4 57.5 27.8 ...
t.test(rokas$laba,rokas$kreisa,paired=TRUE)
## 
##  Paired t-test
## 
## data:  rokas$laba and rokas$kreisa
## t = 4.4743, df = 24, p-value = 0.0001581
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  2.413454 6.546546
## sample estimates:
## mean of the differences 
##                    4.48

Secinājums: starpība starp labās un kreisās rokas vidējo spēku ir 4.48 un šī starpība ir statistiski būtiska pie būtiskuma līmeņa \(\alpha=0,05\), jo p-vērtība ir mazāka par šo būtiskuma līmeni (0,0002<0,05).

Ja šos pašus datus analīzē nepieņemot to atkarību, iegūst pavisam citu rezultātu - šādā gadījumā secinājums ir, ka starpība starp vidējiem aritmētiskajiem nav statistiski būtiska.

t.test(rokas$laba,rokas$kreisa)
## 
##  Welch Two Sample t-test
## 
## data:  rokas$laba and rokas$kreisa
## t = 1.1261, df = 47.021, p-value = 0.2658
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -3.523473 12.483473
## sample estimates:
## mean of x mean of y 
##    44.812    40.332

7.2.5 Vienas paraugkopas t-tests

Funkciju t.test() var izmantot arī vienas paraugkopas t-testam, piemēram, ja jānoskaidro vai paraugkopa var piederēt pie ģenerālkopas, kurai ir zināms tās vidējais aritmētiskais. Šādā gadījumā kā argumenti funkcijai jānorāda vektors/kolonna, kas satur paraugkopas datus, kā arī arguments `mu= ar ģenerālkopas vidējo aritmētisko. Piemērā pārbaudīts vai niedru lapu platums varētu piederēt pie ģenerālkopas, kuras vidējā vērtība ir trīs.

t.test(niedr$platums,mu=3.0)
## 
##  One Sample t-test
## 
## data:  niedr$platums
## t = 3.9431, df = 49, p-value = 0.0002557
## alternative hypothesis: true mean is not equal to 3
## 95 percent confidence interval:
##  3.4374 4.3466
## sample estimates:
## mean of x 
##     3.892

Secinājums: pie būtiskuma līmeņa \(\alpha=0,05\) niedru lapu platums konkrētajā paraugkopā nepieder pie ģenerālkopas, kuras vidējais aritmētiskais ir 3,0 cm, jo p-vērtības ir mazāka par noteikto būtiskuma līmeni (0,0026<0,05).

7.2.6 Divu neatkarīgu paraugkopu salīdzināšana ar neparametriskajām metodēm

Lai veiktu divu paraukopu salīdzināšanu ar neparametriskām metodēm programmā R, ir jāizmanto funkciju wilcox.test(), kurai kā argumenti jānorāda kolonna ar datiem un kolonna ar dalījuma līmeņiem (tie drīkst būt divi). Piemēram izmantoti dati no datu objekta niedr2 par niedru lapu garumu divos parauglaukumos. Atšķirībā no funkcijas rezultātiem, šajā gadījumā norāda tikai iegūtu p-vērtību un W rādītāju, ko izmanto atšķirības būtiskuma novērtēšanai.

wilcox.test(niedr2$garums~niedr2$paraug)
## Warning in wilcox.test.default(x = c(31.6, 23.2, 39.2, 37.4, 21.1, 37,
## 24.7, : cannot compute exact p-value with ties
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  niedr2$garums by niedr2$paraug
## W = 75, p-value = 0.01745
## alternative hypothesis: true location shift is not equal to 0

Secinājums: pie būtiskuma līmeņa \(\alpha=0,05\) pastāv statistiski būtiska atšķirība starp abu paraugkopu niedru lapu garumiem, jo iegūtā p-vērtība ir zemāka par noteikto būtiskuma līmeni (0,017<0,050).

7.2.7 Divu atkarīgu paraugkopu salīdzināšana ar neparametriskajām metodēm

Atkarīgu paraugkopu salīdzināšanai ar neparametriskajām metodēm R arī izmanto funkciju wilcox.test(), kurai kā arguments jānorāda divas datu kolonnas, kā arī `paired=TRUE. Galvenais nosacījums, lai datu objekts būtu sagatavots pareizi - abās kolonnās objektu secībai jābūt vienādai. Piemēram izmantoti dati par labās un kreisās rokas spēku.

wilcox.test(rokas$laba,rokas$kreisa,paired=TRUE)
## Warning in wilcox.test.default(rokas$laba, rokas$kreisa, paired = TRUE):
## cannot compute exact p-value with ties
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  rokas$laba and rokas$kreisa
## V = 291.5, p-value = 0.0005445
## alternative hypothesis: true location shift is not equal to 0

Secinājums: starpība starp labās un kreisās rokas spēku ir statistiski būtiska pie būtiskuma līmeņa \(\alpha=0,05\), jo p-vērtība ir mazāka par šo būtiskuma līmeni (0,0006<0,05).

7.2.8 \(\chi^2\) tests

\(\chi^2\) testa veikšanai programmā R izmanto funkciju chisq.test(), kurai norādāmie argumenti ir atkarīgi no tā, ko vēlas salīdzināt. Ja ir nepieciešams pārbaudīt vai empīriskais sadalījums atbilst iepriekšs zināmam teorētiskajam sadalījumam, tad jānorāda argumenti x=, kas satur empīrisko frekvenču vektoru, un arguments `p=, kas satur teorētiskā sadalījuma relatīvās frekvences (iespējamības). Teorētiskā sadalījuma frekvenču vektora summai jābūt vienādai ar 1.

Kā piemērs pārbaudīta eksperimentā iegūto dažādu formu un krāsu ziŗnu skaita sadalījuma atbilstība sagaidāmajam sadalījumam atbilstoši Mendeļa likumiem. Sagaidāmās frekvences ir 9:3:3:1, un, lai panāktu, ka to summa būtu vienāda ar 1, tās tiek dalītas ar 16 (sagaidāmo frekvenču summa). Analīzes rezultātos parādās aprēķinātā \(\chi^2\) vērtība, brīvības pakāpju skaits un atbilstošā p-vērtība.

zirni <- c(315, 108, 101, 32)
teor.zirni <- c(9, 3, 3, 1)/16
chisq.test(x = zirni, p = teor.zirni)
## 
##  Chi-squared test for given probabilities
## 
## data:  zirni
## X-squared = 0.47002, df = 3, p-value = 0.9254

Secinājums: eksperimentāli iegūto zirņu attiecība atbilst teorētiski sagaidāmajam sadalījumam (nav statistiski būtiskas atšķirības), jo iegūtā p-vērtība ir lielāka par būtiskuma līmeni (0,925>0,05).

Ja ir nepieciešams salīdzināt frekvenču sadalījumu starp divām paraugkopām, tad funkcijā chisq.test() kā arguments jānorāda matrice, kurā atbilstoši pa kolonnām izvietoti pirmās un otrās paraugkopas dati. Analīzes piemēram izmantoti dati par koku sadalījumu pa sugām divos parauglaukumos.

koki<-matrix(c(12,34,56,23,8,27,33,47,14,11),ncol=2)
rownames(koki) <- c("Priede","Egle","Bērzs","Ozols","Kļava")
colnames(koki) <- c("Paraug A","Paraug B")
koki
##        Paraug A Paraug B
## Priede       12       27
## Egle         34       33
## Bērzs        56       47
## Ozols        23       14
## Kļava         8       11
chisq.test(koki)
## 
##  Pearson's Chi-squared test
## 
## data:  koki
## X-squared = 9.2298, df = 4, p-value = 0.05561

Secinājums: pie būtiskuma līmeņa \(\alpha=0,05\) nav statistiski būtiskas atšķirības koku skaita sadalījumā pa sugām divos parauglaukumos, jo p-vērtība ir lielāka par noteikto būtiskuma līmeni (0,056>0,05).

7.2.9 Paraugkopu grafiskā salīdzināšana

Viens no informatīvākajiem grafikiem vairāku paraugkopu grafiskai salīdzināšanai ir Box-plot, kuru iegūst ar funkciju boxplot(). Kā argumenti šai funkcijai jānorāda kolonna ar datiem un kolonna ar dalījuma līmeņiem. Pēc šada grafika var spriest gan par datu izkliedi atsevišķiem dalījuma līmeņiem, gan arī par vērtību līdzību vai atšķirību (7.1 attēls). Tomēr jāatceras, ka pilnīgi drošu secinājumu var izdarīt tikai veicot kādu statistisko testu.

boxplot(niedr$platums~niedr$paraug)
Niedru lapu platuma box-plot grafiks trīs parauglaukumiem

Figure 7.1: Niedru lapu platuma box-plot grafiks trīs parauglaukumiem

7.2.10 Permutāciju un randomizēšanas tests paraugkopu salīdzināšanai

Gadījumos, kad nav iespējams veikt tradicionālos testus paraugkopu salīdzināšanai, vai arī ir nepieciešams salīdzināt rādītājus, kuru salīdzināšanai nav pieejams gatavs tests, ir iespējams izmantot tā sauktos permutāciju un randomizēšanas testus. Šo testu pamatdoma ir, ka divu esošo paraugkopu datus apvienu, un tad no šiem apvienotajiem datiem veido jaunas paraugkopas pēc nejaušības principa. Pēc tam tiek aprēķināts interesējošais rādītājs. Šis process tiek atkārtots daudz reizes (vismaz 200, labāk 1000 vai vēl vairāk reizes), un tad novērtē cik gadījumos iegūst tik pat ekstrēmu vai pat ekstrēmāku rādītāju kā oriģinālajos datos. Ja gadījumu skaita proporcija zemāka nekā izvēlētais būtiskuma līmenis, tad varam pieņemt, ka pastāv statistiski būtsika atšķirība. Permutāciju testu gadījumā veido visas iespējamās jaunās paraugkopas (kombinācijas).

Kā piemērs izmantots vienkāršākais gadījums - vidējo aritmētisko salīdzināšana, skatoties uz to starpību. Sākotnēji izveidotas divas paraugkopas par1 un par2, kas satur informāciju par niedru lapu platumu Autrumu un Rietumu parauglaukumos. Katrā no paraugkopām ir 17 novērojumi. Veicot tradicionālo t-testu, noskaidrots, ka vidējie aritmētiskie būtiski atšķiras un vidējo aritmētisko starpība ir -7,52.

par1<-niedr$garums[niedr$paraug=="Austr"]
par2<-niedr$garums[niedr$paraug=="Riet"]
t.test(par1,par2)
## 
##  Welch Two Sample t-test
## 
## data:  par1 and par2
## t = -2.4034, df = 31.902, p-value = 0.02223
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -13.900666  -1.146392
## sample estimates:
## mean of x mean of y 
##  33.52941  41.05294
vid.st<-mean(par1)-mean(par2)
vid.st
## [1] -7.523529

Permutāciju testa veikšanai, pirmkārt, izveido vektoru kop, kas satur abu paraugkopu datus. Otrkārt, izveido vektoru , kurā apvienos iegūtās vidējo aritmētisko starpības. Nākamais solis ir izmantot funkciju for(), lai veikti 999 permutācijas (jo viens atrkārtojums jau oriģinālā starpība) - ar funkciju sample() izvēlas 17 nejaušus skaitļus no 1 līdz 34, kas apzīmēs indeksus. Pēc tam aprēķina vidējos aritmētiskos divām jaunām paraugkopām vid1 un vid2 no apvienotā skaitļu vektora paraug, kas attiecīgi satur izvēlētos 17 skaitļus un pārējos 17 skaitļus. Pēc tam aprēķina vidējo aritmētisko starpību un saglabā vektorā starpibas. Beigās kā 1000. novērojumu pievieno oriģinālo vidējo aritmētisko starpību.

set.seed(76757)
kopa<-c(par1,par2)
starpibas<-NULL
for(i in 1:999){
   paraug<-sample(1:34,17)
   vid1<-mean(kopa[paraug])
   vid2<-mean(kopa[-paraug])
   starpibas[i]<-vid1-vid2
}
starpibas[1000]<-vid.st

Apskatot iegūto vidējo aritmētisko starpību histogrammu (7.2 attēls), varam redzēt, ka tā veido apmēram normālo sadalījumu, turklāt iespējamās vērtības mēdz būt lielākas nekā oriģinālojos datos.

hist(starpibas)
Randomizācijas testa rezultātā iegūto vidējo aritmētisko starpības histogramma

Figure 7.2: Randomizācijas testa rezultātā iegūto vidējo aritmētisko starpības histogramma

Pēdējais solis ir novērtēt cik bieži ir iegūta tik pat ekstrēma vai ekstrēmāka starpība. Tam izmanto funkciju mean(), kurai kā arguments likts loģiskais vaicājums - vai vektora starpibas vērtības ir lielākas vai vienādas ar oriģinālo vidējo aritmētisko starpību. Loģiskā vaicājuma gadījumā iegūst vektoru, kas satur TRUE vai FALSE vērtības, un funkcija mean() aprēķina proporciju TRUE vērtībām. Papildus izmantota funkcija abs(), lai skatītu absolūtās starpības un veiktu divpusējo testu. Tā kā iegūtā proporcija ir 0.03, tad pie būtiskuma līmeņa \(\alpha=0,05\) varam secināt, ka pastāv statistiki būtiska atšķirība vidējos aritmētiskajos.

mean(abs(starpibas) >= abs(vid.st))
## [1] 0.03

Iegūtais rezultāts katrā gadījumā var atšķirties, jo paraugkopu veidošanā iesaistīts nejaušības princips.