Как можно использовать QQ plot для определения нормальности распределения? Если есть небольшие отклонения, можно ли распределения все равно считать нормальным?

Как можно использовать QQ plot для определения нормальности распределения? Если есть небольшие отклонения, можно ли распределения все равно считать нормальным?

Например, есть у нас следующий QQ график:

Как определить, нормальное ли это распределение или нет? Сравнить с нормальным

Картинки выглядят по разному, значит, распределение, скорее всего, далеко от нормального.

Для наглядности лучше всего сгенерировать нормальные данные несколько раз и нарисовать графики рядом

В R это делается вот так:

load(url("http://www.openintro.org/stat/data/bdims.RData"))
fdims = subset(bdims, bdims$sex == 0)

qqnorm(fdims$wgt, col=adjustcolor("orange", 0.4), pch=19)
    qqline(fdims$wgt)

qqnormsim = function(dat, dim=c(2,2)) {
  par(mfrow=dim)
  qqnorm(dat, col=adjustcolor("orange", 0.4), 
         pch=19, cex=0.7, main="Normal QQ Plot (Data)")
  qqline(dat)
  for (i in 1:(prod(dim) - 1)) {
    simnorm = rnorm(n=length(dat), mean=mean(dat), sd=sd(dat))
    qqnorm(simnorm, col=adjustcolor("orange", 0.4), 
           pch=19, cex=0.7,
           main="Normal QQ Plot (Sim)")
    qqline(simnorm)
  }
  par(mfrow=c(1, 1))
}
qqnormsim(fdims$wgt)

Пример взят из OpenIntro Statistics

Например, есть у нас следующий QQ график: http://i.stack.imgur.com/wzAUF.png Как определить, нормальное ли это распределение или нет? Сравнить с нормальным http://i.stack.imgur.com/egjnr.png Картинки выглядят по разному, значит, распределение, скорее всего, далеко от нормального. Для наглядности лучше всего сгенерировать нормальные данные несколько раз и нарисовать графики рядом http://i.stack.imgur.com/0mbtr.png В R это делается вот так: ```` load(url("http://www.openintro.org/stat/data/bdims.RData")) fdims = subset(bdims, bdims$sex == 0) qqnorm(fdims$wgt, col=adjustcolor("orange", 0.4), pch=19) qqline(fdims$wgt) qqnormsim = function(dat, dim=c(2,2)) { par(mfrow=dim) qqnorm(dat, col=adjustcolor("orange", 0.4), pch=19, cex=0.7, main="Normal QQ Plot (Data)") qqline(dat) for (i in 1:(prod(dim) - 1)) { simnorm = rnorm(n=length(dat), mean=mean(dat), sd=sd(dat)) qqnorm(simnorm, col=adjustcolor("orange", 0.4), pch=19, cex=0.7, main="Normal QQ Plot (Sim)") qqline(simnorm) } par(mfrow=c(1, 1)) } qqnormsim(fdims$wgt) ```` Пример взят из [OpenIntro Statistics](http://www.openintro.org/ )
360
просмотров
1
ответов
2
подписчики
Предпросмотр
введите как минимим 10 characters
WARNING: You mentioned %MENTIONS%, but they cannot see this message and will not be notified
Сохраняю...
Сохранено
Все темы будут удалено ?
Сохранены неопубликованные черновики. Нажмите для продолжения редактирования
Discard draft