\[f(x) = \cfrac {1}{\sigma \sqrt{2 \pi}} \; e^{- \: \cfrac{(x-\mu)^2}{2\sigma^2}}\]
Это кратко записывается как \(x \sim N(\mu, \sigma)\)
\(-\infty < x < +\infty\).
Площадь под всей кривой \(= 1\).
Вероятность встречи значений из определенного промежутка можно узнать, проинтегрировав функцию распределения.
\[N(0, 1)\]
\[z = \frac{x - \mu}{\sigma}\]
После стандартизации любое нормальное распределение превращается в стандартное нормальное:
\[Z \sim N(0, 1)\]
Стандартизуйте вектор 1:5
Чему после стандартизации будет равно среднее?
Стандартное отклонение?
\[z_i=\frac{x_i - \bar{x}}{s}\]
Стандартизованная величина (Z-оценка) показывает, на сколько стандартных отклонений значение отличается от среднего
После стандартизации всегда:
По оси \(X\) отложены квантили стандартного нормального распределения, по оси \(Y\) — квантили данных. Если \(x \sim N(\mu,\sigma)\), то точки лягут на прямую линию.
R
set.seed(9128) my_vector <- rnorm(n = 150, mean = 10, sd = 3) library(car) qqPlot(my_vector, id = FALSE) # квантильный график
Выполните по одному блоки кода (см. код к этой презентации).
Что вы можете сказать о свойствах распределений, изображенных на квантильных графиках?
Проверьте при помощи квантильного графика, подчиняются ли эти переменные нормальному распределению:
women
)iris
)lynx
)data("women") str(women)
## 'data.frame': 15 obs. of 2 variables: ## $ height: num 58 59 60 61 62 63 64 65 66 67 ... ## $ weight: num 115 117 120 123 126 129 132 135 139 142 ...
qqPlot(women$height, id = FALSE)
data("iris") str(iris)
## 'data.frame': 150 obs. of 5 variables: ## $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... ## $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... ## $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... ## $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ... ## $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
op <- par(mfrow = c(1, 2)) qqPlot(iris$Sepal.Length, id = FALSE) hist(iris$Sepal.Length)
par(op)
data("lynx") str(lynx)
## Time-Series [1:114] from 1821 to 1934: 269 321 585 871 1475 ...
op <- par(mfrow = c(1, 2)) qqPlot(lynx, id = FALSE) hist(lynx)
par(op)
В выборке улиток средний диаметр раковины 5 см со стандартным отклонением 1.5 см.
tres caracoles by Alberto Villen on Freeimages.com
В выборке улиток средний диаметр раковины 5 см со стандартным отклонением 1.5 см.
Z_1 <- (3 - 5) / 1.5 pnorm(q = Z_1)
## [1] 0.0912
# или то же самое pnorm(q = 3, mean = 5, sd = 1.5)
## [1] 0.0912
В выборке улиток средний диаметр раковины 5 см со стандартным отклонением 1.5 см.
Мы умеем интегрировать только влево от выбранного значения, поэтому
1 - pnorm(q = 6, mean = 5, sd = 1.5)
## [1] 0.252
В выборке улиток средний диаметр раковины 5 см со стандартным отклонением 1.5 см.
pnorm(q = 6, mean = 5, sd = 1.5) - pnorm(q = 3, mean = 5, sd = 1.5)
## [1] 0.656
Средний рост 18-летних мужчин в России 174.7 см со стандартным отклонением 6.65 см. В пилоты берут только людей с ростом от 160 до 190 см (по приказу Минтранса).
Какова вероятность того, что случайно выбранный мужчина окажется ниже 160 см?
Какова вероятность того, что случайно выбранный мужчина окажется больше 190 см?
Какова доля мужчин, не подходящих по росту в пилоты, т.е. меньше 160 и больше 190 см?
Средний рост 18-летних мужчин в России 174.7 см со стандартным отклонением 6.65 см. В пилоты берут только с ростом от 160 до 190 см (по приказу Минтранса).
Z_short <- (160 - 174.7) / 6.65 pnorm(q = Z_short)
## [1] 0.0135
# или то же самое pnorm(q = 160, mean = 174.7, sd = 6.65)
## [1] 0.0135
Средний рост 18-летних мужчин в России 174.7 см со стандартным отклонением 6.65 см. В пилоты берут только с ростом от 160 до 190 см (по приказу Минтранса).
1 - pnorm(q = 190, mean = 174.7, sd = 6.65)
## [1] 0.0107
Средний рост 18-летних мужчин в России 174.7 см со стандартным отклонением 6.65 см. В пилоты берут только с ростом от 160 до 190 см (по приказу Минтранса).
(1 - pnorm(q = 190, mean = 174.7, sd = 6.65)) + pnorm(q = 160, mean = 174.7, sd = 6.65)
## [1] 0.0242
Средний рост девушек в 16 лет — 162.2 см со стандартным отклонением 6.0 см.
В пилоты берут только людей с ростом от 160 до 190 см (по приказу Минтранса).
Какой процент девушек подходит по росту в пилоты?
Средний рост девушек в 16 лет — 162.2 см со стандартным отклонением 6.0 см.
В пилоты берут только людей с ростом от 160 до 190 см (по приказу Минтранса).
pnorm(q = 190, mean = 162.2, sd = 6.0) - pnorm(q = 160, mean = 162.2, sd = 6.0)
## [1] 0.643
Только 64.3 % девушек пройдут в пилоты по росту.
Предположим, что вес новорожденных нормально распределен со средним значением 3500 г и стандартным отклонением 600 г.
Предположим, что вес новорожденных нормально распределен со средним значением 3500 г и стандартным отклонением 600 г.
1 - pnorm(q = 3200, mean = 3500, sd = 600)
## [1] 0.691
69.1 % детей рождается с весом больше 3200г.
Предположим, что вес новорожденных нормально распределен со средним значением 3500 г и стандартным отклонением 600 г.
pnorm(q = 4500, mean = 3500, sd = 600) - pnorm(q = 2500, mean = 3500, sd = 600)
## [1] 0.904
90.4 % детей рождается с весом в пределах 2500-4500г.