--- title: "lab3" author: "Dariusz Majerek" date: "`r Sys.Date()`" output: word_document: default pdf_document: default html_document: default editor_options: chunk_output_type: console --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = T, warning = F, message = F) ``` # Zadanie 1 Wyznacz 1000 30-elementowych prób ze zbioru `flights`, a następnie wynzacz na ich podstawie 95%-we przedziały ufności dla średniej zmiennej `dep_delay`. ```{r} library(tidyverse) library(nycflights13) library(knitr) head(flights) %>% kable(digits = 2, booktabs=T) ``` ## Wyznacznie podprób ```{r} proby <- replicate(n = 1000, expr = sample_n(tbl = flights, size = 30, replace = F), simplify = F) ``` ## Wyznaczanie średnich z prób ```{r} # średnie srednie <- proby %>% map_dbl(~mean(.x$dep_delay, na.rm = T)) ``` ## Wyres rozkładu cechy dep_delay ```{r} flights %>% ggplot(aes(dep_delay))+ geom_histogram() ``` Z wykresu histogramu widać, że rozkład badanej cechy jest prawostronnie asymetryczny. ```{r} skosnosc <- e1071::skewness(flights$dep_delay, na.rm = T) skosnosc ``` Wartość statystyki skosnosc potwierdza bardzo wyraźną asymetrię prawostronną. ## Wykres rozkładu średnich ```{r} as.data.frame(srednie) %>% ggplot(aes(srednie))+ geom_histogram() ``` Nawet rozkład średnich z 1000 wylosowanych prób charakteryzuje się prawostronną asymetrią. ```{r} skosnosc2 <- e1071::skewness(srednie) skosnosc2 ``` ## Wyznaczenie przedziałów ufności dla prób ```{r} # proby %>% # map(function(x) c(t.test(x$dep_delay)$conf.int[1], t.test(x$dep_delay)$conf.int[2])) # to samo ale inaczej ci <- proby %>% map(function(x) t.test(x$dep_delay)$conf.int[1:2]) ``` ## Sprawdzenie, które przedziały zawierają prawdziwą wartość $\mu$ ```{r} mu <- mean(flights$dep_delay, na.rm = T) mu ``` ```{r} czy.nalezy <- function(x) ifelse(x[1]mu, 1, 0) ci %>% map_dbl(~czy.nalezy(.x)) %>% mean ``` ## Zastosowanie poprawki Cochrana ```{r} sk1 <- e1071::skewness(proby[[1]]$dep_delay) sk1 ```