Podstawy Statystycznej Analizy Danych

Prowadzący: dr Piotr ŚLIWKA (UKSW)
Liczebność grup: max. 16 osób (decyduje kolejność zapisów internetowych)
Wymogi sprzętowe: własny laptop (max. 2 osoby przy komputerze), zainstalowane programy: Excel, SPSS, R.
Miejsce: Laboratorium Cyfrowe Humanistyki UW, ul. S. Banacha 2c (budynek CeNT-1), II piętro, moduł B.
I cykl, intensywny, 01.01.1001 - 03.01.1001 6 h dziennie

Terminy (przerwa międzysemestralna): 6 II (sb), 8-9 II (pn-wt), 13 II (sb), 15 II (pn) w godz. 10.00-11.30, 11.45-13.15 oraz 13.30-15.00

II cykl, cotygodniowy, 01.01.1001 - 03.01.1001 4h

Terminy (II semestr, poniedziałki) – 22 II, 29 II, 7 III, 14 III, 21 III, 4 IV, 11 IV. prawdopodobnie w godz. 16.15-17.45 oraz 18.00-19.30.

Program ramowy:

1. Metody i organizacja badań statystycznych. Charakterystyka danych i zbioru danych, własności, prezentacja liczbowa i graficzna, pomiar. (2h)
2. Podstawy statystyki opisowej (4h):
a) miary tendencji centralnej: średnia arytmetyczna, dominanta, kwantyle, kwartyle, mediana,
b) miary rozproszenia: rozstęp, wariancja, odchylenie standardowe, typowy obszar zmienności, klasyczny współczynnik zmienności, odchylenie ćwiartkowe (kwartylowe),
c) miary kształtu rozkładu: współczynnik skośności Pearsona, klasyczny współczynnik zmienności, pozycyjny współczynnik asymetrii, współczynnik kurtozy, d) miary koncentracji, krzywa Lorenza, współczynnik koncentracji Giniego, porównywanie rozkładów, miary klasyczne i pozycyjne.
3. Opis współzależności zjawisk. Rodzaje współzależności. Szereg, tablica korelacyjna. Kierunek i siła korelacji liniowej. Kowariancja i współczynnik korelacji Pearsona, rang Spearmana (korelacja kolejnościowa). (2h)
4. Rozkłady parametryczne i nieparametryczne. Statystyczne testy istotności– hipotezy, rodzaje błędów. Klasyfikacja (4h):
a) parametryczne (dotyczące np. średniej, wariancji, wskaźnika proporcji) oraz nieparametryczne (badające np. „normalność”, zgodność, jednorodność, niezależność,…),
b) względem liczby prób: jednej, dwu lub więcej prób.
5. Szeregi czasowe: trend (tendencja rozwojowa), wahania sezonowe (okresowe), wahania przypadkowe, przykłady szeregów. (2h)
6. Regresja (budowa modelu, postać, estymatory, testy). Typy: prosta, wieloraka, krokowa, nieliniowa, logistyczna. Modele trendu. Modele wielowymiarowe (m.in. SEM). (4h)
7. Analiza wariancji (ANOVA/MANOVA). Analiza kowariancji. Powtarzane pomiary. Uogólniony model liniowy. (4h)
8. Metody grupowania i redukcji wymiaru: analiza dyskryminacyjna, analiza skupień, metoda głównych składowych, analiza czynnikowa (eksploracyjna, konfirmacyjna). (6h)