SlideShare une entreprise Scribd logo
1  sur  1
Télécharger pour lire hors ligne
КІЛЬКІСНИЙ АНАЛІЗ ДАНИХ
ОДНОВИМІРНИЙ
• 1 змінна
• Вік, стать, статус тестування
ДВОВИМІРНИЙ
• 2 змінні
• Стать та статус тестування
БАГАТОВИМІРНИЙ
• >2 змінних
• Вік, стать та статус тестування
	
  Інтервальна	
  шкала?	
  
•  Перевірка	
  
нормального	
  
розподілу	
  
•  гістограма	
  
•  QQ-­‐графік	
  
•  Якщо	
  розподіл	
  
близький	
  до	
  
нормального:	
  
•  Середнє	
  
значення	
  
•  Стандартне	
  
відхилення	
  
	
  
Порядкова	
  шкала?	
  
Чи	
  інтервальна	
  без	
  
нормального	
  
розподілу?	
  
•  Медіана	
  
•  Міжквартильна	
  
відстань	
  
•  Відсотки	
  (якщо	
  
шкала	
  Лайкерта	
  –	
  5	
  
категорій)	
  
	
  
Номінальна	
  шкала?	
  
•  Відсотки	
  
+	
  Робота	
  з	
  
пропущеними	
  
значеннями	
  
+	
  Трансформація	
  /	
  
перекодування	
  
змінних	
  
	
  
ІНТЕРПРЕТАЦІЯ:	
  
•  опис	
  обраних	
  
змінних	
  для	
  
аналізу	
  у	
  термінах	
  
категорій	
  відповіді	
  
•  розуміння,	
  що	
  є	
  
пропущеними	
  
значеннями,	
  які	
  
фільтри	
  можуть	
  
знадобитися,	
  як	
  
треба	
  
трансформувати/
перекодувати	
  
змінні	
  для	
  
подальшого	
  
аналізу	
  
	
  
Шукаємо	
  рівень	
  зв’язку	
  між	
  двома	
  
змінними	
  з	
  інтервальною	
  чи	
  порядковою	
  
шкалою?	
  
•  Перевірка	
  лінійності	
  зв’язку	
  
•  точковий	
  графік	
  
•  Якщо	
  лінійний:	
  Кореляції	
  
•  Кореляція	
  Пірсона,	
  якщо	
  2	
  змінні	
  з	
  
інтервальною	
  шкалою	
  
•  Кореляція	
  Спірмена	
  якщо	
  2	
  змінні	
  з	
  
порядковою	
  шкалою	
  або	
  порядкова
+інтервальна	
  шкала	
  
•  Якщо	
  нелінійний:	
  регресійний	
  коефіцієнт	
  
	
  
Шукаємо	
  відмінності	
  у	
  середніх	
  значеннях/
медіанах?	
  Порівнюємо	
  значення	
  
інтервальної/порядкової	
  змінної	
  по	
  
категоріях	
  номінальної	
  змінної.	
  
-­‐	
  Якщо	
  2	
  групи	
  порівняння:	
  
•  Змінна,	
  що	
  порівнюється,	
  з	
  інтервальною	
  
шкалою	
  та	
  нормальним	
  розподілом?	
  
•  Independent	
  samples	
  t-­‐test	
  (Т-­‐тест	
  для	
  
незалежних	
  груп)	
  
•  Paired	
  samples	
  t-­‐test	
  (Т-­‐тест	
  для	
  
залежних	
  груп)	
  
•  Змінна,	
  що	
  порівнюється,	
  з	
  порядковою	
  	
  
шкалою	
  чи	
  ненормальним	
  розподілом?	
  
•  Mann-­‐Whitney	
  U-­‐Test	
  (U-­‐тест	
  Манна-­‐
Уітні)	
  для	
  незалежних	
  груп	
  
•  Wilcoxon	
  test	
  (Тест	
  Уілкоксона)	
  для	
  
залежних	
  груп	
  
	
  
-­‐	
  Якщо	
  3	
  чи	
  більше	
  груп	
  порівняння:	
  
•  Змінна,	
  що	
  порівнюється,	
  з	
  інтервальною	
  
шкалою	
  та	
  нормальним	
  розподілом?	
  
•  One-­‐way	
  ANOVA	
  (однофакторний	
  
дисперсійний	
  аналіз)	
  для	
  незалежних	
  
груп	
  
•  Repeated-­‐measures	
  ANOVA	
  
(дисперсійний	
  аналіз	
  для	
  повторних	
  
вимірів)	
  для	
  залежних	
  груп	
  
•  Змінна,	
  що	
  порівнюється,	
  з	
  порядковою	
  	
  
шкалою	
  чи	
  ненормальним	
  розподілом?	
  
•  Kruskal-­‐Wallis	
  test	
  (Тест	
  Краскела-­‐
Уолліса)	
  для	
  незалежних	
  груп	
  
•  Friedman	
  test	
  (Тест	
  Фрідмана)	
  для	
  
залежних	
  груп	
  
	
  
Шукаємо	
  відмінності	
  у	
  відсотках?	
  
Порівнюємо	
  змінні	
  з	
  номінальною	
  шкалою.	
  
•  Якщо	
  2	
  незалежні	
  групи	
  
•  Chi-­‐square	
  test	
  	
  (тест	
  Хі-­‐квадрат)	
  для	
  
великих	
  вибірок	
  
•  Fisher's	
  test	
  	
  (тест	
  Фішера)	
  для	
  
маленьких	
  вибірок	
  
•  Якщо	
  2	
  залежні	
  групи	
  	
  
•  McNemar's	
  test	
  (тест	
  МакНемара)	
  
•  Якщо	
  3	
  та	
  більше	
  незалежних	
  груп	
  
•  Chi-­‐square	
  test	
  (тест	
  Хі-­‐квадрат)	
  
•  	
  Якщо	
  3	
  та	
  більше	
  залежних	
  груп	
  
•  Cochrane	
  Q	
  test	
  (Q	
  тест	
  Кохрена)	
  
	
  
Шукаємо	
  відмінності	
  у	
  часі	
  до	
  події	
  
(інтервальна	
  змінна)	
  серед	
  2х	
  чи	
  більше	
  
груп	
  (номінальна	
  шкала)?	
  	
  
•  Log-­‐rank	
  test	
  (Тест	
  Логранка)	
  
•  Криві	
  Каплана-­‐Мейера	
  
	
  
ІНТЕРПРЕТАЦІЯ:	
  
•  Наявність/відсутність	
  відмінностей	
  /
зв’язку	
  (H0=відсутність)	
  
•  Які	
  змінні	
  включати	
  у	
  подальший	
  аналіз	
  
Аналіз	
  залежностей?	
  Є	
  
залежна	
  та	
  незалежна(і)	
  
змінна(і)	
  
•  Що	
  є	
  залежною	
  змінною?	
  
•  Дихотомічна	
  
номінальна	
  шкала	
  	
  -­‐>	
  
логістична	
  регресія	
  
•  Номінальна	
  шкала,	
  3	
  чи	
  
більше	
  категорій	
  
відповіді	
  -­‐>	
  
мультиномінальна	
  
регресія	
  
•  Порядкова	
  шкала	
  -­‐>	
  	
  
порядкова	
  регресія	
  
•  Інтервальна	
  шкала	
  та	
  
нормальний	
  розподіл	
  	
  	
  	
  
-­‐>	
  лінійна	
  регресія	
  
•  Інтервальна	
  шкала	
  та	
  
розподіл	
  Пуассона	
  -­‐>	
  
регресія	
  Пуассона	
  або	
  
негативна	
  
біномінальна	
  регресія	
  
•  Інтервальна	
  шкала,	
  час	
  
до	
  події	
  -­‐>	
  регресія	
  
Кокса	
  
•  Інтервальна	
  шкала,	
  
часовий	
  ряд	
  (t>30)	
  -­‐>	
  
лінійна	
  регресія	
  для	
  
часових	
  рядів,	
  ARIMA	
  
	
  
Аналіз	
  взаємозалежностей?	
  	
  
-­‐  Якщо	
  треба	
  побудувати	
  
латентну	
  змінну	
  
•  PCA	
  (Метод	
  головних	
  
компонент)	
  –	
  нема	
  гіпотез	
  
про	
  латентні	
  змінні	
  
•  Конфірматорний	
  
факторний	
  аналіз	
  –	
  є	
  
гіпотези	
  про	
  латентні	
  
змінні	
  
-­‐  Якщо	
  змінні	
  є	
  одночасно	
  
залежними	
  та	
  
незалежними,	
  ланцюжки	
  
причинності	
  
•  SEM	
  (моделювання	
  
структурними	
  рівняннями)	
  
	
  
	
  
ІНТЕРПРЕТАЦІЯ:	
  
•  Наявність/відсутність	
  
зв’язків	
  (H0=відсутність),	
  їх	
  
міра	
  та	
  напрям	
  
•  Конфаундінг	
  та	
  інтеракції	
  
•  Прогнозування	
  за	
  різних	
  
сценаріїв	
  
•  Якість	
  моделей	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  
	
  

Contenu connexe

Dernier

1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україни
1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україни1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україни
1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україниDenys94
 
1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?
1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?
1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?Denys94
 
Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...
Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...
Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...Denys94
 
1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...
1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...
1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...Denys94
 
1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...
1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...
1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...Denys94
 
1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...
1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...
1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...Denys94
 
Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...
Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...
Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...Denys94
 
Логвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptx
Логвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptxЛогвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptx
Логвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptxDenys94
 

Dernier (8)

1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україни
1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україни1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україни
1192-4063-1-SP.pdf Моделювання інвестиційної привабливості регіонів україни
 
1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?
1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?
1242-4086-1-SP.pptx Чи є «Гонка поступок» окремим випадком «дилеми в’язня»?
 
Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...
Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...
Презентація.pdf Особливості застосування об’єктно-орієнтованого програмування...
 
1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...
1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...
1247-4099-1-SP.pdf Інноваційні та цифрові технологій для відновлення агропрод...
 
1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...
1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...
1258-4122-1-SP.pdf Застосування консольного меню для взаємодії з банківською ...
 
1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...
1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...
1197-4004-1-SP.pdf Економетричний аналіз туристичної привабливості регіонів У...
 
Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...
Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...
Презентація Отенко І.П., Подорожна М.pptx Оцінка факторів формування та позиц...
 
Логвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptx
Логвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptxЛогвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptx
Логвіненко_ЦИФРОВІ_МАНІПУЛЯЦІЇ_В_ЕПОХУ_ШТУЧНОГО_ІНТЕЛЕКТУ.pptx
 

Резюме методів аналізу кількісних даних

  • 1. КІЛЬКІСНИЙ АНАЛІЗ ДАНИХ ОДНОВИМІРНИЙ • 1 змінна • Вік, стать, статус тестування ДВОВИМІРНИЙ • 2 змінні • Стать та статус тестування БАГАТОВИМІРНИЙ • >2 змінних • Вік, стать та статус тестування  Інтервальна  шкала?   •  Перевірка   нормального   розподілу   •  гістограма   •  QQ-­‐графік   •  Якщо  розподіл   близький  до   нормального:   •  Середнє   значення   •  Стандартне   відхилення     Порядкова  шкала?   Чи  інтервальна  без   нормального   розподілу?   •  Медіана   •  Міжквартильна   відстань   •  Відсотки  (якщо   шкала  Лайкерта  –  5   категорій)     Номінальна  шкала?   •  Відсотки   +  Робота  з   пропущеними   значеннями   +  Трансформація  /   перекодування   змінних     ІНТЕРПРЕТАЦІЯ:   •  опис  обраних   змінних  для   аналізу  у  термінах   категорій  відповіді   •  розуміння,  що  є   пропущеними   значеннями,  які   фільтри  можуть   знадобитися,  як   треба   трансформувати/ перекодувати   змінні  для   подальшого   аналізу     Шукаємо  рівень  зв’язку  між  двома   змінними  з  інтервальною  чи  порядковою   шкалою?   •  Перевірка  лінійності  зв’язку   •  точковий  графік   •  Якщо  лінійний:  Кореляції   •  Кореляція  Пірсона,  якщо  2  змінні  з   інтервальною  шкалою   •  Кореляція  Спірмена  якщо  2  змінні  з   порядковою  шкалою  або  порядкова +інтервальна  шкала   •  Якщо  нелінійний:  регресійний  коефіцієнт     Шукаємо  відмінності  у  середніх  значеннях/ медіанах?  Порівнюємо  значення   інтервальної/порядкової  змінної  по   категоріях  номінальної  змінної.   -­‐  Якщо  2  групи  порівняння:   •  Змінна,  що  порівнюється,  з  інтервальною   шкалою  та  нормальним  розподілом?   •  Independent  samples  t-­‐test  (Т-­‐тест  для   незалежних  груп)   •  Paired  samples  t-­‐test  (Т-­‐тест  для   залежних  груп)   •  Змінна,  що  порівнюється,  з  порядковою     шкалою  чи  ненормальним  розподілом?   •  Mann-­‐Whitney  U-­‐Test  (U-­‐тест  Манна-­‐ Уітні)  для  незалежних  груп   •  Wilcoxon  test  (Тест  Уілкоксона)  для   залежних  груп     -­‐  Якщо  3  чи  більше  груп  порівняння:   •  Змінна,  що  порівнюється,  з  інтервальною   шкалою  та  нормальним  розподілом?   •  One-­‐way  ANOVA  (однофакторний   дисперсійний  аналіз)  для  незалежних   груп   •  Repeated-­‐measures  ANOVA   (дисперсійний  аналіз  для  повторних   вимірів)  для  залежних  груп   •  Змінна,  що  порівнюється,  з  порядковою     шкалою  чи  ненормальним  розподілом?   •  Kruskal-­‐Wallis  test  (Тест  Краскела-­‐ Уолліса)  для  незалежних  груп   •  Friedman  test  (Тест  Фрідмана)  для   залежних  груп     Шукаємо  відмінності  у  відсотках?   Порівнюємо  змінні  з  номінальною  шкалою.   •  Якщо  2  незалежні  групи   •  Chi-­‐square  test    (тест  Хі-­‐квадрат)  для   великих  вибірок   •  Fisher's  test    (тест  Фішера)  для   маленьких  вибірок   •  Якщо  2  залежні  групи     •  McNemar's  test  (тест  МакНемара)   •  Якщо  3  та  більше  незалежних  груп   •  Chi-­‐square  test  (тест  Хі-­‐квадрат)   •   Якщо  3  та  більше  залежних  груп   •  Cochrane  Q  test  (Q  тест  Кохрена)     Шукаємо  відмінності  у  часі  до  події   (інтервальна  змінна)  серед  2х  чи  більше   груп  (номінальна  шкала)?     •  Log-­‐rank  test  (Тест  Логранка)   •  Криві  Каплана-­‐Мейера     ІНТЕРПРЕТАЦІЯ:   •  Наявність/відсутність  відмінностей  / зв’язку  (H0=відсутність)   •  Які  змінні  включати  у  подальший  аналіз   Аналіз  залежностей?  Є   залежна  та  незалежна(і)   змінна(і)   •  Що  є  залежною  змінною?   •  Дихотомічна   номінальна  шкала    -­‐>   логістична  регресія   •  Номінальна  шкала,  3  чи   більше  категорій   відповіді  -­‐>   мультиномінальна   регресія   •  Порядкова  шкала  -­‐>     порядкова  регресія   •  Інтервальна  шкала  та   нормальний  розподіл         -­‐>  лінійна  регресія   •  Інтервальна  шкала  та   розподіл  Пуассона  -­‐>   регресія  Пуассона  або   негативна   біномінальна  регресія   •  Інтервальна  шкала,  час   до  події  -­‐>  регресія   Кокса   •  Інтервальна  шкала,   часовий  ряд  (t>30)  -­‐>   лінійна  регресія  для   часових  рядів,  ARIMA     Аналіз  взаємозалежностей?     -­‐  Якщо  треба  побудувати   латентну  змінну   •  PCA  (Метод  головних   компонент)  –  нема  гіпотез   про  латентні  змінні   •  Конфірматорний   факторний  аналіз  –  є   гіпотези  про  латентні   змінні   -­‐  Якщо  змінні  є  одночасно   залежними  та   незалежними,  ланцюжки   причинності   •  SEM  (моделювання   структурними  рівняннями)       ІНТЕРПРЕТАЦІЯ:   •  Наявність/відсутність   зв’язків  (H0=відсутність),  їх   міра  та  напрям   •  Конфаундінг  та  інтеракції   •  Прогнозування  за  різних   сценаріїв   •  Якість  моделей