Logo bs.boatexistence.com

Koje su mane imputiranja vrijednosti koje nedostaju sa srednjom?

Sadržaj:

Koje su mane imputiranja vrijednosti koje nedostaju sa srednjom?
Koje su mane imputiranja vrijednosti koje nedostaju sa srednjom?

Video: Koje su mane imputiranja vrijednosti koje nedostaju sa srednjom?

Video: Koje su mane imputiranja vrijednosti koje nedostaju sa srednjom?
Video: Я есть. Ты есть. Он есть_Рассказ_Слушать 2024, Maj
Anonim

Srednja imputacija iskrivljuje odnose između varijabli Ali srednja imputacija takođe iskrivljuje multivarijantne odnose i utiče na statistiku kao što je korelacija. Na primjer, sljedeći poziv PROC CORR izračunava korelaciju između varijable Orig_Height i varijabli Weight i Age.

Zašto je korištenje srednje vrijednosti za podatke koji nedostaju loša ideja?

Mean smanjuje varijansu podataka Ući dublje u matematiku, manja varijansa dovodi do užeg intervala povjerenja u distribuciji vjerovatnoće[3]. Ovo ne vodi ničemu drugom osim uvođenju pristranosti u naš model.

Zašto su nedostajuće vrijednosti problem?

Nedostajući podaci predstavljaju razne probleme. Prvo, odsustvo podataka smanjuje statističku snagu, što se odnosi na vjerovatnoću da će test odbiti nultu hipotezu kada je netačna. Drugo, izgubljeni podaci mogu uzrokovati pristrasnost u procjeni parametara. Treće, može smanjiti reprezentativnost uzoraka.

Zašto je zlobna imputacija loša?

Problem 1: Srednja vrijednost imputacija ne čuva odnose među varijablama. Istina, imputiranje srednje vrijednosti čuva srednju vrijednost promatranih podataka. Dakle, ako podaci potpuno nasumično nedostaju, procjena srednje vrijednosti ostaje nepristrasna.

Da li biste trebali zamijeniti podatke koji nedostaju srednjom vrijednosti?

Outliers data tačke će imati značajan uticaj na srednju vrijednost i stoga, u takvim slučajevima, ne preporučuje se korištenje srednje vrijednosti za zamjenu vrijednosti koje nedostaju. Korištenje srednjih vrijednosti za zamjenu vrijednosti koje nedostaju možda neće stvoriti odličan model i stoga se isključuje.

Preporučuje se: