Počet záznamů: 1
Imputace chybějících hodnot v rozsáhlých datových souborech
Údaje o názvu Imputace chybějících hodnot v rozsáhlých datových souborech [rukopis] / Markéta Nárožná Další variantní názvy Imputace chybějících hodnot v rozsáhlých datových souborech Osobní jméno Nárožná, Markéta (autor diplomové práce nebo disertace) Překl.náz Imputation of missing values in large data sets Vyd.údaje 2013 Fyz.popis 64 s. : grafy Poznámka Ved. práce Karel Hron Oponent Miroslav Otáhal Dal.odpovědnost Hron, Karel, 1981- (vedoucí diplomové práce nebo disertace) Otáhal, Miroslav (oponent) Dal.odpovědnost Univerzita Palackého. Katedra matematické analýzy a aplikací matematiky (udelovatel akademické hodnosti) Klíč.slova Chybějící hodnoty * vizualizace * knihovna VIM * nahrazení průměrnou hodnotou * regresní imputace * hot-deck imputace * algoritmus k nejbližších sousedů * algoritmus IRMI * Missing values * visualization * package VIM * conditional mean imputation * unconditional mean imputation * hot-deck imputation * k-nearest neighbour algorithm * algorithm IRMI Forma, žánr diplomové práce master's theses MDT (043)378.2 Země vyd. Česko Jazyk dok. čeština Druh dok. PUBLIKAČNÍ ČINNOST Titul Mgr. Studijní program Navazující Studijní program Aplikovaná matematika Studijní obor Aplikace matematiky v ekonomii kniha
Kvalifikační práce Staženo Velikost datum zpřístupnění 00171723-712717981.pdf 94 3.3 MB 03.04.2013 Posudek Typ posudku 00171723-ved-468634001.pdf Posudek vedoucího 00171723-opon-487927562.pdf Posudek oponenta
Úvodní kapitola diplomové práce slouží k seznámení s šetřením Životní podmínky, s jeho průběhem i specifiky, jejichž znalost je pro další výklad o chybějících hodnotách a metodách imputace nezbytná. Následující kapitola pojednává o chybějících hodnotách, jsou zde definovány mechanismy vzniku chybějících hodnot. Třetí kapitola je věnována vizualizaci, jakožto modernímu přístupu k rozeznání mechanismů vzniku chybějících hodnot a také ke zvolení správné metody imputace. V úvodu čtvrté kapitoly, která nese název Imputace chybějících hodnot, najdeme klasifikaci metod imputace, dále jsou tu ve dvou podkapitolách popsány vybrané metody prosté imputace - nejprve metody jednorozměrné, poté vícerozměrné. Pátá kapitola podává stručný přehled o výskytu chybějících hodnot v šetření Životní podmínky z roku 2010. Poslední kapitola je věnována aplikaci získaných teoretických znalostí na reálná data poskytnutá Českým statistickým úřadem. Celá kapitola je přitom orientována na knihovnu VIM, jakožto na užitečný nástroj určený k vizualizaci a imputaci chybějících hodnot, který je volně dostupný v statistickém softwaru R.The first chapter of my thesis introduces database European Union - Statistics on Income and Living Conditions (EU-SILC). Knowledge of this background information is necessary for understanding to various methods of data imputation. The next chapter is focused on missing values. Mechanisms of missing values are defined there. The third chapter deals with vizualization as a modern attitude to recognition of mechanisms of missing values. The vizualization is also essential for choosing of appropriate imputation method. The fourth chapter named "Imputation of missing values" describes a classification of the various imputation methods. Moreover, there is information about simple imputation methods divided into univariate and multivariate methods. The fifth chapter provides overview of the missing values that appear in EU-SILC data set from 2010. Finally, the last chapter shows application of theoretical knowledge to real data provided by Czech statistical office. It is focused on package VIM. It has been shown to be useful tool for vizualization and missing values imputation.
Počet záznamů: 1