Počet záznamů: 1
Vizualizace geograficky orientovaných Big data
Údaje o názvu Vizualizace geograficky orientovaných Big data [rukopis] / Ondřej Tomečka Další variantní názvy Vizualizace geograficky orientovaných Big data Osobní jméno Tomečka, Ondřej, (autor diplomové práce nebo disertace) Překl.náz Visualization of Geographically-oriented Big Data Vyd.údaje 2018 Fyz.popis 49 s. : tab. + 1 návod, 1 licenční smlouva, 1 poster, 1 DVD Poznámka Ved. práce Rostislav Nétek Oponent Jan Brus Dal.odpovědnost Nétek, Rostislav, 1985- (vedoucí diplomové práce nebo disertace) Brus, Jan, 1982- (oponent) Dal.odpovědnost Univerzita Palackého. Katedra geoinformatiky (udelovatel akademické hodnosti) Klíč.slova big data * apache hadoop * gis tools for hadoop * vizualizace dat * javascript * big data * apache hadoop * gis tools for hadoop * data visualization * javascript Forma, žánr bakalářské práce bachelor's theses MDT (043)378.22 Země vyd. Česko Jazyk dok. čeština Druh dok. PUBLIKAČNÍ ČINNOST Titul Bc. Studijní program Bakalářský Studijní program Geografie Studijní obor Geoinformatika a geografie kniha
Kvalifikační práce Staženo Velikost datum zpřístupnění 00220181-516362054.pdf 14 2.5 MB 10.05.2018 Posudek Typ posudku 00220181-ved-211628942.pdf Posudek vedoucího 00220181-opon-533072637.pdf Posudek oponenta
Tato bakalářská práce se v teoretické části zaměřuje na popis charakteristik paradigmatu Big Data. Dále jsou popsány dostupné velkoobjemové datové sady, způsob ukládání velkých objemů dat v distribuovaném souborovém systému, dostupné technologie pro jejich efektivní zpracování, populární distribuce Apache Hadoop frameworku a Hadoop ekosystém jako takový. Pro demonstraci odlišnosti zpracování Big Data oproti konvenčnímu zpracování geodat pracuje autor v praktické části práce s Hadoop distribucí Hortonworks Data Platform a jsou představeny nástroje GIS Tools for Hadoop na příkladu agregace taxi záznamů z New York City do čtvercové sítě. Na tomto příkladu byla otestována i doba potřebná pro dokončení agregace při použití různých rozlišení výsledné čtvercové sítě na dvou výkonnostně odlišných virtuálních počítačích. Další část práce se zaměřuje na vizualizaci dat pomocí JavaScriptových knihoven pro shlukování bodů a tvorbu heatmap a testování, za jak dlouho jsou tyto knihovny schopny vykreslit objemnější datové sady.The theoretical part of this bachelor thesis describes the common characteristics of the Big Data paradigm. It sums up the available data sources of large geospatial datasets, describes how file storage works in distributed file systems, available technologies to effectively process large datasets, the most popular Apache Hadoop distributions and the Hadoop ecosystem as a whole. To demonstrate the differences in processing Big Data compared to conventional processing of geospatial data, the author uses Apache Hadoop distribution Hortonworks Data Platform and GIS Tools for Hadoop to aggregate taxi trip records from New York City into a square grid. The author also tests the impact of using different spatial resolutions of the square bins on the computation time on two virtual machine configurations with different specifications. The next part focuses on data visualization using JavaScript libraries for marker clustering and heatmaps and testing their rendering time when used with larger datasets.
Počet záznamů: 1