Number of the records: 1  

Vizualizace geograficky orientovaných Big data

  1. Title statementVizualizace geograficky orientovaných Big data [rukopis] / Ondřej Tomečka
    Additional Variant TitlesVizualizace geograficky orientovaných Big data
    Personal name Tomečka, Ondřej, (dissertant)
    Translated titleVisualization of Geographically-oriented Big Data
    Issue data2018
    Phys.des.49 s. : tab. + 1 návod, 1 licenční smlouva, 1 poster, 1 DVD
    NoteVed. práce Rostislav Nétek
    Oponent Jan Brus
    Another responsib. Nétek, Rostislav, 1985- (thesis advisor)
    Brus, Jan (opponent)
    Another responsib. Univerzita Palackého. Katedra geoinformatiky (degree grantor)
    Keywords big data * apache hadoop * gis tools for hadoop * vizualizace dat * javascript * big data * apache hadoop * gis tools for hadoop * data visualization * javascript
    Form, Genre bakalářské práce bachelor's theses
    UDC (043)378.22
    CountryČesko
    Languagečeština
    Document kindPUBLIKAČNÍ ČINNOST
    TitleBc.
    Degree programBakalářský
    Degree programGeografie
    Degreee disciplineGeoinformatika a geografie
    book

    book

    Kvalifikační práceDownloadedSizedatum zpřístupnění
    00220181-516362054.pdf142.5 MB10.05.2018
    PosudekTyp posudku
    00220181-ved-211628942.pdfPosudek vedoucího
    00220181-opon-533072637.pdfPosudek oponenta

    Tato bakalářská práce se v teoretické části zaměřuje na popis charakteristik paradigmatu Big Data. Dále jsou popsány dostupné velkoobjemové datové sady, způsob ukládání velkých objemů dat v distribuovaném souborovém systému, dostupné technologie pro jejich efektivní zpracování, populární distribuce Apache Hadoop frameworku a Hadoop ekosystém jako takový. Pro demonstraci odlišnosti zpracování Big Data oproti konvenčnímu zpracování geodat pracuje autor v praktické části práce s Hadoop distribucí Hortonworks Data Platform a jsou představeny nástroje GIS Tools for Hadoop na příkladu agregace taxi záznamů z New York City do čtvercové sítě. Na tomto příkladu byla otestována i doba potřebná pro dokončení agregace při použití různých rozlišení výsledné čtvercové sítě na dvou výkonnostně odlišných virtuálních počítačích. Další část práce se zaměřuje na vizualizaci dat pomocí JavaScriptových knihoven pro shlukování bodů a tvorbu heatmap a testování, za jak dlouho jsou tyto knihovny schopny vykreslit objemnější datové sady.The theoretical part of this bachelor thesis describes the common characteristics of the Big Data paradigm. It sums up the available data sources of large geospatial datasets, describes how file storage works in distributed file systems, available technologies to effectively process large datasets, the most popular Apache Hadoop distributions and the Hadoop ecosystem as a whole. To demonstrate the differences in processing Big Data compared to conventional processing of geospatial data, the author uses Apache Hadoop distribution Hortonworks Data Platform and GIS Tools for Hadoop to aggregate taxi trip records from New York City into a square grid. The author also tests the impact of using different spatial resolutions of the square bins on the computation time on two virtual machine configurations with different specifications. The next part focuses on data visualization using JavaScript libraries for marker clustering and heatmaps and testing their rendering time when used with larger datasets.

Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.