Počet záznamů: 1
Zpracování velkého objemu dat pomocí technologie Hadoop
Údaje o názvu Zpracování velkého objemu dat pomocí technologie Hadoop [rukopis] / Petr Zifčák Další variantní názvy Zpracování velkého objemu dat pomocí technologie Hadoop Osobní jméno Zifčák, Petr (autor diplomové práce nebo disertace) Překl.náz Processing large volumes of data using Hadoop technology Vyd.údaje 2019 Fyz.popis 61 + DVD Poznámka Ved. práce Stanislav Opichal Oponent Jan Tříska Dal.odpovědnost Opichal, Stanislav (vedoucí diplomové práce nebo disertace) Tříska, Jan (oponent) Dal.odpovědnost Univerzita Palackého. Katedra informatiky (udelovatel akademické hodnosti) Klíč.slova Hadoop * Big Data * Hive * Gis Tools for Hadoop * PostGIS * distribuované úložište * cluster * Hadoop * Big Data * Hive * Gis Tools for Hadoop * PostGIS * distributed storage * cluster Forma, žánr bakalářské práce bachelor's theses MDT (043)378.22 Země vyd. Česko Jazyk dok. čeština Druh dok. PUBLIKAČNÍ ČINNOST Titul Bc. Studijní program Bakalářský Studijní program Informatika Studijní obor Aplikovaná informatika kniha
Kvalifikační práce Staženo Velikost datum zpřístupnění 00225302-856457970.pdf 36 1.2 MB 20.08.2019 Posudek Typ posudku 00225302-ved-425029059.pdf Posudek vedoucího 00225302-opon-184519226.pdf Posudek oponenta
Apache Hadoop zahrnuje technologie pro zpracování velkých objemů dat v distribuovaném prostředí výpočetních zdrojů. V úvodních partiích práce jsou popsány principy fungování systému a jeho základních komponent. Následuje porovnání s jinými datovými úložišti, zejména relačními databázemi. Stěžejní částí je řešení praktického případu užití systému - zpracování dat z oblasti geografických informačních systémů. Výsledkem je návrh vlastního clusteru, instalace systému včetně potřebných komponent a porovnání výkonu s relační databází PostgreSQL.Apache Hadoop includes technologies for processing large volumes of data in a distributed computing resource environment. The introductory parts of the thesis describe the principles of the system and its basic components. The following is a comparison with other data stores, especially relational databases. The key part is the solution of the practical use case of the system - processing of data from geographic information systems. The result is a custom cluster design, system installation, including required components, and performance comparisons with the PostgreSQL relational database.
Počet záznamů: 1