Number of the records: 1
Zpracování velkého objemu dat pomocí technologie Hadoop
Title statement Zpracování velkého objemu dat pomocí technologie Hadoop [rukopis] / Petr Zifčák Additional Variant Titles Zpracování velkého objemu dat pomocí technologie Hadoop Personal name Zifčák, Petr (dissertant) Translated title Processing large volumes of data using Hadoop technology Issue data 2019 Phys.des. 61 + DVD Note Ved. práce Stanislav Opichal Oponent Jan Tříska Another responsib. Opichal, Stanislav (thesis advisor) Tříska, Jan (opponent) Another responsib. Univerzita Palackého. Katedra informatiky (degree grantor) Keywords Hadoop * Big Data * Hive * Gis Tools for Hadoop * PostGIS * distribuované úložište * cluster * Hadoop * Big Data * Hive * Gis Tools for Hadoop * PostGIS * distributed storage * cluster Form, Genre bakalářské práce bachelor's theses UDC (043)378.22 Country Česko Language čeština Document kind PUBLIKAČNÍ ČINNOST Title Bc. Degree program Bakalářský Degree program Informatika Degreee discipline Aplikovaná informatika book
Kvalifikační práce Downloaded Size datum zpřístupnění 00225302-856457970.pdf 35 1.2 MB 20.08.2019 Posudek Typ posudku 00225302-ved-425029059.pdf Posudek vedoucího 00225302-opon-184519226.pdf Posudek oponenta
Apache Hadoop zahrnuje technologie pro zpracování velkých objemů dat v distribuovaném prostředí výpočetních zdrojů. V úvodních partiích práce jsou popsány principy fungování systému a jeho základních komponent. Následuje porovnání s jinými datovými úložišti, zejména relačními databázemi. Stěžejní částí je řešení praktického případu užití systému - zpracování dat z oblasti geografických informačních systémů. Výsledkem je návrh vlastního clusteru, instalace systému včetně potřebných komponent a porovnání výkonu s relační databází PostgreSQL.Apache Hadoop includes technologies for processing large volumes of data in a distributed computing resource environment. The introductory parts of the thesis describe the principles of the system and its basic components. The following is a comparison with other data stores, especially relational databases. The key part is the solution of the practical use case of the system - processing of data from geographic information systems. The result is a custom cluster design, system installation, including required components, and performance comparisons with the PostgreSQL relational database.
Number of the records: 1