Number of the records: 1

Zpracování velkého objemu dat pomocí technologie Hadoop

Title statement	Zpracování velkého objemu dat pomocí technologie Hadoop [rukopis] / Petr Zifčák
Additional Variant Titles	Zpracování velkého objemu dat pomocí technologie Hadoop
Personal name	Zifčák, Petr (dissertant)
Translated title	Processing large volumes of data using Hadoop technology
Issue data	2019
Phys.des.	61 + DVD
Note	Ved. práce Stanislav Opichal
	Oponent Jan Tříska
Another responsib.	Opichal, Stanislav (thesis advisor)
	Tříska, Jan (opponent)
Another responsib.	Univerzita Palackého. Katedra informatiky (degree grantor)
Keywords	Hadoop * Big Data * Hive * Gis Tools for Hadoop * PostGIS * distribuované úložište * cluster * Hadoop * Big Data * Hive * Gis Tools for Hadoop * PostGIS * distributed storage * cluster
Form, Genre	bakalářské práce bachelor's theses
UDC	(043)378.22
Country	Česko
Language	čeština
Document kind	PUBLIKAČNÍ ČINNOST
Title	Bc.
Degree program	Bakalářský
Degree program	Informatika
Degreee discipline	Aplikovaná informatika

book

Kvalifikační práce	Downloaded	Size	datum zpřístupnění
00225302-856457970.pdf	35	1.2 MB	20.08.2019

Posudek	Typ posudku
00225302-ved-425029059.pdf	Posudek vedoucího
00225302-opon-184519226.pdf	Posudek oponenta

Resumé
Citace PRO

Apache Hadoop zahrnuje technologie pro zpracování velkých objemů dat v distribuovaném prostředí výpočetních zdrojů. V úvodních partiích práce jsou popsány principy fungování systému a jeho základních komponent. Následuje porovnání s jinými datovými úložišti, zejména relačními databázemi. Stěžejní částí je řešení praktického případu užití systému - zpracování dat z oblasti geografických informačních systémů. Výsledkem je návrh vlastního clusteru, instalace systému včetně potřebných komponent a porovnání výkonu s relační databází PostgreSQL.Apache Hadoop includes technologies for processing large volumes of data in a distributed computing resource environment. The introductory parts of the thesis describe the principles of the system and its basic components. The following is a comparison with other data stores, especially relational databases. The key part is the solution of the practical use case of the system - processing of data from geographic information systems. The result is a custom cluster design, system installation, including required components, and performance comparisons with the PostgreSQL relational database.

citace PRO

Number of the records: 1