Počet záznamů: 1
Poloautomatické získávání formálních kontextů z obsahu Wikipedie
Údaje o názvu Poloautomatické získávání formálních kontextů z obsahu Wikipedie [rukopis] / Jakub Pátek Další variantní názvy Poloautomatické získávání formálních kontextů z obsahu wikipedie Osobní jméno Pátek, Jakub, (autor diplomové práce nebo disertace) Překl.náz Semiautomatic mining of formal contexts from Wikipedia Vyd.údaje 2017 Fyz.popis 32 s. + 1 DVD Poznámka Ved. práce Petr Osička Oponent Martin Trnečka Dal.odpovědnost Osička, Petr (vedoucí diplomové práce nebo disertace) Trnečka, Martin (oponent) Dal.odpovědnost Univerzita Palackého. Katedra informatiky (udelovatel akademické hodnosti) Klíč.slova formální konceptuální analýza * formální kontext * škálování * Wikipedie * regulární výraz Forma, žánr bakalářské práce bachelor's theses MDT (043)378.22 Země vyd. Česko Jazyk dok. čeština Druh dok. PUBLIKAČNÍ ČINNOST Titul Bc. Studijní program Bakalářský Studijní program Informatika Studijní obor Aplikovaná informatika kniha
Kvalifikační práce Staženo Velikost datum zpřístupnění 00218096-177403686.pdf 165 416.7 KB 10.08.2017 Posudek Typ posudku 00218096-ved-398696989.pdf Posudek vedoucího 00218096-opon-108954606.pdf Posudek oponenta
Program WikiExtractor slouží k poloautomatickému získávání tabulkových dat z obsahu Wikipedie. K článkum je možno pristupovat jak v online režimu (díky MediaWiki API), tak za pomoci výpisů v XML souborech. Úvod práce pojednává o datech - jaké typy dat je možné získat. Další část se věnuje Wikipedii a seznamuje s některými prvky jejího znackovacího jazyka. Závěrečná část textu popisuje strukturu programu, použité technologie a implementaci jeho důležitých částí.WikiExtractor is used for semi-automatic retrieval of table data from Wikipedia content. The articles can be accessed both in online mode (via the MediaWiki API) and with the help of extracts in XML files. The introduction discusses the data - what types of data can be obtained. The next section is dedicated to Wikipedia and introduces some elements of its markup language. The final part of the text describes the structure of the program, the technology used and the implementation of its important parts.
Počet záznamů: 1