Number of the records: 1
Poloautomatické získávání formálních kontextů z obsahu Wikipedie
Title statement Poloautomatické získávání formálních kontextů z obsahu Wikipedie [rukopis] / Jakub Pátek Additional Variant Titles Poloautomatické získávání formálních kontextů z obsahu wikipedie Personal name Pátek, Jakub, (dissertant) Translated title Semiautomatic mining of formal contexts from Wikipedia Issue data 2017 Phys.des. 32 s. + 1 DVD Note Ved. práce Petr Osička Oponent Martin Trnečka Another responsib. Osička, Petr (thesis advisor) Trnečka, Martin (opponent) Another responsib. Univerzita Palackého. Katedra informatiky (degree grantor) Keywords formální konceptuální analýza * formální kontext * škálování * Wikipedie * regulární výraz Form, Genre bakalářské práce bachelor's theses UDC (043)378.22 Country Česko Language čeština Document kind PUBLIKAČNÍ ČINNOST Title Bc. Degree program Bakalářský Degree program Informatika Degreee discipline Aplikovaná informatika book
Kvalifikační práce Downloaded Size datum zpřístupnění 00218096-177403686.pdf 165 416.7 KB 10.08.2017 Posudek Typ posudku 00218096-ved-398696989.pdf Posudek vedoucího 00218096-opon-108954606.pdf Posudek oponenta
Program WikiExtractor slouží k poloautomatickému získávání tabulkových dat z obsahu Wikipedie. K článkum je možno pristupovat jak v online režimu (díky MediaWiki API), tak za pomoci výpisů v XML souborech. Úvod práce pojednává o datech - jaké typy dat je možné získat. Další část se věnuje Wikipedii a seznamuje s některými prvky jejího znackovacího jazyka. Závěrečná část textu popisuje strukturu programu, použité technologie a implementaci jeho důležitých částí.WikiExtractor is used for semi-automatic retrieval of table data from Wikipedia content. The articles can be accessed both in online mode (via the MediaWiki API) and with the help of extracts in XML files. The introduction discusses the data - what types of data can be obtained. The next section is dedicated to Wikipedia and introduces some elements of its markup language. The final part of the text describes the structure of the program, the technology used and the implementation of its important parts.
Number of the records: 1