Počet záznamů: 1

Software na klasifikaci textů

Údaje o názvu	Software na klasifikaci textů [rukopis] / Veronika Vlasáková
Další variantní názvy	Porovnání dokumentů z pohledu kvantitativní lingvistiky a NLP
Osobní jméno	Vlasáková, Veronika, (autor diplomové práce nebo disertace)
Překl.náz	Document comparison in terms of quantative linguistics and NLP
Vyd.údaje	2020
Fyz.popis	73 s. (82945 znaků) + 1 CD
Poznámka	Oponent Dan Faltýnek
	Ved. práce Vladimír Matlach
Dal.odpovědnost	Faltýnek, Dan, 1980- (oponent)
	Matlach, Vladimír (vedoucí diplomové práce nebo disertace)
Dal.odpovědnost	Univerzita Palackého. Katedra obecné lingvistiky (udelovatel akademické hodnosti)
Klíč.slova	Zpracování přirozeného jazyka * Python * Kvantitativní lingvistika * Klasifikace textů * Bag of words * Natural language processing * Python * Quantitative linguistics * Text classification * Bag of words
Forma, žánr	bakalářské práce bachelor's theses
MDT	(043)378.22
Země vyd.	Česko
Jazyk dok.	čeština
Druh dok.	PUBLIKAČNÍ ČINNOST
Titul	Bc.
Studijní program	Bakalářský
Studijní program	Filologie
Studijní obor	Anglická filologie - Obecná lingvistika a teorie komunikace

kniha

Kvalifikační práce	Staženo	Velikost	datum zpřístupnění
00256875-316259021.pdf	60	2.6 MB	17.08.2020

Posudek	Typ posudku
00256875-ved-579656552.pdf	Posudek vedoucího
00256875-opon-267761603.docx	Posudek oponenta

Ostatní přílohy	Velikost	Popis
00256875-other-302239520.rar	15 KB
00256875-other-963565773.rar	19.2 MB
00256875-other-549426748.rar	62.9 MB

Anotace
Citace PRO

Cílem této bakalářské práce je v programovacím jazyce Python vytvořit software, který umožní uživateli trénovat klasifikaci textů a evaluovat její výsledky. Teoretická část této práce představuje software a vysvětluje, jak ho má uživatel použít. Konkrétně je v ní popsáno, s jakými vlastnostmi software pracuje, jak se dají texty předzpracovat, jak vyhodnotit výsledky použitých metod a jak software nainstalovat a nastavit. V praktické části této práce je ukázáno, jak software pracuje s konkrétními problémy. Vyzkoušeno je několik různých druhů klasifikace textů. Jedná se o rozpoznání jazyka, a to u náhodně vybraných jazyků a jazyků ze stejné rodiny, určení autorství u profesionálních autorů a u neprofesionálních autorů, rozpoznání sentimentu a rozpoznání spamu. Výsledky jednotlivých klasifikací textů jsou poté evaluovány. Závěr celou práci shrnuje a představuje možnosti dalšího rozšíření a zlepšení softwaru.The aim of this bachelor thesis is to create software in the programing language Python, which would allow the user to train text classification and evaluate its results. The theoretical part of this thesis introduces the software and explains how to use it. Specifically, it is described what feature the software works with, how the texts can be preprocessed, how to evaluate the results of the chosen methods and how to install and configure the software. In the practical part of this thesis it is shown how the software works with specific issues. Several different kinds of text classification are tested. It is language recognition, on randomly chosen languages and on languages from the same family, author identification with professional authors and with nonprofessional authors, sentiment detection and spam detection. The results of each text classification are then evaluated. The conclusion summarizes the entire thesis and introduces the possibilities of expansion and improvement of the software.

citace PRO

Počet záznamů: 1