Počet záznamů: 1
Klasifikace autorství
Údaje o názvu Klasifikace autorství [rukopis] / Michal Peřinka Další variantní názvy Klasifikace autorství Osobní jméno Peřinka, Michal (autor diplomové práce nebo disertace) Překl.náz Authorship classification Vyd.údaje 2015 Fyz.popis 68 stran Poznámka Ved. práce Jan Konečný Oponent Petr Osička Dal.odpovědnost Konečný, Jan (vedoucí diplomové práce nebo disertace) Osička, Petr (oponent) Dal.odpovědnost Univerzita Palackého. Katedra informatiky (udelovatel akademické hodnosti) Klíč.slova klasifikace autorství * lingvistické vlastnosti textu * přiřazení autorství * větný rozbor * authorship classification * lingvistic features * authorship attribution * sentence analysis Forma, žánr diplomové práce master's theses MDT (043)378.2 Země vyd. Česko Jazyk dok. čeština Druh dok. PUBLIKAČNÍ ČINNOST Titul Mgr. Studijní program Navazující Studijní program Informatika Studijní obor Informatika kniha
Kvalifikační práce Staženo Velikost datum zpřístupnění 00171371-321091628.pdf 24 1.1 MB 12.08.2015 Posudek Typ posudku 00171371-ved-479989050.pdf Posudek vedoucího 00171371-opon-175583398.pdf Posudek oponenta
V dnešní době obrovského množství informací je třeba tyto informace třídit a zpracovávat automatizací. Služby jako internet přináší k uživateli mnoho textu, na jejichž autenticitu se nedá spolehnout, a tudíž se uživatel nemůže spolehnout ani na informace v textu obsažené. Proto je třeba takové texty verifikovat. Jedním z faktoru spolehlivosti je znalost pravého autora textu. Proto se v této práci věnuji možnosti automatizovaného přiřazení autora k textu, případne odhalení nepravosti udávaného autora. Implementuji metodu posouzení autorství na základe vybraných lexikálních vlastností textu, metodu založenou na rozdílu velikosti při komprimaci a metodu založenou na kvantifikaci kořenů slov. Dále implementuji metodu diskriminativního syntaktického stromu, která má největší úspěšnost v nově tvořené kategorii metod založených na vzorech obsažených v syntaktických stromech. Tyto metody založené na různých paradigmatech popisuji v textu a rozebírám na nich základní vlastnosti a principy při analýze textu. Taktéž rozebírám obecné vlastnosti textu, které ovlivňují rozbor a přirazení autora.In this age of enourmous amount of information we need to verify and sort these infromation automatically. Services such as internet provide users with many texts. Authenticity of such texts is unreliable thus users can not rely on contained information either. That is why we need to verify such texts. One of the reliability factors is knowledge of original author. Because of that I deal with possibility of automation text - author attribution or uncovering fake author. I implement a method of authorship attribution based on selected lexical text features, a method based on size difference of compressed texts and a method based on word stems quantification. Further, I implement a method of discriminative syntactic tree, which is most successful in new category of methods based on patterns contained in syntactic trees. All these methods based on different paradigms I describe in the thesis text and I examine fundamental features and principles of text analysis. I also examine general text features, which affect text analysis and author attribution.
Počet záznamů: 1