Number of the records: 1
Klasifikace autorství
Title statement Klasifikace autorství [rukopis] / Michal Peřinka Additional Variant Titles Klasifikace autorství Personal name Peřinka, Michal (dissertant) Translated title Authorship classification Issue data 2015 Phys.des. 68 stran Note Ved. práce Jan Konečný Oponent Petr Osička Another responsib. Konečný, Jan (thesis advisor) Osička, Petr (opponent) Another responsib. Univerzita Palackého. Katedra informatiky (degree grantor) Keywords klasifikace autorství * lingvistické vlastnosti textu * přiřazení autorství * větný rozbor * authorship classification * lingvistic features * authorship attribution * sentence analysis Form, Genre diplomové práce master's theses UDC (043)378.2 Country Česko Language čeština Document kind PUBLIKAČNÍ ČINNOST Title Mgr. Degree program Navazující Degree program Informatika Degreee discipline Informatika book
Kvalifikační práce Downloaded Size datum zpřístupnění 00171371-321091628.pdf 25 1.1 MB 12.08.2015 Posudek Typ posudku 00171371-ved-479989050.pdf Posudek vedoucího 00171371-opon-175583398.pdf Posudek oponenta
V dnešní době obrovského množství informací je třeba tyto informace třídit a zpracovávat automatizací. Služby jako internet přináší k uživateli mnoho textu, na jejichž autenticitu se nedá spolehnout, a tudíž se uživatel nemůže spolehnout ani na informace v textu obsažené. Proto je třeba takové texty verifikovat. Jedním z faktoru spolehlivosti je znalost pravého autora textu. Proto se v této práci věnuji možnosti automatizovaného přiřazení autora k textu, případne odhalení nepravosti udávaného autora. Implementuji metodu posouzení autorství na základe vybraných lexikálních vlastností textu, metodu založenou na rozdílu velikosti při komprimaci a metodu založenou na kvantifikaci kořenů slov. Dále implementuji metodu diskriminativního syntaktického stromu, která má největší úspěšnost v nově tvořené kategorii metod založených na vzorech obsažených v syntaktických stromech. Tyto metody založené na různých paradigmatech popisuji v textu a rozebírám na nich základní vlastnosti a principy při analýze textu. Taktéž rozebírám obecné vlastnosti textu, které ovlivňují rozbor a přirazení autora.In this age of enourmous amount of information we need to verify and sort these infromation automatically. Services such as internet provide users with many texts. Authenticity of such texts is unreliable thus users can not rely on contained information either. That is why we need to verify such texts. One of the reliability factors is knowledge of original author. Because of that I deal with possibility of automation text - author attribution or uncovering fake author. I implement a method of authorship attribution based on selected lexical text features, a method based on size difference of compressed texts and a method based on word stems quantification. Further, I implement a method of discriminative syntactic tree, which is most successful in new category of methods based on patterns contained in syntactic trees. All these methods based on different paradigms I describe in the thesis text and I examine fundamental features and principles of text analysis. I also examine general text features, which affect text analysis and author attribution.
Number of the records: 1