Number of the records: 1  

Klasifikace autorství

  1. Title statementKlasifikace autorství [rukopis] / Michal Peřinka
    Additional Variant TitlesKlasifikace autorství
    Personal name Peřinka, Michal (dissertant)
    Translated titleAuthorship classification
    Issue data2015
    Phys.des.68 stran
    NoteVed. práce Jan Konečný
    Oponent Petr Osička
    Another responsib. Konečný, Jan (thesis advisor)
    Osička, Petr (opponent)
    Another responsib. Univerzita Palackého. Katedra informatiky (degree grantor)
    Keywords klasifikace autorství * lingvistické vlastnosti textu * přiřazení autorství * větný rozbor * authorship classification * lingvistic features * authorship attribution * sentence analysis
    Form, Genre diplomové práce master's theses
    UDC (043)378.2
    CountryČesko
    Languagečeština
    Document kindPUBLIKAČNÍ ČINNOST
    TitleMgr.
    Degree programNavazující
    Degree programInformatika
    Degreee disciplineInformatika
    book

    book

    Kvalifikační práceDownloadedSizedatum zpřístupnění
    00171371-321091628.pdf251.1 MB12.08.2015
    PosudekTyp posudku
    00171371-ved-479989050.pdfPosudek vedoucího
    00171371-opon-175583398.pdfPosudek oponenta

    V dnešní době obrovského množství informací je třeba tyto informace třídit a zpracovávat automatizací. Služby jako internet přináší k uživateli mnoho textu, na jejichž autenticitu se nedá spolehnout, a tudíž se uživatel nemůže spolehnout ani na informace v textu obsažené. Proto je třeba takové texty verifikovat. Jedním z faktoru spolehlivosti je znalost pravého autora textu. Proto se v této práci věnuji možnosti automatizovaného přiřazení autora k textu, případne odhalení nepravosti udávaného autora. Implementuji metodu posouzení autorství na základe vybraných lexikálních vlastností textu, metodu založenou na rozdílu velikosti při komprimaci a metodu založenou na kvantifikaci kořenů slov. Dále implementuji metodu diskriminativního syntaktického stromu, která má největší úspěšnost v nově tvořené kategorii metod založených na vzorech obsažených v syntaktických stromech. Tyto metody založené na různých paradigmatech popisuji v textu a rozebírám na nich základní vlastnosti a principy při analýze textu. Taktéž rozebírám obecné vlastnosti textu, které ovlivňují rozbor a přirazení autora.In this age of enourmous amount of information we need to verify and sort these infromation automatically. Services such as internet provide users with many texts. Authenticity of such texts is unreliable thus users can not rely on contained information either. That is why we need to verify such texts. One of the reliability factors is knowledge of original author. Because of that I deal with possibility of automation text - author attribution or uncovering fake author. I implement a method of authorship attribution based on selected lexical text features, a method based on size difference of compressed texts and a method based on word stems quantification. Further, I implement a method of discriminative syntactic tree, which is most successful in new category of methods based on patterns contained in syntactic trees. All these methods based on different paradigms I describe in the thesis text and I examine fundamental features and principles of text analysis. I also examine general text features, which affect text analysis and author attribution.

Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.