Počet záznamů: 1  

Klasifikace autorství

  1. Údaje o názvuKlasifikace autorství [rukopis] / Michal Peřinka
    Další variantní názvyKlasifikace autorství
    Osobní jméno Peřinka, Michal (autor diplomové práce nebo disertace)
    Překl.názAuthorship classification
    Vyd.údaje2015
    Fyz.popis68 stran
    PoznámkaVed. práce Jan Konečný
    Oponent Petr Osička
    Dal.odpovědnost Konečný, Jan (vedoucí diplomové práce nebo disertace)
    Osička, Petr (oponent)
    Dal.odpovědnost Univerzita Palackého. Katedra informatiky (udelovatel akademické hodnosti)
    Klíč.slova klasifikace autorství * lingvistické vlastnosti textu * přiřazení autorství * větný rozbor * authorship classification * lingvistic features * authorship attribution * sentence analysis
    Forma, žánr diplomové práce master's theses
    MDT (043)378.2
    Země vyd.Česko
    Jazyk dok.čeština
    Druh dok.PUBLIKAČNÍ ČINNOST
    TitulMgr.
    Studijní programNavazující
    Studijní programInformatika
    Studijní oborInformatika
    kniha

    kniha

    Kvalifikační práceStaženoVelikostdatum zpřístupnění
    00171371-321091628.pdf231.1 MB12.08.2015
    PosudekTyp posudku
    00171371-ved-479989050.pdfPosudek vedoucího
    00171371-opon-175583398.pdfPosudek oponenta

    V dnešní době obrovského množství informací je třeba tyto informace třídit a zpracovávat automatizací. Služby jako internet přináší k uživateli mnoho textu, na jejichž autenticitu se nedá spolehnout, a tudíž se uživatel nemůže spolehnout ani na informace v textu obsažené. Proto je třeba takové texty verifikovat. Jedním z faktoru spolehlivosti je znalost pravého autora textu. Proto se v této práci věnuji možnosti automatizovaného přiřazení autora k textu, případne odhalení nepravosti udávaného autora. Implementuji metodu posouzení autorství na základe vybraných lexikálních vlastností textu, metodu založenou na rozdílu velikosti při komprimaci a metodu založenou na kvantifikaci kořenů slov. Dále implementuji metodu diskriminativního syntaktického stromu, která má největší úspěšnost v nově tvořené kategorii metod založených na vzorech obsažených v syntaktických stromech. Tyto metody založené na různých paradigmatech popisuji v textu a rozebírám na nich základní vlastnosti a principy při analýze textu. Taktéž rozebírám obecné vlastnosti textu, které ovlivňují rozbor a přirazení autora.In this age of enourmous amount of information we need to verify and sort these infromation automatically. Services such as internet provide users with many texts. Authenticity of such texts is unreliable thus users can not rely on contained information either. That is why we need to verify such texts. One of the reliability factors is knowledge of original author. Because of that I deal with possibility of automation text - author attribution or uncovering fake author. I implement a method of authorship attribution based on selected lexical text features, a method based on size difference of compressed texts and a method based on word stems quantification. Further, I implement a method of discriminative syntactic tree, which is most successful in new category of methods based on patterns contained in syntactic trees. All these methods based on different paradigms I describe in the thesis text and I examine fundamental features and principles of text analysis. I also examine general text features, which affect text analysis and author attribution.

Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.