Number of the records: 1
Aplikace kvantitativní lingvistiky na analýzu sekvencí
Title statement Aplikace kvantitativní lingvistiky na analýzu sekvencí [rukopis] / Vladimír Matlach Additional Variant Titles Využití kvantitativní lingvistiky ve výzkumu DNA Personal name Matlach, Vladimír (dissertant) Translated title Application of quantitative linguistics in DNA research Issue data 2019 Phys.des. 202 s. (427 598 znaků) : il., grafy, schémata, tab. + 1 cd-rom Note Ved. práce Dan Faltýnek Ved. práce Dan Faltýnek Another responsib. Faltýnek, Dan, 1980- (thesis advisor) Faltýnek, Dan, 1980- (školitel) Another responsib. Univerzita Palackého. Katedra obecné lingvistiky (degree grantor) Keywords kvantitativní lingvistika * empirické zákony * sekvence * shlukování * Zipf * Menzerath-Altmann * náhodnost * kódující sekvence * sekundární struktury * entropie * quantitative linguistics * empirical laws * sequence * clustering * Zipf * Menzerath-Altmann * random * coding sequence * secondary structure * entropy Form, Genre disertace dissertations UDC (043.3) Country Česko Language čeština Document kind PUBLIKAČNÍ ČINNOST Title Ph.D. Degree program Doktorský Degree program Filologie Degreee discipline Obecná jazykověda a teorie komunikace book
Kvalifikační práce Downloaded Size datum zpřístupnění 00200517-257286127.pdf 79 6 MB 03.04.2019 Posudek Typ posudku 00200517-ved-397299920.docx Posudek vedoucího 00200517-opon-409407252.pdf Posudek oponenta Průběh obhajoby datum zadání datum odevzdání datum obhajoby přidělená hodnocení typ hodnocení 00200517-prubeh-682485821.jpg 10.12.2010 03.04.2019 29.08.2019 S 2
Cílem této práce je nalézt aplikace metod kvantitativní lingvistiky s mezioborovým přesahem. Nosným tématem je zvolena analýza sekvencí, která je využívána v řadě oborů od samotné lingvistiky analyzující například neznámé či domnělé jazyky, dále genetiky analyzující sekvence DNA, až po počítačovou bezpečnost, ve které je například třeba analyzovat kvalitu generátorů náhodných sekvencí. Tato práce obsahuje tři kapitoly, ve kterých se postupně věnuje obecné a univerzální analýze sekvencí a následně pokračuje k jejich konkrétním typům i aplikacím. První kapitola této práce představuje metodu odvozenou za účelem kvantitativní charakterizace obecných sekvencí a umožnění jejich shlukování či další analýzy, a to na základě běžných nástrojů kvantitativní lingvistiky. Druhá kapitola se zabývá teoretickou možností odhadu jednotek sekvencí tvořících analogii ke slovům přirozeného jazyka na základě testování projevů Zipfova zákona. Třetí a finální kapitola se zabývá možností využití Menzerath-Altmannova zákona, jakožto specifického pravidla upravujícího vztah konstruktů a konstituentů na kódujících sekvencích DNA s cílem vytvoření heuristické metody testující věrohodnost segmentace sekundárních struktur. Výsledky této práce poukazují na přínos metod a empirických zákonů kvantitativní lingvistiky s potenciálem získávat praktické i teoretické poznatky v kontextu mezioborových aplikací.The aim of this work is to find applications for quantitative linguistic methods with an interdisciplinary focus. Sequence analysis, which is used in several disciplines ranging from linguistics, (including the analysis of unknown or supposed languages), genetic analysis of DNA sequences, to computer security (e.g., analyzing the quality of random sequence generators). This work contains three chapters which start from general and universal sequence analysis and then gradually proceeds to their specific types and applications. The first chapter of this work is a method derived for the purposes of quantitative characterization of general sequences and the possibility of their aggregation or further analysis based on common tools from quantitative linguistics. The second chapter deals with the theoretical possibility of estimating units of sequences that match in analogy with words of native natural language based on Zipf's law. The third and final chapter deals with the possibility of using the Menzerath-Altmann Law as a specific rule governing the relationship of constructs and constituents to DNA coding sequences to create a heuristic method for testing the credibility of segmentation of secondary structures. The results of this work point to the contribution of the methods and empirical laws of quantitative linguistics with the potential to acquire practical and theoretical knowledge in the context of interdisciplinary applications.
Number of the records: 1