Počet záznamů: 1
Sestavení paralelního korpusu globálních ekonomických výhledů
Údaje o názvu Sestavení paralelního korpusu globálních ekonomických výhledů [rukopis] / Jakub Jílek Další variantní názvy Sestavení paralelního korpusu globálních ekonomických výhledů Osobní jméno Jílek, Jakub, (autor diplomové práce nebo disertace) Překl.náz Compilation of a parallel corpus based on global economic outlooks Vyd.údaje 2019 Fyz.popis 54 s. (72 083 znaků) + Součástí příloh je i CD nosič, který obsahuje české a anglické verze GEV ČNB z let 2011 a 2018 ve formátu PDF, příslušné TXT soubory a příslušné překladové paměti ve formátu TMX, vytvořené exportem z programu InterText Poznámka Ved. práce Michal Kubánek Oponent Ondřej Klabal Dal.odpovědnost Kubánek, Michal, 1982- (vedoucí diplomové práce nebo disertace) Klabal, Ondřej (oponent) Dal.odpovědnost Univerzita Palackého. Katedra anglistiky a amerikanistiky (udelovatel akademické hodnosti) Klíč.slova korpusová lingvistika * paralelní korpus * zarovnávání * výhledové zprávy * globální ekonomický výhled * ČNB * Český národní korpus * lemmatizace * corpus linguistics * parallel corpus * alignment * outlooks * global economic outlook * Czech National Bank * Czech National Coropus * lemmatisation Forma, žánr bakalářské práce bachelor's theses MDT (043)378.22 Země vyd. Česko Jazyk dok. čeština Druh dok. PUBLIKAČNÍ ČINNOST Titul Bc. Studijní program Bakalářský Studijní program Filologie Studijní obor Angličtina se zaměřením na komunitní tlumočení a překlad kniha
Kvalifikační práce Staženo Velikost datum zpřístupnění 00256277-409496861.pdf 18 2.7 MB 20.08.2019 Posudek Typ posudku 00256277-ved-473283976.pdf Posudek vedoucího 00256277-opon-638109517.pdf Posudek oponenta Průběh obhajoby datum zadání datum odevzdání datum obhajoby přidělená hodnocení typ hodnocení 00256277-prubeh-418922476.pdf 09.05.2019 20.08.2019 02.09.2019 3 Hodnocení známkou
V rámci předklásdané bakalářské práce byl sestaven malý paralelní korpus globálních ekonomických výhledů České národní banky, které byly vydány v letech 2011 a 2018. Tato bakalářská práce popisuje jak lingvistické, tak i extralingvistické aspekty sestavování malého paralelního korpusu. Extralingvistické informace jsou v této práci představeny zejména ve čtvrté kapitole, kde jsou výhledové zprávy charakterizovány jako typ textu. Předkládaná práce obsahuje informace teoretického rázu a zároveň osvětluje některé z praktických aspektů sestavování paralelního korpusu. Co se týče teoretického obsahu, popisuje tato práce historický vývoj korpusové lingvistiky, možnosti klasifikace korpusů a také jsou zde zmíněni významní lingvisté a konkrétní korpusy. Mezi popisované praktické aspekty procesu sestavování malého paralelního korpusu patří extrakce obsahu z původních textů (GEV ČNB), práce s programem InterText, charakteristika procesu zarovnávání a systém pojmenovávání dokumentů, které souvisí se zarovnáváním. Možným využitím sestaveného korpusu se zabývá pátá kapitola této práce. Závěr této práce shrnuje zjištění získaná během procesu sestavování. V závěru je zdůrazněna velká časová náročnost sestavování malého paralelního korpusu. Ta zvláště vynikne, uvážíme-li, jak probíhala extrakce obsahu z originálních textů, dále i to, jaký mělo průběh OCR, zarovnávání a také dodatečné editace a opravy extrahovaného obsahu.In my thesis, I compile a small parallel corpus of the global economic outlooks issued by the Czech National Bank during the years 2011 and 2018. The aim of the thesis is to describe and experience the process of creating small parallel corpora and explore its potential use. Within the content of this thesis, there is put emphasis on both linguistic and extralinguistic aspects of the process of creating a small parallel corpus. The extralinguistic information are included mainly in the fourth chapter which characterises outlooks as a text type. However, the content provided in the thesis is both theoretical and it also provides the reader with description of some practical aspects of the process of creating of a parallel corpus. In terms of the theoretical information, this thesis describes the historical background of evolution of corpus linguistics, possible ways of classification of corpora and there are mentioned important linguistic scientists and specific examples of corpora. Regarding the practical aspects of the process of creating of parallel corpora, I describe how I extracted the content from the original texts (global economic outlooks mentioned above), how I worked with the InterText software, characteristics of the alignment process and my system of giving names to the alignment computer files. The fifth chapter of my thesis describes the possibilities of use of my corpus. The conclusion of this thesis describes my findings during the creation process of my corpus and it is emphasised there that the process of a small parallel corpus is very time-consuming, considering the extraction process, OCR, alignment and additional editing and corrections of the content extracted.
Počet záznamů: 1