Počet záznamů: 1  

Sestavení paralelního korpusu globálních ekonomických výhledů

  1. Údaje o názvuSestavení paralelního korpusu globálních ekonomických výhledů [rukopis] / Jakub Jílek
    Další variantní názvySestavení paralelního korpusu globálních ekonomických výhledů
    Osobní jméno Jílek, Jakub, (autor diplomové práce nebo disertace)
    Překl.názCompilation of a parallel corpus based on global economic outlooks
    Vyd.údaje2019
    Fyz.popis54 s. (72 083 znaků) + Součástí příloh je i CD nosič, který obsahuje české a anglické verze GEV ČNB z let 2011 a 2018 ve formátu PDF, příslušné TXT soubory a příslušné překladové paměti ve formátu TMX, vytvořené exportem z programu InterText
    PoznámkaVed. práce Michal Kubánek
    Oponent Ondřej Klabal
    Dal.odpovědnost Kubánek, Michal, 1982- (vedoucí diplomové práce nebo disertace)
    Klabal, Ondřej (oponent)
    Dal.odpovědnost Univerzita Palackého. Katedra anglistiky a amerikanistiky (udelovatel akademické hodnosti)
    Klíč.slova korpusová lingvistika * paralelní korpus * zarovnávání * výhledové zprávy * globální ekonomický výhled * ČNB * Český národní korpus * lemmatizace * corpus linguistics * parallel corpus * alignment * outlooks * global economic outlook * Czech National Bank * Czech National Coropus * lemmatisation
    Forma, žánr bakalářské práce bachelor's theses
    MDT (043)378.22
    Země vyd.Česko
    Jazyk dok.čeština
    Druh dok.PUBLIKAČNÍ ČINNOST
    TitulBc.
    Studijní programBakalářský
    Studijní programFilologie
    Studijní oborAngličtina se zaměřením na komunitní tlumočení a překlad
    kniha

    kniha

    Kvalifikační práceStaženoVelikostdatum zpřístupnění
    00256277-409496861.pdf182.7 MB20.08.2019
    PosudekTyp posudku
    00256277-ved-473283976.pdfPosudek vedoucího
    00256277-opon-638109517.pdfPosudek oponenta
    Průběh obhajobydatum zadánídatum odevzdánídatum obhajobypřidělená hodnocenítyp hodnocení
    00256277-prubeh-418922476.pdf09.05.201920.08.201902.09.20193Hodnocení známkou

    V rámci předklásdané bakalářské práce byl sestaven malý paralelní korpus globálních ekonomických výhledů České národní banky, které byly vydány v letech 2011 a 2018. Tato bakalářská práce popisuje jak lingvistické, tak i extralingvistické aspekty sestavování malého paralelního korpusu. Extralingvistické informace jsou v této práci představeny zejména ve čtvrté kapitole, kde jsou výhledové zprávy charakterizovány jako typ textu. Předkládaná práce obsahuje informace teoretického rázu a zároveň osvětluje některé z praktických aspektů sestavování paralelního korpusu. Co se týče teoretického obsahu, popisuje tato práce historický vývoj korpusové lingvistiky, možnosti klasifikace korpusů a také jsou zde zmíněni významní lingvisté a konkrétní korpusy. Mezi popisované praktické aspekty procesu sestavování malého paralelního korpusu patří extrakce obsahu z původních textů (GEV ČNB), práce s programem InterText, charakteristika procesu zarovnávání a systém pojmenovávání dokumentů, které souvisí se zarovnáváním. Možným využitím sestaveného korpusu se zabývá pátá kapitola této práce. Závěr této práce shrnuje zjištění získaná během procesu sestavování. V závěru je zdůrazněna velká časová náročnost sestavování malého paralelního korpusu. Ta zvláště vynikne, uvážíme-li, jak probíhala extrakce obsahu z originálních textů, dále i to, jaký mělo průběh OCR, zarovnávání a také dodatečné editace a opravy extrahovaného obsahu.In my thesis, I compile a small parallel corpus of the global economic outlooks issued by the Czech National Bank during the years 2011 and 2018. The aim of the thesis is to describe and experience the process of creating small parallel corpora and explore its potential use. Within the content of this thesis, there is put emphasis on both linguistic and extralinguistic aspects of the process of creating a small parallel corpus. The extralinguistic information are included mainly in the fourth chapter which characterises outlooks as a text type. However, the content provided in the thesis is both theoretical and it also provides the reader with description of some practical aspects of the process of creating of a parallel corpus. In terms of the theoretical information, this thesis describes the historical background of evolution of corpus linguistics, possible ways of classification of corpora and there are mentioned important linguistic scientists and specific examples of corpora. Regarding the practical aspects of the process of creating of parallel corpora, I describe how I extracted the content from the original texts (global economic outlooks mentioned above), how I worked with the InterText software, characteristics of the alignment process and my system of giving names to the alignment computer files. The fifth chapter of my thesis describes the possibilities of use of my corpus. The conclusion of this thesis describes my findings during the creation process of my corpus and it is emphasised there that the process of a small parallel corpus is very time-consuming, considering the extraction process, OCR, alignment and additional editing and corrections of the content extracted.

Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.