Number of the records: 1  

Sestavení paralelního korpusu globálních ekonomických výhledů

  1. Title statementSestavení paralelního korpusu globálních ekonomických výhledů [rukopis] / Jakub Jílek
    Additional Variant TitlesSestavení paralelního korpusu globálních ekonomických výhledů
    Personal name Jílek, Jakub, (dissertant)
    Translated titleCompilation of a parallel corpus based on global economic outlooks
    Issue data2019
    Phys.des.54 s. (72 083 znaků) + Součástí příloh je i CD nosič, který obsahuje české a anglické verze GEV ČNB z let 2011 a 2018 ve formátu PDF, příslušné TXT soubory a příslušné překladové paměti ve formátu TMX, vytvořené exportem z programu InterText
    NoteVed. práce Michal Kubánek
    Oponent Ondřej Klabal
    Another responsib. Kubánek, Michal, 1982- (thesis advisor)
    Klabal, Ondřej (opponent)
    Another responsib. Univerzita Palackého. Katedra anglistiky a amerikanistiky (degree grantor)
    Keywords korpusová lingvistika * paralelní korpus * zarovnávání * výhledové zprávy * globální ekonomický výhled * ČNB * Český národní korpus * lemmatizace * corpus linguistics * parallel corpus * alignment * outlooks * global economic outlook * Czech National Bank * Czech National Coropus * lemmatisation
    Form, Genre bakalářské práce bachelor's theses
    UDC (043)378.22
    CountryČesko
    Languagečeština
    Document kindPUBLIKAČNÍ ČINNOST
    TitleBc.
    Degree programBakalářský
    Degree programFilologie
    Degreee disciplineAngličtina se zaměřením na komunitní tlumočení a překlad
    book

    book

    Kvalifikační práceDownloadedSizedatum zpřístupnění
    00256277-409496861.pdf172.7 MB20.08.2019
    PosudekTyp posudku
    00256277-ved-473283976.pdfPosudek vedoucího
    00256277-opon-638109517.pdfPosudek oponenta
    Průběh obhajobydatum zadánídatum odevzdánídatum obhajobypřidělená hodnocenítyp hodnocení
    00256277-prubeh-418922476.pdf09.05.201920.08.201902.09.20193Hodnocení známkou

    V rámci předklásdané bakalářské práce byl sestaven malý paralelní korpus globálních ekonomických výhledů České národní banky, které byly vydány v letech 2011 a 2018. Tato bakalářská práce popisuje jak lingvistické, tak i extralingvistické aspekty sestavování malého paralelního korpusu. Extralingvistické informace jsou v této práci představeny zejména ve čtvrté kapitole, kde jsou výhledové zprávy charakterizovány jako typ textu. Předkládaná práce obsahuje informace teoretického rázu a zároveň osvětluje některé z praktických aspektů sestavování paralelního korpusu. Co se týče teoretického obsahu, popisuje tato práce historický vývoj korpusové lingvistiky, možnosti klasifikace korpusů a také jsou zde zmíněni významní lingvisté a konkrétní korpusy. Mezi popisované praktické aspekty procesu sestavování malého paralelního korpusu patří extrakce obsahu z původních textů (GEV ČNB), práce s programem InterText, charakteristika procesu zarovnávání a systém pojmenovávání dokumentů, které souvisí se zarovnáváním. Možným využitím sestaveného korpusu se zabývá pátá kapitola této práce. Závěr této práce shrnuje zjištění získaná během procesu sestavování. V závěru je zdůrazněna velká časová náročnost sestavování malého paralelního korpusu. Ta zvláště vynikne, uvážíme-li, jak probíhala extrakce obsahu z originálních textů, dále i to, jaký mělo průběh OCR, zarovnávání a také dodatečné editace a opravy extrahovaného obsahu.In my thesis, I compile a small parallel corpus of the global economic outlooks issued by the Czech National Bank during the years 2011 and 2018. The aim of the thesis is to describe and experience the process of creating small parallel corpora and explore its potential use. Within the content of this thesis, there is put emphasis on both linguistic and extralinguistic aspects of the process of creating a small parallel corpus. The extralinguistic information are included mainly in the fourth chapter which characterises outlooks as a text type. However, the content provided in the thesis is both theoretical and it also provides the reader with description of some practical aspects of the process of creating of a parallel corpus. In terms of the theoretical information, this thesis describes the historical background of evolution of corpus linguistics, possible ways of classification of corpora and there are mentioned important linguistic scientists and specific examples of corpora. Regarding the practical aspects of the process of creating of parallel corpora, I describe how I extracted the content from the original texts (global economic outlooks mentioned above), how I worked with the InterText software, characteristics of the alignment process and my system of giving names to the alignment computer files. The fifth chapter of my thesis describes the possibilities of use of my corpus. The conclusion of this thesis describes my findings during the creation process of my corpus and it is emphasised there that the process of a small parallel corpus is very time-consuming, considering the extraction process, OCR, alignment and additional editing and corrections of the content extracted.

Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.