Počet záznamů: 1

Sestavení paralelního korpusu globálních ekonomických výhledů

Údaje o názvu	Sestavení paralelního korpusu globálních ekonomických výhledů [rukopis] / Jakub Jílek
Další variantní názvy	Sestavení paralelního korpusu globálních ekonomických výhledů
Osobní jméno	Jílek, Jakub, (autor diplomové práce nebo disertace)
Překl.náz	Compilation of a parallel corpus based on global economic outlooks
Vyd.údaje	2019
Fyz.popis	54 s. (72 083 znaků) + Součástí příloh je i CD nosič, který obsahuje české a anglické verze GEV ČNB z let 2011 a 2018 ve formátu PDF, příslušné TXT soubory a příslušné překladové paměti ve formátu TMX, vytvořené exportem z programu InterText
Poznámka	Ved. práce Michal Kubánek
	Oponent Ondřej Klabal
Dal.odpovědnost	Kubánek, Michal, 1982- (vedoucí diplomové práce nebo disertace)
	Klabal, Ondřej (oponent)
Dal.odpovědnost	Univerzita Palackého. Katedra anglistiky a amerikanistiky (udelovatel akademické hodnosti)
Klíč.slova	korpusová lingvistika * paralelní korpus * zarovnávání * výhledové zprávy * globální ekonomický výhled * ČNB * Český národní korpus * lemmatizace * corpus linguistics * parallel corpus * alignment * outlooks * global economic outlook * Czech National Bank * Czech National Coropus * lemmatisation
Forma, žánr	bakalářské práce bachelor's theses
MDT	(043)378.22
Země vyd.	Česko
Jazyk dok.	čeština
Druh dok.	PUBLIKAČNÍ ČINNOST
Titul	Bc.
Studijní program	Bakalářský
Studijní program	Filologie
Studijní obor	Angličtina se zaměřením na komunitní tlumočení a překlad

kniha

Kvalifikační práce	Staženo	Velikost	datum zpřístupnění
00256277-409496861.pdf	18	2.7 MB	20.08.2019

Posudek	Typ posudku
00256277-ved-473283976.pdf	Posudek vedoucího
00256277-opon-638109517.pdf	Posudek oponenta

Průběh obhajoby	datum zadání	datum odevzdání	datum obhajoby	přidělená hodnocení	typ hodnocení
00256277-prubeh-418922476.pdf	09.05.2019	20.08.2019	02.09.2019	3	Hodnocení známkou

Anotace
Citace PRO

V rámci předklásdané bakalářské práce byl sestaven malý paralelní korpus globálních ekonomických výhledů České národní banky, které byly vydány v letech 2011 a 2018. Tato bakalářská práce popisuje jak lingvistické, tak i extralingvistické aspekty sestavování malého paralelního korpusu. Extralingvistické informace jsou v této práci představeny zejména ve čtvrté kapitole, kde jsou výhledové zprávy charakterizovány jako typ textu. Předkládaná práce obsahuje informace teoretického rázu a zároveň osvětluje některé z praktických aspektů sestavování paralelního korpusu. Co se týče teoretického obsahu, popisuje tato práce historický vývoj korpusové lingvistiky, možnosti klasifikace korpusů a také jsou zde zmíněni významní lingvisté a konkrétní korpusy. Mezi popisované praktické aspekty procesu sestavování malého paralelního korpusu patří extrakce obsahu z původních textů (GEV ČNB), práce s programem InterText, charakteristika procesu zarovnávání a systém pojmenovávání dokumentů, které souvisí se zarovnáváním. Možným využitím sestaveného korpusu se zabývá pátá kapitola této práce. Závěr této práce shrnuje zjištění získaná během procesu sestavování. V závěru je zdůrazněna velká časová náročnost sestavování malého paralelního korpusu. Ta zvláště vynikne, uvážíme-li, jak probíhala extrakce obsahu z originálních textů, dále i to, jaký mělo průběh OCR, zarovnávání a také dodatečné editace a opravy extrahovaného obsahu.In my thesis, I compile a small parallel corpus of the global economic outlooks issued by the Czech National Bank during the years 2011 and 2018. The aim of the thesis is to describe and experience the process of creating small parallel corpora and explore its potential use. Within the content of this thesis, there is put emphasis on both linguistic and extralinguistic aspects of the process of creating a small parallel corpus. The extralinguistic information are included mainly in the fourth chapter which characterises outlooks as a text type. However, the content provided in the thesis is both theoretical and it also provides the reader with description of some practical aspects of the process of creating of a parallel corpus. In terms of the theoretical information, this thesis describes the historical background of evolution of corpus linguistics, possible ways of classification of corpora and there are mentioned important linguistic scientists and specific examples of corpora. Regarding the practical aspects of the process of creating of parallel corpora, I describe how I extracted the content from the original texts (global economic outlooks mentioned above), how I worked with the InterText software, characteristics of the alignment process and my system of giving names to the alignment computer files. The fifth chapter of my thesis describes the possibilities of use of my corpus. The conclusion of this thesis describes my findings during the creation process of my corpus and it is emphasised there that the process of a small parallel corpus is very time-consuming, considering the extraction process, OCR, alignment and additional editing and corrections of the content extracted.

citace PRO

Počet záznamů: 1