Number of the records: 1
Kompoziční přístup v analýze biostatistických dat
Title statement Kompoziční přístup v analýze biostatistických dat [rukopis] / Nikola Štefelová Additional Variant Titles Kompoziční přístup v analýze biomolekulárních dat Personal name Štefelová, Nikola (dissertant) Translated title Compositional approach to the analysis of biomolecular data Issue data 2021 Note Ved. práce Tomáš Adam Another responsib. Adam, Tomáš (consultant) Another responsib. Univerzita Palackého. Katedra matematické analýzy a aplikací matematiky (degree grantor) Keywords kompoziční data * logpodílová metodika * bilance * pivotové souřadnice * vážené pivotové soužadnice * regresní analýza * PLS biplot * robustní statistika * odlehlá pozorování na úrovni buněk * data o pohybovém chování * metabolomická data * compositional data * logratio methodology * balances * pivot coordinates * weighted pivot coordinates * regression analysis * PLS biplot * robust statistics * cellwise outliers * time-use data * metabolomic data Form, Genre disertace dissertations UDC (043.3) Country Česko Language čeština Document kind PUBLIKAČNÍ ČINNOST Title Ph.D. Degree program Doktorský Degree program Aplikovaná matematika Degreee discipline Aplikovaná matematika book
Kvalifikační práce Downloaded Size datum zpřístupnění 00219841-916186748.pdf 34 1.6 MB 29.03.2021 Posudek Typ posudku 00219841-opon-624521911.pdf Posudek oponenta 00219841-ved-748182289.pdf Posudek vedoucího 00219841-opon-170538999.pdf Posudek oponenta Průběh obhajoby datum zadání datum odevzdání datum obhajoby přidělená hodnocení typ hodnocení 00219841-prubeh-765714614.pdf 13.10.2016 29.03.2021 20.05.2021 S Hodnocení známkou
Mnoho typů dat v biostatistice má podobu kompozi?ních dat, tj. jde o mnohorozměrná pozorování obsahující kladné složky, které reprezentují části nějakého celku a nesou relativní informaci. Logpodílová metodika, zohledňující specifické vlastnosti kompozic, slouží jako vhodný prostředek k jejich analýze. Tato práce představuje metodologické inovace a aplikace kompozi?ního přístupu v oborech biostatistiky, konkrétně v oblasti regresní analýzy a vizualizace dat, a to v metabolomice a při zkoumání vlivu pohybového chování na zdraví. Je zde prezentována nová robustní metoda pro regresi s kompozičními vysvětlujícími proměnnými, jež je schopna efektivně pracovat s pozorováními, která jsou odlehlá jako celek, i s těmi, kde se odlehlost projevuje pouze na prvkové úrovni. Také je tu představena vylepšená procedura pro identifikaci statisticky významných proměnných ve vysoce-dimenzionálních kompozičních datech. Je založena na regresi metodou částečných nejmenších čtverců (PLS regresi), při níž se pro reprezentaci kompozic využívají vážené pivotové souřadnice s novou strategií pro vážení danou povahou problému. V kontextu výzkumu pohybového chování je kladen zvláštní důraz na vhodnou souřadnicovou reprezentaci dat o pohybovém chování. Navržený souřadnicový systém bere v potaz to, že mezi kategoriemi pohybového chování, kompozičními proměnnými, existuje přirozené uspořádání.Many types of data in biostatistics meet properties of compositional data, i.e. multivariate observations comprising positive parts of a whole carrying relative information. Given their specific properties, the logratio methodology serves as a proper tool for the analysis of compositions. This thesis presents methodological developments and applications of the compositional approach in fields of biostatistics, specifically in relation to regression analysis and data visualization as applied to metabolomics and time-use epidemiology. A novel method for regression with compositional explanatory variables is introduced, which is robust against rowwise as well as against cellwise outliers. Further, a procedure for improved biomarker discovery in high-dimensional compositional data is presented. It is based on partial least squares (PLS) regression using a weighted pivot coordinate representation for compositions with a new, task-driven, strategy for weighting. In the context of time-use research, special relevance is given to a suitable coordinate representation of time-use data. The proposed coordinate system aims to reflect the fact that there is a natural ordering in time-use categories, the compositional variables.
Number of the records: 1