Model biocybernetyczny w analizie sekwencji genomu ludzkiego
W niniejszej pracy przeprowadzono biocybernetyczną interpretacją procesu interferencji RNA - mechanizmu postranskrypcyjnej regulacji genów. Zaproponowano rozwinięcie modelu TargetScore do modelu biTargetScore służącego predykcji par interakcji miRNA/transkrypt. W pracy zrealizowano jego implementacje, a następnie przeprowadzono walidację. Zaproponowany w pracy model biTargetScore integruje większy zasób informacji w porównaniu do modelu TargetScore. Uwzględnienie bezpośrednich i pośrednich czynników pozwala lepiej rozpoznać rzeczywiste cele miRNA. Integracja różnych zasobów w modelu obejmuje: informację kontekstową sekwencji miejsca wiązania, zmienność poziomu ekspresji miRNA oraz mRNA, konserwatywność filogenetyczną regionów sekwencji miejsca wiązania. Każdy z tych zasobów zostaje aproksymowany modelem Variational Bayesian-Gaussian Mixture Model (VB-GMM). Model biTargetScore został porównany z innymi narzędziami bioinformatycznymi do predykcji, wykazując nad nimi przewagę, wyrażającą się przez poprawę jakości rozpoznania targetów. Do weryfikacji poprawności budowanego modelu wykorzystano informacje o ekspresji cząsteczek miRNAs z eksperymentu Astma zrealizowanego w Zakładzie Biologii Molekularnej i Genetyki Klinicznej CMUJ oraz skorzystano z bazy publicznie dostępnych zweryfikowanych eksperymentalnie targetów. W pracy wskazano dalszy kierunek badań rozwijający integracje technicznych rozwiązań z mechanizmem RNA i na przykładzie odkrytego przez Sergeya Petoukhova sposobu degeneracji kodu genetycznego.Biocybernetic model for the analysis of the human genome
sequence
The idea of RNA interference process assumes inaccuracy of transcription factors activating genetic expression in the sense of balancing between the transcripts supply and demand. This work concerned the interpretation of posttranscriptional regulation mechanism from biocybernetics point of view. The development of TargetScore model to biTargetScore model was introduced. The main goal of this biTargetScore model is prediction of interaction between mi RNA and transcript. Furthermore, the implementation and experimental validation of this model was realized in this thesis. Presented biTargetScore model integrates more information in comparison with the TargetScore model. The integration of different types of information covers: context information of binding sequence sites, variation of the miRNA and mRNA expression level, philogenetic conservatism of binding site within the transcript. Each of these types of information was approximated by Variational Bayesian-Gaussian Mixture Model (VB- GMM) model.
The biTargetScore model was compared to different predictive bioinformatics tools and has showed an advantage by giving higher quality of target recognition. The built model correctness was verified using both the information of miRNAs expression, extracted from the Astma experiment held in the Department of Molecular Biology and Clinical Genetics of CMUJ and open to general used dataset with experimentally verified targets. This thesis follows the course of research in developing integration of technical solutions with RNA interference mechanism using the methodology of the genetic code