Die Bedeutung von Enhancern, DNA-Regionen außerhalb von Genen, die die Transkription ihrer Zielgene aktivieren, ist gut dokumentiert. Mutationen oder Variationen innerhalb dieser Regionen können zu Fehlregulationen von Zielgenen führen und können oft mit dem Auftreten von Krankheiten und Störungen verbunden werden. Mehrere Konsortien haben Enhancer über verschiedene Zelltypen hinweg kartiert, aber wir sind weit davon entfernt zu verstehen, welche spezifischen Teile in diesen Regionen tatsächlich krankheitsverursachend sind. Wir schlagen eine neue maschinelles-Lernen-basierte Strategie vor, um dieses Problem anzugehen. Wir kombinieren unsere Expertise mit zwei unterschiedlichen Ansätzen, Bayes'scher Statistik und tiefen neuronalen Netzwerken, um zelltypspezifische Modelle von Enhancern zu trainieren, die aus umfangreichen genomweiten Datensätzen extrahiert werden. Diese Modelle werden verwendet, um den Einfluss nicht-kodierender Sequenzvarianten zu bewerten und auf ihre Assoziation mit Funktion und Krankheit zu testen. Die Ergebnisse werden als Open-Source-Software sowie als Karte der zustandsspezifischen nicht-codierenden Varianten auf einem öffentlichen Webserver zugänglich gemacht.
Verbundprojekt: Maschinelles Lernen zur Identifikation & Interpretation krankheitsrelevanter nichtcodierender Sequenzvariation; Teilvorhaben: Bioinformatik
Laufzeit:
01.03.2019
- 30.06.2022
Förderkennzeichen: 01DQ19008
Koordinator: Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC)
Quelle:
Bundesministerium für Bildung und Forschung (BMBF)
Redaktion:
DLR Projektträger
Länder / Organisationen:
Indien
Themen:
Förderung
Lebenswissenschaften