StartseiteLänderAmerikaUSABig Data: Internationale Partnerschaft für weltweit größte Himmelskörper-Datenbank

Big Data: Internationale Partnerschaft für weltweit größte Himmelskörper-Datenbank

Das Large Synoptic Survey Telescope (LSST) in Chile wird ab 2022 zehn Jahre lang systematisch den Himmel abfotografieren. Für die Verarbeitung der Daten wird es vom französischen nationalen Forschungszentrum CNRS und den US-amerikanischen Forschungseinrichtungen NCSA (National Center for Supercomputing Applications) und SLAC (National Accelerator Laboratory) unterstützt.

Das LSST wird jeden Himmelsteil alle vier Tage aufnehmen. So soll ein dreidimensionales Abbild jedes Teils des sichtbaren Universums entstehen. Ein Ziel des Projektes ist es, mit bisher nie dagewesener Präzision die physikalischen Größen zu messen, die mit dunkler Energie assoziiert werden.

Die Verarbeitung der Daten des LSST stellt eine Herausforderung dar, da jede Nacht 2.000 Bilder bzw. mehr als 15 Terabyte Daten produziert werden. Sie sollen identifiziert, klassifiziert und automatisch katalogisiert werden, um strukturierte Datensätze zu schaffen, die von Forschern ausgewertet werden können. Diese Bearbeitung soll auf Basis einer Datenbank erfolgen, die vom Informatikzentrum CC-IN2P3 des CNRS (Centre de calcul de l’Institut national de physique nucléaire et de physique des particules) und dem NCSA betrieben wird.

Perspektivisch werden so 37 Milliarden astronomischer Objekte wie Galaxien, Sterne oder Asteroiden katalogisiert. Dies entspricht einem Datenvolumen von 500 Petabyte (500 Millionen Gigabyte bzw. 100 Millionen DVDs), von denen 50 in der Datenbank indexiert werden. Das Vorhaben ist daher eines der weltweit größten, referenzierten Big Data-Projekte.

Für den Himmelskörper-Katalog entwickeln die Partner aktuell einen Prototyp und werden hierbei vom Computerunternehmen Dell unterstützt. Seit 2012 verbindet das CNRS und Dell eine Partnerschaft für die Entwicklung neuer Ansätze für die Verarbeitung von Big Data. Dell hat dem CNRS daher nun eine Versuchsplattform zur Verfügung gestellt, die mit 50 Servern und einer Speicherkapazität von 500 Terabyte ausgestattet ist. Dort wird die Datenbank „Qserv“ installiert, die vom SLAC speziell für das LSST-Projekt entwickelt wurde. Die Forscher des SLAC und des CC-IN2P3 können die Datenbank somit umfangreich auf Stabilität und Verarbeitungskapazität prüfen und die Indexierungsplattform für das LSST vorbereiten.

Das CC-IN2P3 ist seit März 2015 offiziell am LSST beteiligt.

Quelle: CNRS, LSST Redaktion: von Kathleen Schlütter, Deutsch-Französische Hochschule Länder / Organisationen: Global Chile Frankreich USA Themen: Grundlagenforschung Infrastruktur Wirtschaft, Märkte

Weitere Informationen

Projektträger