PDF Symbol

Ziel der Kooperation von deutschen, österreichischen und spanischen Wissenschaftlern im europäischen Projekt Mr.SymBioMath mit einem Forschungsbudget von über € 2,6 Millionen ist die rasche und effiziente Verarbeitung von großen Datenmengen, die bei der Untersuchung von Genomen entstehen und der darauf aufbauenden Anwendung bei der frühen Erkennung von Reaktionen und Allergien bei Medikamenten.

Computer als Grundlage für Forschung und Entwicklung lösen heute Aufgaben mit einer Geschwindigkeit und Effizienz, die vor einigen Jahren nicht durchführbar und vor Jahrzehnten gar unvorstellbar waren. Jeden Tag werden heute riesige Datenmengen auf Desktoprechnern, Laptops, Tablets, Smartphones und selbstverständlich auch auf so genannten Supercomputern verarbeitet. Letztere ermöglichen u.a. auch die Simulation von Wetterereignissen durch die Lösung von komplexen Gleichungssystemen, helfen bei der Lösung schwieriger Probleme der Quantenphysik oder ermöglichen die Entschlüsselung der Genome von Organismen.

Insbesondere die Genetik ist ein Forschungsbereich, der eine große Fülle an Daten benötigt und auch viele Daten produziert. So benötigt zum Beispiel das sequenzierte Genom eines einzigen Menschen ca. 3 Gigabyte (3.000 Megabyte) an Speicherplatz. Auf Grund dieser Datenmengen und der Notwendigkeit diese Daten möglichst rasch zu verarbeiten, haben Experten begonnen sich mit Lösungsansätzen zur Analyse und Verwaltung von großen Datenmengen, so genannten Big Data, zu beschäftigen.

Am 11. Februar 2013 wurde nun das Projekt Mr.SymBioMath, das sich in den kommenden Jahren intensiv mit der Datenverarbeitung in der Genetik beschäftigen wird, mit einem ersten Workshop in Torremolinos (Spanien) gestartet. Das Projekt wird im 7. Rahmenprogramm der Europäischen Union mit über € 2,6 Millionen unterstützt und vereint die Kompetenzen aus unterschiedlichen Disziplinen – Medizin, Informatik, Bioinformatik, Statistik und Mathematik – von sechs Partnern aus drei Ländern. Koordiniert vom Laboratorium für Bioinformatik und Informationstechnologie (BitLAB) der Universität von Malaga sind die weiteren Partner aus Spanien das Krankenhaus Carlos Haya in Malaga und das Bioinformatikunternehmen Integromics, aus Österreich das Institut für Bioinformatik der Johannes Kepler Universität Linz und die RISC Software GmbH aus dem JKU Softwarepark Hagenberg und aus Deutschland das Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften in Garching bei München.

Der Projektleiter, Prof. Dr. Oswaldo Trelles, sieht eine der Stärken des interdisziplinären Projektteams auch im Fokus auf medizinische Anwendungen. „Die Lösungen die wir suchen“, sagt Trelles, „haben Anwendungen in einer Vielfalt von wissenschaftlichen Bereichen. Eine davon ist die personalisierte Medizin.“

Interdisziplinäre Forschung
Das Forschungsprojekt, das bis 2016 laufen wird, widmet sich der Entwicklung von Software und Methoden zur Datenanalyse in der Genetik. Es wird sich dabei vor allem zwei großen Herausforderungen stellen: dem effizienten Datentransfer von großen Datenmengen und der Überarbeitung und Neuentwicklung von Methoden und Modellen zum Vergleich von Genomen.

Das Institut für Bioinformatik der Johannes Kepler Universität Linz wird sich insbesondere der Entwicklung neuer Modelle für den Vergleich von Genomen, die Bestimmung der evolutionären Distanz zwischen unterschiedlichen Organismen und der Identifikation möglichen Zusammenhängen zwischen genetischen Variationen und der Reaktion von Patienten auf bestimmte Behandlungsmethoden widmen. Dies alles benötigt entsprechende Rechenleistung, die vom Leibniz-Rechenzentrum (LRZ), der Johannes Kepler Universität Linz, der Universität von Málaga und der RISC Software GmbH zur Verfügung gestellt wird. Gemeinsam mit dem LRZ wird sich die RISC Software GmbH um die Anwendungsentwicklung von Sammlung, Bereitstellung und Visualisierung der Daten kümmern. „Die Visualisierung von großen Datenmengen stellt eine besondere Herausforderung dar“, wie Dr. Christoph Anthes vom LRZ betont, „und oft ermöglichen erst graphische Repräsentationsmöglichkeiten, wie sie am LRZ zur Verfügung stehen, die Entdeckung und Erkennung von Zusammenhängen.“ Gemeinsam mit der Firma Integromics, die sich um die finale Anwendung und ein kommerzialisierbares Produkt kümmern wird, wird die Visualisierung und Analyse der Daten auch für Desktoprechner, sowie für Tablets und Smartphones umgesetzt werden.

Die entwickelten Anwendungen werden vom andalusischen Gesundheitsservice, dem Carlos Haya Krankenhaus und der Stiftung IMABIS evaluiert werden. Miguel Blanca, Leiter der Abteilung für Allergien des Carlos Haya Krankenhauses, erklärt, wie sich das Krankenhaus in Mr.SymBioMath einbringen wird: „Wir werden auf den Daten aufbauen, die auch im spanischen Netzwerk für Allergien (Red Nacional de Alergias) verfügbar sind und neue Sichtweisen auf diese Daten erlangen, die erst durch die interdisziplinäre Kooperation und die neuen Methoden und Modelle, die in diesem Projekt entwickelt werden, möglich werden.“ „Die technische Basis zur Bereitstellung der Daten und der effizienten Übertragung der erwarteten großen Datenmengen wird mit Lösungen der RISC Software GmbH ermöglicht“, wie Michael Krieger erklärt.

Neben den medizinischen sind auch Anwendungen in der Landwirtschaft und Zoologie möglich. „Die Ergebnisse dieses Projekts können auch bei der Säuberung und Wiederherstellung von infizierten und verschmutzten Bereichen angewendet werden“, so Professor Trelles. „In diesen Szenarien könnten Organismen eingesetzt werden um Schadstoffe in einer bestimmten Region zu vernichten. Eine Aufgabe – also die Auswahl, welcher Organismus ideal für welchen Schadstoff ist –, bei der die Ergebnisse des Projekts Schnelligkeit und vor allem auch Genauigkeit beisteuern können.“

Über das Projekt
Das Projekt High Performance, Cloud and Symbolic Computing in Big-Data Problems applied to Mathematical Modeling of Comparative Genomics (Mr.SymBioMath) mit einer Laufzeit von Februar 2013 bis Januar 2017 wird von der europäischen Union im Programm Inudstry-Academie Partnerships and Pathways (IAPP) unter der Vertragsnummer 324554 gefördert. www.mrsymbiomath.eu

Partner-Konsortium