Entwicklung einer Optimierungsmethode zum Auswerten von Protein-NMR-Spektren mit Hilfe eines Genetischen Algorithmus
BücherAngebote / Angebote:
Inhaltsangabe:Zusammenfassung:
In der vorliegenden Diplomarbeit wurde ein Genetischer Algorithmus, der die Zuordnung der Residuenummern zu deren 15N-HSQC-Signalen automatisieren und optimieren soll, entwickelt. Die Informationen der 15N-HSQC- und NOESY-Messung können erst nach der richtigen Zuordnung der Residuenummern im Protein verwertet werden. Diese Aufgabe soll der Genetische Algorithmus erledigen, da dies in der derzeitigen wissenschaftlichen Praxis oftmals nur per Hand möglich ist.
Der erste Teil der Arbeit behandelt die Theorie der NMR (Nuclear Magnetic Resonance Spectroscopy) und des Genetischen Algorithmus, soweit dies für das Verständnis der Arbeit nötig ist.
Im zweiten Teil der Arbeit wird das entwickelte Programm erläutert und die einzelnen Klassen sowie die enthaltenen Funktionen erklärt. Auf die Funktionen der Klasse PeakInterpretation.java wird speziell eingegangen, da diese Klasse die genetischen Operatoren Rekombination und Crossover enthält.
Im nächsten Abschnitt werden Programmparameter festgelegt und die Ergebnisse der Testreihen beschrieben. Nach den ersten Läufen wurde ersichtlich, dass mit der vorhandenen Fitnessfunktion keine guten Ergebnisse erzielt werden konnte. Die Fitnessfunktion wurde daher im Anschluss an diese ersten Testläufe geändert, indem man das Bitset proceed entfernte, das für die Überprüfung von doppelt vergebenen Residuenummern eingesetzt wurde (siehe Abbildung 55 Seite 45).
Mit folgenden Parametereinstellungen wurden im nächsten Teil der Arbeit die Proteine mdm2 und b8q ausgewertet.
- Mutationsrate: 0.6
- Rekombinationsrate: 0.9
- Populationsgröße: 100
- Generationszyklen: 50
- Generationsläufe: 0 - 20 000
Mit den oben angegebenen Parametereinstellungen konnte das Protein mdm2
bis zu 75 % ausgewertet werden.
Beim Protein b8q war die erzielte Zuordnungsrate geringer als bei Protein mdm2. Bei den Läufen wurden maximal 19 Residuenummern richtig zugeordnet. Dies bedeutet, dass das Protein zu 58 % die richtige Zuordnung besitzt. Zur Verbesserung dieses Ergebnisses innerhalb eines Laufes wurden weitere interessante Spektren mit einem Fitnesswert, der nahe am maximalen Fitnesswert des Laufes liegt, mit betrachtet. Dadurch war es möglich die Zuordnungsrate auf 61 % zu erhöhen. Des weiteren konnte bei diesen Läufen festgestellt werden, dass es Spektren mit demselben Fitnesswert gibt, aber mit unterschiedlicher Anzahl an richtig zugeordneten Residuenummern. Der Grund liegt darin, dass mit der 1. und [...]
Folgt in ca. 10 Arbeitstagen