Untersuchung von chemometrischen Methoden zur Erstellung und Validierung von QSAR-Modellen

Lieferzeit: Lieferbar innerhalb 14 Tagen

49,80 

Berichte aus der Pharmazie

ISBN: 3844045511
ISBN 13: 9783844045512
Autor: Baumann, Desiree Ingrid
Verlag: Shaker Verlag GmbH
Umfang: 320 S., 48 farbige Illustr., 48 Illustr.
Erscheinungsdatum: 14.07.2016
Produktform: Kartoniert
Einband: PB
Artikelnummer: 9491700 Kategorie:

Beschreibung

In der vorliegenden Arbeit wurden mathematische Methoden zur Erstellung und Validierung von QSAR-Modellen untersucht. Hierbei wurde die Methode der Doppelten Kreuzvalidierung (die zur simultanen Modellselektion und Modellbewertung eingesetzt wird) systematisch untersucht, da die Validität dieser Methode häufig in der Literatur angezweifelt wird. Mithilfe umfangreicher Simulationsstudien und realer Datensätze konnte gezeigt werden, dass die DCV selbst unter Modellunsicherheit das Potential hat, den Vorhersagefehler der Modelle ohne einen statistisch nachweisbaren systematischen Fehler zu schätzen. Hiermit wurde belegt, dass die DCV tatsächlich eine valide Methode ist. Ferner gelang es, den Einfluss der Modellselektion auf die quantitative Zusammensetzung des Vorhersagefehlers in der Simulationsstudie zu beschreiben. Da die DCV sowohl ohne als auch mit Ensemble-Bildung angewendet werden kann, wurde der Einfluss der Ensemble-Bildung auf den Vorhersagefehler und die Leistungsfähigkeit der DCV systematisch untersucht und mithilfe von Simulationsdaten und realen Daten gezeigt. Da das Potential der DCV von frei wählbaren Parametern wie z.B. der Testdatensatzgröße abhängt, wurde im Rahmen der Arbeit der Einfluss der Parameterauswahl auf die Leistungsfähigkeit der DCV analysiert. Letztlich konnte ein umfassendes Regelwerk entwickelt werden, das dem Anwender ermöglicht, die Parameter der DCV derart auszuwählen, dass eine hohe Modellqualität resultiert und zugleich eine zuverlässige Modellbewertung möglich ist. Ferner wurde das Potential der modernen Variablenselektionsmethoden (wie z.B. CAR-scores) und der klassischen Variablenselektionsverfahren (die kombinatorisch nach der besten Variablensubmenge suchen) untersucht. Es konnte gezeigt werden, dass mit modernen Variablenselektionsmethoden in der Regel vergleichbare oder bessere Ergebnisse als mit Methoden der klassischen Variablenselektion erzielt werden. Ferner wurde in der vorliegenden Arbeit der R2test, der als relatives Gütekriterium zur Modellbewertung bei QSAR-Modellen eingesetzt wird, untersucht, da seine komplexen Eigenschaften bisher noch weitestgehend unverstanden sind. Im Rahmen dieser Arbeit gelang es erstmalig, den systematischen Fehler des R2test in Abhängigkeit von der Testdatensatzgröße zu erklären, indem die zugrundeliegende Verteilungsdichte und der Erwartungswert des R2test unter einigen Annahmen hergeleitet wurden. Um den systematischen Fehler zu korrigieren, wurde im Rahmen der Arbeit ein neuer Ansatz entwickelt, der häufig den bekannten Schätzverfahren (die auf etablierten Gütekriterien basieren) deutlich überlegen ist, da er selbst für sehr kleine Testdatensätze realistische Schätzungen der Vorhersagekraft liefert. Die Vorteile des neu entwickelten Ansatzes wurden mit einem mathematischen Beweis dargelegt und konnten sowohl anhand umfangreicher Simulationsstudien als auch anhand realer Daten belegt werden.

Das könnte Ihnen auch gefallen …