20 February 2008

Die geheime Liste der ID-Voraussagen... [2. Teil]

Hier also die dritte und letzte "ID-Vorhersage", die sich laut Dembski bestätigt hat. Nicht wirklich.
(3) Conservation of information results (also referred to as No Free Lunch theorems, which are well established in the engineering and mathematical literature — see www.EvoInfo.org) indicate that evolution requires an information source that imparts at least as much information to evolutionary processes as these processes in turn are capable of expressing. In consequence, such an information source (i) cannot be reduced to materialistic causes (e.g., natural selection), (ii) suggests that we live in an informationally open universe, and (iii) may reasonably be regarded as intelligent. The conservation of information counts as a positive theoretical reason to accept intelligent design and quantifies the informational hurdles that neo-Darwinian processes must overcome. Moreover, ID theorists have applied these results to actual biological systems to show that they are unevolvable by Darwinian means. ID has always predicted that there will be classes of biological systems for which Darwinian processes fail irremediably, and conservation of information is putting paid to this prediction.
Wieder mein bester Versuch, dass sinngemäß in freier Übersetzung wiederzugeben:


Die Konservierung von Information (auch bekannt als das "No Free Lunch"-Theorem, das in der technischen und mathematische Literatur weithin anerkannt ist) erfordert, dass Evolution eine Informationsquelle benötigt, die mindestens genau so viele Informationen zum evolutionären Prozess beisteuert wie diese Prozesse ihrerseits erzeugen können. Daraus folgt, dass eine solche Informationsquelle (i) nicht auf einen natürlichen (materialistischen) Ursprung zurückgeführt werden kann (z. B. auf natürliche Selektion ), (ii) es wahrscheinlich macht, dass wir in einem für Informationen offenen Universum leben und (iii) diese Informationsquelle vernünftigerweise als intelligent angesehen werden kann. Die Konservierung von Information zählt als positiver theoretischer Beleg für die Akzeptanz von Intelligentem Design und misst die Informationshürden, die von Neodarwinistischen Prozessen überwunden werden müssen. Mehr noch, ID Theoretiker haben diese Ergebnisse auf tatsächliche biologische Systeme angewandt, um zu zeigen, dass sie sich nicht durch Darwinistische Mechanismen entwickelt haben können. ID hat immer vorausgesagt, dass es eine Klasse von biologischen Systemen gibt, die durch Darwinische Prozesse nicht entstanden sein können und die Konservierung von Information untermauert diese Voraussage.

Das musste ja kommen.

Fangen wir mal ganz einfach an. Die No Free Lunch Theoreme wurde von Wolpert und Macready entwickelt [Wolpert & Macready (1997). No free lunch theorems for optimization. IEEE Transactions on Evolutionary Computation] und sind tatsächlich anerkannt. Überhaupt nicht anerkannt ist hingegen Dembskis Anwendung dieser Theoreme auf biologische Evolution.
Da muss ich leider ein bisschen ausholen, aber Ihr seid ja Kummer und lange Posts von mir gewöhnt...

Die Theoreme beziehen sich auf (Computer-) Suchalgorithmen. Wenn diese zur Suche nach "guten" Lösungen von (in mathematischer Form dargestellten) Problemen angewandt werden, dann sind im Durchschnitt, wenn sie auf eine Vielzahl verschiedener Probleme angewandt werden, alle Suchalgorithmen gleich gut bzw. genauer formuliert, statistisch kommen sie gleich schnell zum "Ziel", einer "guten" Lösung.
Die Abbildung [Quelle: Wikipedia] soll dieses Phänomen verdeutlichen. Zwei verschiedene Algorithemen A und B werden auf verschiedene Probleme angewandt. Bei manchen kommen sie gleich schnell ans Ziel, bei manchen muss der eine Algorithmus mehr Schritte durchlaufen, bis er zu einer guten Lösung kommt, bei manchen der andere. Insgesamt aber, auf alle (in diesemFall 8) Durchläufe, benötigen beide Algorithmen eine identische Zahl von Einzelschritten (12). Eine besonders gute Leistung in einem Problembereich "kostet" sozusagen Leistung in einem anderen Bereich, also: Nichts ist umsonst oder There is no free lunch.
Weil dies für alle möglichen Suchalgorithmen gilt, auch für einen Suchalgorithmus, der "zufällig" sucht, ist *im Durchschnitt* ein spezialisierter Suchalgorithmus nicht besser als eine zufällige Suche.

Sehr viel einfacher formuliert Olle Häggström, ein schwedischer Mathematiker, die Kernaussage der NFL Theoreme:
Wenn man ein gut gemischtes Kartenspiel mit dem Rücken nach oben auf dem Tisch ausbreitet und durch Umdrehen so weniger Karten wie möglich das Pik-Ass finden will, gibt es keine Suchmethode, die besser als irgendeine andere funktioniert.
Diese Theoreme gelten nur für sogenannte "Black Blox"-Algorithmen, d. h. die Suchalgorithmen haben keine Kenntnisse über das Problem, das es zu lösen gilt, außer die Größe des "Suchraumes" (die Anzahl theoretisch möglicher Lösungen) und den "Fitness"-Wert der während der Suche schon gefundenen Lösungen (der Fitnesswert ergibt sich aus der "Güte" der jeweiligen Lösung). Zudem darf sich die "Fitness"-Landschaft während der Suche nicht verändern, bzw. wenn sie sich verändert, darf diese Veränderung nicht von der Suche selbst beeinflusst sein (die Fitnesslandschaft ergibt sich aus einer Fitnessfunktion, der mathematischen Darstellung des Problems). Nebenstehend ist die bildliche Darstellung einer zufällig generierten Fitnesslandschaft zu sehen. Die Fläche symbolisiert den Suchraum mit allen theoretisch möglichen Lösungen, die senkrechten Linien stellen den Fitnesswert jeder einzelnen Lösung dar.

Dembski argumentiert nun, dass sich Evolution wie ein "Black Box"-Suchalgorithmus in einer unbekannten Fitnesslandschaft verhält. Wenn der Suchalgorithmus keine "Kenntnis" über das zu lösende Problem hat (oder die zur Generierung der Fitnesslandschaft verwendeten mathematischen Funktion), kann er keine bessere Leistung bringen als eine rein zufällige Suche. Eine "gute" Lösung mit einem hohen Fitnesswert zufällig zu finden, ist aber in einem großen Suchraum (bei sehr vielen theoretischen Lösungen) nahezu unmöglich.
Und da bringt Dembski dann seine CSI ins Spiel, die "complex specified information". Diese ist laut Dembski u. a. dadurch definiert, dass sie eine Wahrscheinlichkeit der zufälligen Entstehung von unter 10-150 aufweist, das wäre also die Wahrscheinlichkeit, eine "gute" Lösung in einem Suchraum von 10150 theoretisch möglichen Lösungen zufällig zu finden.
Dembski behauptet, da es biologische Systeme gäbe, die CSI besitzen, diese aber nicht durch eine zufällige Suche (ohne einen "Input" von Information über die Gestalt der Fitnesslandschaft) "gefunden" worden sein könnten, müsse es einen Informationsfluss von außerhalb gegeben haben. Und wer "sendet" die Information? Natürlich der Designer.

Nun gibt's da aber ein paar Probleme.
Erstens, laut Wolpert, dem Miterfinder der NFL-Theoreme, beweist Dembski nicht, dass die NFL-Theoreme auf Evolution anwendbar sind. Er veröffentlichte seine Bemerkungen zu Dembski in den Mathematical Reviews [Wolpert (2003). Mathematical Reviews 12, review 2003b:00012]. Daraus:
I say Dembski "attempts to" turn this trick because despite his invoking the NFL theorems, his arguments are fatally informal and imprecise. Like monographs on any philosophical topic in the first category, Dembski's is written in jello. There simply is not enough that is firm in his text, not sufficient precision of formulation, to allow one to declare unambiguously 'right' or 'wrong' when reading through the argument. All one can do is squint, furrow one's brows, and then shrug. [...]
However, Dembski does not do this. The values of the factors arising in the NFL theorems are never properly specified in his analysis. [...]
Indeed, throughout there is a marked elision of the formal details of the biological processes under consideration. Perhaps the most glaring example of this is that neo-Darwinian evolution of ecosystems does not involve a set of genomes all searching the same, fixed fitness function, the situation considered by the NFL theorems. Rather it is a co-evolutionary process. Roughly speaking, as each genome changes from one generation to the next, it modifies the surfaces that the other genomes are searching. And recent results indicate that NFL results do not hold in co-evolution.
It may well be that there is a major mystery underlying the performance of some search processes that one might impute to the historical transformations of ecosystems. But Dembski has not established this, not by a long shot.
Das muss ich, glaube ich, nicht wirklich alles übersetzen. Um es mal zusammenzufassen,
Dembskis Argumente sind schlampig und unpräzise ("written in jello"), er gibt nicht genau an, welche Werte er für seine Analyse den verschiedenen Einflussgrößen zuweist, die in den NFL Theoremen vorkommen, er bezieht sich nicht auf die Einzelheiten der biologischen Prozesse, die er behandelt.
Die Anwendbarkeit der NFL Theoreme auf biologische Prozesse ist fraglich, und auf gar keinen Fall hat Dembski gezeigt, dass sie anwendbar sind.

Ziemlich vernichtend, würde ich sagen. Und Wolpert ist nicht der Einzige.

Olle Häggstrom, ein schwedischer Mathematiker/Statistiker, veröffentlichte letztes Jahr "Intelligent Design and the NFL Theoremes" in Biology and Philosophy (2007; 22:217-230).

Auch er kommt zu dem Schluss, dass die NFL Theoreme nicht anwendbar sind.

Er schreibt:
A minimum requirement, however, for the NFL argument to merit taking seriously, is that the actual fitness landscape exhibits at least some rough resemblance with what one would expect to arise from a model based on (7). Alas, it does not. I will now show that any reasonably realistic model for the actual fitness landscape will produce something that is very, very different from what (7) produces. [...]
[(7) bezieht sich auf die Aussage Dembskis, das nicht angenommen werden kann, der "Darwinsche" Algorithmus würde bessere Ergebnisse als eine zufällige Suche erbringen,
if the fitness function f is generated at random according to uniform distribution among all the [S][V] possibilities,...
was so viel heißt wie: die Fitnesslandschaft ist völlig zufällig angeordnet, benachbarte Lösungen (S) können völlig unterschiedliche Fitness-Werte haben.
aus: Dembski W.A. 2002. No Free Lunch: Why Specified Complexity Cannot Be Purchased without Intelligence (Link zu Amazon). Roman & Littlefield, Lanham, MA.]

Frei übersetzt und zusammengefasst:

Eine minimale Voraussetzung, damit das NFL Argument ernst genommen werden kann, ist, dass eine tatsächliche Fitnesslandschaft wenigstens grob dem ähnelt, was man nach Anwendung eines auf (7) basierenden Modells erhalten würde. Dem ist nicht so.

An einem Beispiel, dass auch Dembski verwendet (ein Set aller möglichen DNA-Sequenzen einer Länge als theoretisch mögliche "Lösungen", die von dem Darwinschen Algorithmus nach "guten" Lösungen duchsucht wird), zeigt er dann auf, warum nicht:
It follows that, with overwhelming probability, a fitness landscape produced by (7) will exhibit no significant tendency for neighboring DNA sequences to give any more similar values than do two totally unrelated DNA sequences.
On the other hand, any realistic model for a fitness landscape will have to exhibit a considerable amount of what I would like to call clustering, meaning that similar DNA sequences will tend to produce similar fitness values much more often than could be expected under model (7). In particular, if we take the genome of a very fit creature – say, you or me – and change a single nucleotide somewhere along the DNA, then we expect with high probability that this will still produce an organism with high fitness. In contrast, under assumption (7), changing a single nucleotide is just as bad as putting together a new genome
from scratch and completely at random, something that we have already noted (see Section ‘Dembski’s application to evolution’) will with overwhelming probability produce not just a slightly less fit creature, but no creature at all. (If the true fitness function had this property, then, given the human mutation rate, none of us would be around.)
Mit überwältigender Wahrscheinlichkeit wird eine Fitnesslandschaft, die durch eine zufällig generierte Fitnessfunktion erstellt wurde, keine Tendenz zeigen, benachbarten DNA Sequenzen [DNA-Sequenzen, die sich sehr ähnlich sind] einen eher vergleichbaren Fitness-Wert zuzuordnen als zwei völlig unterschiedlichen DNA-Sequenzen. Ein realistisches Modell einer Fitnesslandschaft muss aber einen beträchtlichen Anteil von "Clustering" aufweisen, also dass nahe verwandte/ähnliche DNA-Sequenzen sehr viel häufiger ähnliche Fitness-Werte aufweisen als das mit dem Modell unter (7) [zufällig generiert] zu erwarten wäre. Wenn wir das Genom einer sehr fitten Kreatur nehmen – mich oder Dich z. B. – und eine einziges Nukleotid ändern, dann können wir mit hoher Wahrscheinlichkeit erwarten, dass wir immer noch einen Organismus mit sehr hoher Fitness erhalten. Im Gegensatz dazu, unter Annahme von (7), ist die Abänderung eines einzigen Nukleotids genauso schlecht wie die komplette und völlig zufällige Neuerstellung eines Genoms, was natürlich mit überwältigender Wahrscheinlichkeit nicht einfach eine etwas weniger fitte Kreatur produzieren würde, sondern überhaupt gar nichts (Wenn die wirkliche Fitnessfunktion diese Eigenschaft hätte, wäre bei der Mutationsrate von Menschen keiner von uns hier).

Jepp, da kann ich ihm nur zustimmen (Die Abbildung zeigt eine Fitnesslandschaft, die den tatsächlichen Verhältnissen viel näher kommt als eine zufällig generierte wie in der obigen Abbildung).


Weitere Kritiken an Dembskis Anwendung der NFL Theoreme finden sich bei TalkOrigins:
Richard Wein [auch Quelle der beiden Fitnesslandschaften]
WA Dembskis Reaktion
Richards Wein Antwort
WA Dembskis Reaktion
(Weitere Links finden sich auf der erstgenannten Seite)

Auf TalkReason:
Shallit und Elsberry [.pdf]
Tellgren [.pdf]

Eine Review von H. Allen Orr


Wenn aber Dembskis Anwendung der NFL Theoreme nicht zulässig ist, dann ist auch sein daraus abgeleitetes "Gesetz" der Konservierung von Information nur in Dembskis Fantasiewelt gültig. Wenn wir uns also noch mal Dembskis "Voraussage" anschauen:
ID hat immer vorausgesagt, dass es eine Klasse von biologischen Systemen gibt, die durch Darwinische Prozesse nicht entstanden sein können und die Konservierung von Information untermauert diese Voraussage.
dann kann man nur sagen, netter Versuch, aber wohl eher nicht.

MfG,
JLT

1 Kommentare:

darwin upheaval said...

Hi JLT,

irgendwie muss mir dieser Beitrag über NFL "durch die Lappen" gegangen sein. Hab ihn gerade erstmals gelesen und bin begeistert. Sehr schön und allgemein verständlich erklärt!