Hi Pablo,
Hm, ich habe auch einen leisen Verdacht, was vielleicht schiefgelaufen sein könnte, bin aber noch nicht sicher, ob das mit deiner Idee übereinstimmt.
Eine Möglichkeit, den Grad der Abweichung darzustellen, also eine Skala für die X-Achse, habe ich bisher noch nicht entdeckt. Zumindest nichts, was über die Länge der Verbindungen in X-Richtung, die ja bereits ein relatives Mass für die Veränderung sein sollte, hinausginge.
Aber wenn man sich nochmals vor Augen führt, dass bereits zwischen den in Beitrag #46 verglichenen Arten Abweichungen von über 40% vorkamen, erscheint es mir nicht undenkbar, dass es bei derartigen oder noch größeren Abweichungen zu fehlerhaften Alignments kommen könnte, also eine zufällige Übereinstimmung eine engere Verwandtschaft vortäuschen könnte, als eigentlich gegeben ist.
Bei einer rein zufälligen Anordnung der Basen in einer durchschnittlichen Länge der ITS-Sequenz von 750 würde sich eine Abfolge von 3 Basen immerhin ca. 12x wiederholen, also absolut nicht zweifelsfrei zuzuordnen sein, 4 bestimmte Basen hintereinander kommen immerhin noch ca. dreifach vor, und sogar 5 hintereinander könnten sich mit einiger (ca. 70%) Wahrscheinlichkeit noch ein zweites Mal in derselben Sequenz wiederholen. Bei noch längeren Ketten von 6, 7 und 8 Basen sinkt die Wahrscheinlichkeit einer zufälligen Wiederholung dann auf ca. 20%, 5% und 1%. Das nur mal so als theoretische Erwägung.
Evtl. würde das auch die vermeintliche Nähe zwischen Dieters Stockschwämmchen und einer Tricholoma-Art teilweise erklären? Das Thema wollte ich von hier ja ohnehin noch verlinken:
http://www.pilzforum.eu/board/…chen?pid=354209#pid354209
Ich habe daraufhin noch etwas bei den Alignment-Methoden herumgesucht. Eine von den sehr viel langsamen iterativen (Q-INS-i) wird explizit für stark divergente Sequenzen empfohlen, und sie scheint dann auch stabilere Bäume zu ergeben. Ich habe damit die beiden Boletales-Bäumchen erneut erzeugt, und zumindest wirft die eine zusätzliche Base am Ende der Tylopilus-Sequenz nun nicht mehr den ganzen Baum um. Soweit bin ich also schon ganz zufrieden.
Und dem Wurzelknoten sollte man evtl. noch etwas Beachtung schenken, die von MAFFT erstellten Bäume sind nämlich unbewurzelt (unrooted) bzw. das, was sich als Wurzelknoten darstellt, ist vermutlich nur der "genetische Mittelpunkt" (-> mid-point rooted), was irreführend sein kann. Auf dieser Seite ist das sehr gut erklärt, zwar auf englisch, aber die Grafiken allein sagen schon eine ganze Menge:
http://cabbagesofdoom.blogspot…ot-phylogenetic-tree.html
LG, Craterelle