Sporenmessung - genau genommen

**Tricholomopsis** · 8. Juli 2017

Lieber Jens,

kein Grund zur Aufregung. Wie ich schon schrieb, bleibe ich dabei, dass ich bei Sporenmaßen eher eine rechtsschiefe Verteilung als eine Normalverteilung annehme und erwarte. Eine Diskussion darüber scheint hier leider - wie ich finde - zwecklos, da diese nicht sachlich, sondern emotional geführt wird. Und da bei einem eigentlich sachlichen Thema eine emotionale Diskussion m.E. wenig zielführend ist, bin ich wie gesagt raus aus der Diskussion und gehe daher auch nicht weiter auf die Bemerkungen zu Einzelsätzen ein.

LG
Christoph

**Craterelle** · 12. Januar 2018

Hallo Dieter,

Ich wollte nochmal danke sagen. Du hast für deinen Eröffnungspost ziemlich viel Kritik geerntet, ich finde ihn aber enorm hilfreich, um den Hintergrund der verschiedenen Notationen zu verstehen.

LG, Craterelle

**Craterelle** · 4. März 2018

Hallo zusammen,

das folgende habe ich in Reaktion auf die vielen von Jens erstellten Beiträge im DGfM-Forum erstellt.

Ich schreibe es hier, weil

das Beispiel von hier stammt,
hier mein mykologisches Zuhause ist,
der Beitrag hier hoffentlich dauerhaft verfügbar bleibt.

Es ist nicht unbedingt mein Ziel, mit Jens darüber zu diskutieren (weil es nach den bisherigen Erfahrungen wenig fruchtbar sein könnte), sondern mir selbst ein klareres Bild zu verschaffen und vielleicht auch Mitlesenden Denkansätze zu geben.

Evtl. werde ich es dennoch im DGfM-Forum einstellen oder verlinken, um ihm Gelegenheit zu geben, darauf zu reagieren.

________________________________________

Um die Fragestellung nach dem angemessenen Umfang einer Stichprobe sowie der Anwendbarkeit von statistischen Berechnungen für Normalverteilungen auf nicht normalverteilte Daten weiter zu beleuchten, habe ich mir als Beispiel nochmals Dieters Scheidling vorgenommen. Die Daten der Messreihe mit 120 Wertepaaren sind im hier veröffentlicht:
https://www.pilzforum.eu/board…mmen?pid=363509#pid363509

So sieht die Längenverteilung aus, sie ist - leicht erkennbar - nicht normalverteilt.

Das repräsentiere also unsere Grundgesamtheit. Ob nun von einem Fruchtkörper, einer Kollektion oder einer Art ist an dieser Stelle vollkommen egal, hier will ich auf die mathematischen Gegebenheiten hinaus.

Der Shapiro-Wilk-Test erkennt ebenfalls, dass es sich wahrscheinlich nicht um eine Normalverteilung handelt.

Lässt man wie in Jens' Programm ("Smaff") voreingestellt den Nalimov-Test heraus, kann man mit Hilfe der drei anderen Test zwar einige "Ausreißer" entfernen, nur ergibt das immer noch keine Normalverteilung.

Mit Nalimov-Test erhält man zwar eine, verliert aber 20% des Probenumfangs.

Also reduziere ich den Stichprobenumfang durch zufällige Auswahl auf 40 bzw. 30 Werte. Dies habe ich zur Sicherheit zweimal mit verschiedenen Zufallsreihen durchgeführt, erhalte also 2 x 4 Stichproben Ã 30 Wertepaaren bzw. 2 x 3 Ã 40.

Normalverteilt erschienen davon
bei U=40: 1 von 6
bei U=30: 2 von 8

und nach Elimination von "Ausreißern" ohne Nalimov-Test
bei U=40: 3 von 6
bei U=30: 7 von 8

Also niemals 100%.

Testweise habe ich den Umfang noch weiter reduziert, aber auch bei 2 x 12 Stichproben Ã 10 war noch eine dabei, der man mit sämtlichen Tests (hier inkl. Nalimov) nicht beikommen konnte. Nur 10 Sporen für eine statistische Auswertung heranzuziehen würde allerdings wohl niemand ernsthaft empfehlen. Bleiben wir also vorerst bei U=30 als dem Wert, bei dem man zumindest mit einiger Wahrscheinlichkeit durch Eleminieren von "Ausreißern" eine vermeintliche Normalverteilung darstellen kann.

Aus den 8 Stichproben habe ich das Programm also die Mittelwerte und den 95%-Konfidenzbereich für selbige berechnen lassen. Ein besonderer Vorteil an statistisch berechneten Werten ist ja, das man zuverlässig vorhersagen kann, mit welcher Wahrscheinlichkeit eine weitere Stichprobe aus derselben Grundgesamtheit in die errechneten Mittelwertgrenzen fällt.

Tatsächlich liegt beim paarweisen Vergleich von Mittelwerten und Mittelwertgrenzen in 7 von 56 Fällen (12,5%) der Mittelwert der einen außerhalb der Konfidenzgrenzen der anderen Probe.

Die Vorhersage von Wahrscheinlichkeiten könnte also trügerisch sein, wenn die Grundgesamtheit nicht normalverteilt ist. Hier wären ggf. mehr Versuche mit anderen Zufallsverteilungen nötig, um die Beobachtung zu erhärten oder zu entkräften.

Die Mittelwerte schwanken mit einer Standardabweichung von 0,11, was vertretbar erscheint und bei so kleinen Stichproben auch nicht verwunderlich. Die Schwankungsbreite bei den Medianen ist auch nicht wesentlich geringer (0,09), aber die Beschreibung mit Median und Quantilsgrenzen hat den Vorteil, dass man ohne irgendwelche Nachteile mehr Werte messen könnte, wenn die Schwankungen zu groß sein sollten (bei U=60 im Beispiel: 0,07).

Einen weiteren Punkt hatte Dieter schon herausgearbeitet:

Der 95%-Konfidenzbereich für die Verteilung der Werte ist bei rechtsschiefen Verteilungen systematisch nach links (zu den kleineren Werten hin) zu groß, d.h. er erstreckt sich über Bereiche, in denen in der Grundgesamtheit keine Werte vorkommen. Ich führe das jetzt nicht noch ein weiteres Mal aus, für Interessierte:
https://www.pilzforum.eu/board…mmen?pid=363471#pid363471

Quantilsgrenzen bilden in diesem Fall die Realität offenbar zutreffender ab.

Grafisch dargestellt: links in Grün die errechneten 95%-Populationsgrenzen und Mittelwerte für die 8 Stichproben, rechts in Rot die 95%-Quantilsgrenzen und Mediane. Gelb hinterlegt die Bandbreite der Grundgesamtheit (100%).

Meine Schlussfolgerungen:

30-40 Messungen sind zu wenig, um zu beurteilen, ob in der Grundgesamtheit eine Normalverteilung vorliegt.
Liegt keine Normalverteilung vor, liefern statistische Methoden, die auf der Normalverteilungsannahme beruhen, irreführende Ergebnisse.
Die Messwerte sind in diesem Fall mit Median und Quantilsgrenzen aussagekräftiger beschrieben.

Man könnte sogar argumentieren, dass diese Art der Beschreibung allgemein vorzuziehen wäre, da sie für nicht normalverteilte Stichproben besser geeignet ist und für normalverteilte ähnlich gut wie errechnete Werte. Mediane und Mittelwerte fallen bei symmetrischen Verteilungen zusammen. Ebenso werden Quantile und berechnete korrespondiere Wahrscheinlichkeitsbereiche zusammenfallen, wenn die Daten normalverteilt sind.

LG, Craterelle

**Tricholomopsis** · 5. März 2018

Servus Craterelle,

danke für die Zusammenstellung und Auswertung der Daten. Dass die Sporenlängen hier nicht nbormalverteilt sind, steht ja auch durch den Test, den Dieter schon gemacht hat, fest. Die Zwangsumformung zu einer Normalverteilung, also das Ignorieren der wahren Verteilung, erscheint mir daher ebenfalls willkürlich.

Was ich mich aber generell immer noch frage... Ich würde die Sporen ohne Statistik wie folgt angeben:

(n = 120) (5,5-)5,75-6,7-8,25(-8,5) x (3,0-)3,5-3,7-4,25(-4,75) µm

Ich habe die Maße jeweils auf Viertelmikrometer gerundet, was der theoretischen Auflösung entspricht - es geht also nicht um drei gültige Ziffern bei der Längen-/Breitenangabe.

Inwiefern ist es hilfreich, die Sporenmaße durch eine recht komplizierte Methode zu errechnen, wenn die Ergebnisse sehr sehr ähnlich sind. Meine Angabe entspricht doch recht gut den roten Quantilsgrenzen. Ich habe jetzt nur den Mittelwert und nicht den Median angegeben (die unterstrichenen Werte). Letzteres geht ja auch problemlos.

Es wird ja immer wieder behauptet, die Min-Max-Methode sei gar nicht reproduzierbar. Ich meine aber zu erkennen, dass sie hier im Rahmen der Messgenauigkeit sehr ähnliche Resultate ergibt. Insofern ist sie m.E. durchaus anwendbar und vergleichbar. Man muss nur immer angeben, wie viele Sporen vermessen wurden, da davon ja abhängt, wie breit der Min-Max-Bereich ist.

LG
Christoph

**Craterelle** · 5. März 2018

Zitat von Tricholomopsis

Servus Craterelle,

danke für die Zusammenstellung und Auswertung der Daten. Dass die Sporenlängen hier nicht nbormalverteilt sind, steht ja auch durch den Test, den Dieter schon gemacht hat, fest. Die Zwangsumformung zu einer Normalverteilung, also das Ignorieren der wahren Verteilung, erscheint mir daher ebenfalls willkürlich.

Was ich mich aber generell immer noch frage... Ich würde die Sporen ohne Statistik wie folgt angeben:

(n = 120) (5,5-)5,75-6,7-8,25(-8,5) x (3,0-)3,5-3,7-4,25(-4,75) µm

Ich habe die Maße jeweils auf Viertelmikrometer gerundet, was der theoretischen Auflösung entspricht - es geht also nicht um drei gültige Ziffern bei der Längen-/Breitenangabe.

Inwiefern ist es hilfreich, die Sporenmaße durch eine recht komplizierte Methode zu errechnen, wenn die Ergebnisse sehr sehr ähnlich sind. Meine Angabe entspricht doch recht gut den roten Quantilsgrenzen. Ich habe jetzt nur den Mittelwert und nicht den Median angegeben (die unterstrichenen Werte). Letzteres geht ja auch problemlos.

Es wird ja immer wieder behauptet, die Min-Max-Methode sei gar nicht reproduzierbar. Ich meine aber zu erkennen, dass sie hier im Rahmen der Messgenauigkeit sehr ähnliche Resultate ergibt. Insofern ist sie m.E. durchaus anwendbar und vergleichbar. Man muss nur immer angeben, wie viele Sporen vermessen wurden, da davon ja abhängt, wie breit der Min-Max-Bereich ist.

LG
Christoph

Alles anzeigen

Hallo Christoph,

dass ich die Methode, die Messergebnisse mit Quantilsgrenzen zu beschreiben, für generell geeignet halte, hatte ich ja im letzten Beitrag schon geschrieben.

Die Breite des Quantilsbereich sollte aber eigentlich nicht (bzw. allenfalls vernachlässig gering) stetig in Korrelation zum Umfang ansteigen, oder meinst du das gar nicht?

Wenn das passiert, ist m.E. die Stichprobe zu klein oder die Quantilsgrenzen zu groß gewählt. Die 95%-Grenzen hatte ich nur zum Vergleich mit den statistisch errechneten gewählt, an ihnen lässt sich das Problem vielleicht aber ganz gut illustrieren.

https://upload.wikimedia.org/w…deviation_diagram.svg.png

Auf den gesamten Bereich (in der Grafik hellblau) beidseitig außerhalb des 95%-Konfidenzintervals (das dunklere und mittlere Blau) entfallen nur 5% der Stichprobe, also 1 von 20. Wenn wir jetzt Messreihen mit nur 20 Werten betrachten, wird im Mittel jeder Probe ein Wert in diesem Bereich fehlen (entweder rechts oder links), und der 95%-Bereich wird dadurch zu klein ausfallen. Mit 40 Werten sollte die Situation schon besser sein.

Beim 80%-Intervall (dessen Grenzen würde in der Grafik im mittelblauen Bereich liegen, im linken Teil so etwa durch die 6, im rechten zwischen der 1 und der 3) sieht es auch bei kleineren Stichproben wesentlich besser aus, weil in diesen Bereichen mehr Werte vorhanden sind und diese entsprechend enger beieinander liegen. Aus diesem Grund würde ich diese Grenze bevorzugen.

Genau aus diesem Grund halte ich die Extremwerte (Minimum und Maximum der Stichprobe, häufig in Klammern mit angegeben wie bei dir) übrigens für die am wenigsten aussagekräftigen aller Angaben, da diese am stärksten von Stichprobengröße und Zufall abhängen.

Ich hoffe, wir reden jetzt nicht aneinander vorbei.

LG, Craterelle

P.S.: Deine Zahlen verstehe ich noch nicht so richtig. Sind das 95%- oder 80%-Grenzen? Es scheint zu nichts so ganz zu passen.

**Tricholomopsis** · 5. März 2018

Zitat von Craterelle

Die Breite des Quantilsbereich sollte aber eigentlich nicht (bzw. allenfalls vernachlässig gering) stetig in Korrelation zum Umfang ansteigen, oder meinst du das gar nicht?

Servus Craterelle,

nein, ich meine nicht die Breite des Quantilsbereichs, sondern die reine Min-Max-Abschätzung, die ohne Statistik erfolgt. Die ist natürlich - und das ist auch der Hauptkritikpunkt an ihr - in einem gewissen Maße willkürlich, da man ja "nachGefühl" auswählt, wo man nun die Grenzen ungefähr hinlegt und welche Werte man dann in Klammern dazu angibt, anstatt das sauber auszurechnen. Dafür geht es eben ohne zu rechnen. Diese geschätzten Min-Max-Werte sind von der Stichprobengröße abhängig und werden erst bei einer recht großen Anzahl gemessener Sporen stabiler (wieder ein Nachteil dieser Methode).

Zitat

Genau aus diesem Grund halte ich die Extremwerte (Minimum und Maximum der Stichprobe, häufig in Klammern mit angegeben wie bei dir) übrigens für die am wenigsten aussagekräftigen aller Angaben, da diese am stärksten von Stichprobengröße und Zufall abhängen.

Wie gesagt: nachvollziehbarerweise. Auch willkürlich gewählte Min-Max-Grenzen hängen eben von der Stichprobengröße ab. Man muss hier ausreichend Sporen vermessen, um reproduzierbare Einschätzungen zu erhalten. Die Reproduzierbarkeit ist hier allerdings nicht exakt, da man nicht auf die Kommastelle genau entsprechende sauber definierte Grenzen erhält. Ich frage mich aber, ob diese exakt berechneten Grenzen wirklich einen so großen Mehrwert an Information bieten, als dass man das Procedere durchführen müsste.

Zitat

Ich hoffe, wir reden jetzt nicht aneinander vorbei.

Möglicherweise, was aber durch Nachfragen behoben werden kann (und jetzt vermutlich behoben ist)

Zitat

Deine Zahlen verstehe ich noch nicht so richtig. Sind das 95%- oder 80%-Grenzen? Es scheint zu nichts so ganz zu passen.

Eben, es sind weder 95%- noch 80%-Grenzen. Es sind einfach anhand des Datensatzes ohne jedwege Rechung frei Hand abgeschätzte "Circa-Grenzen" (das ist genau das, wogegen Jens so ankämpft). Ich runde die Messwerte (hier wurde ja auf 0,01 µm gemessen, obwohl die Auflösung des Lichtmikroskops bei 0,2 µm als absolutes Minimum liegt, d.h. der genaue Kurvenverlauf, den du abbildest, würde im Rauschen der Messungenauigkeit untergehen) und kappe an beiden Enden "nach Gefühl" ab. Ich könnte auch auszählen, damit 5% der Messwerte außerhalb liegen. Meist schaue ich, ab welchem Wert nur noch Einzelsporen selten ober- oder unterhalb liegen und nehme das dann eben als die (in der Tat unwichtigen) Extremwerte und nehme den Rest des Bereichs als Min-Max-Grenzen.
Und da meine ich, dass diese Abschätzung gar nicht so weit weg ist von dem, was du statistisch herausbekommst. Und wenn meine Grenzen um beispielsweise 0,2 µm falsch liegen würden, fällt das in der Praxis nicht auf, da dies ja beim Messen schon kaum noch wahrgenommen wird. Angenommen, die Sporenlänge ginge bis 8,2 µm (als 95%-Grenze), dann würden diese Sporen ohnehin als 8 µm lang gemessen werden (oder manchmal als 8,5 µm, wenn man falsch geschätzt/abgelesen hat). In der Praxis ist es kaum oder nicht zu unterscheiden, ob 95% der Sporen bis 8,0 oder bis 8,2 µm lang wären. Das meine ich damit.

Insofern frage ich mich einfach nur, ob man wirklich den Aufwand betreiben sollte und sich statistisch abgesegnete Intervalle berechnen sollte oder ob man, was die Beschreibung und Bestimmung von Pilzen angeht, auch mit geschätzten Werten hinreichend nahe da heran kommt, um sich den Aufwand zu ersparen.

Das ist es, was ich prinzipiell meine - und da bin ich neugierig, ob die Berechnung nun ein wirklich nutzbare Mehr an Information bietet/liefert.

LG
Christoph

**Craterelle** · 6. März 2018

Moin Christoph,

Zitat von Tricholomopsis

nein, ich meine nicht die Breite des Quantilsbereichs, sondern die reine Min-Max-Abschätzung, die ohne Statistik erfolgt. Die ist natürlich - und das ist auch der Hauptkritikpunkt an ihr - in einem gewissen Maße willkürlich, da man ja "nachGefühl" auswählt, wo man nun die Grenzen ungefähr hinlegt und welche Werte man dann in Klammern dazu angibt, anstatt das sauber auszurechnen. Dafür geht es eben ohne zu rechnen.

Ist das wirklich so?

Das ist ein wenig schockierend. Ich hatte bisher angenommen - auch aufgrund Dieters Ausführungen früher in diesem Thema - dass das Vorgehen systematischer wäre.

Also wenn in der Literatur bei dieser Art der Notation kein Intervall explizit angegeben ist, ist davon auszugehen, dass es solche freihändigen Schätzungen sind?

Zitat von Tricholomopsis

(das ist genau das, wogegen Jens so ankämpft)

Was ich vor diesem Hintergrund tatsächlich nachvollziehbarer finde als bisher.

Deine Schätzung trifft die Längen einigermaßen, liegt aber bei den Breiten mit unteren Grenze schon auf dem Median (bei der von dir vorgeschlagenen Rundung auf 1/4 µm). 80%- und 95%-Grenzen sind allerdings auch nur einen Rundungsschritt entfernt.

Ich würde dann tatsächlich nur den Mittelwert oder den Median anzugeben, wenn man nicht mehr berechnen (oder auszählen) möchte.

Zur Rundung habe ich auch noch eine Frage:

Du rundest alle Werte außer die Mittelwerte. Warum die nicht? Haben sie als berechnete Werte einen "höheren Anspruch" auf Genauigkeit? Dann müsste es ja auch legitim sein, andere berechnete Werte auf eine Dezimal-Nachkommastelle genau anzugeben, oder?

LG, Craterelle

**Tricholomopsis** · 6. März 2018

Griass di Craterelle...

Zitat

Das ist ein wenig schockierend. Ich hatte bisher angenommen - auch aufgrund Dieters Ausführungen früher in diesem Thema - dass das Vorgehen systematischer wäre.

Nein, das Vorgehen ist nicht systematischer

Zitat

Also wenn in der Literatur bei dieser Art der Notation kein Intervall explizit angegeben ist, ist davon auszugehen, dass es solche freihändigen Schätzungen sind?

Ja, das war früher komplett Usus und wurde dann teils durch das Berechnen von Konfidenzintervallen ersetzt. Jetzt ist die Frage, ob die Konfidenzintervalle eine höhere Genauigkeit vorspiegeln oder beinhalten. Falls letzteres, wäres sie sinnvoll und durchaus wichtig, falls ersteres, kann man, wenn man sich dafür die Mühe macht, ein paar Sporen mehr auszumessen, darauf auch verzichten.
Unabhängig davon ist die Frage, wie man mit klar rechtsschiefen Verteilungen umgeht. Und dann ist auch da zu überlegen, ob der Aufwand, das mit einzubeziehen, lohnt.

Zitat

Zitat von Tricholomopsis

(das ist genau das, wogegen Jens so ankämpft)

Was ich vor diesem Hintergrund tatsächlich nachvollziehbarer finde als bisher.

Völlig klar - es geht dabei aber auch um die Form der Diskussion. Dass eine teils willkürliche Beschreibungsmethode angreifbar ist, ist ja klar. Nimm mal Farbangaben als extremeres Beispiel - wer hat denn die teuren Farbatlanten daheim und nutzt sie konsequent für Beschreibungen? Was ist "mittelbraun"? (siehe Stangls Risspilzwerk...). Auch da stellt sich die Frage, ob die exakte Farbnuance so konstant ist, als dass man z.B. Kornerup & Wanscher nutzen soll (bei Brauntönen ist es noch schwieriger) oder ob "mit einem Hauch von rosa" als Beschreibung reicht.

Mir geht es um die Anwendung und darum, welcher Mehraufwand sinnvoll ist und welcher Erkenntnisgewinn rauszuholen ist. Bei den Sporenmaßen ist mein Eindruck, dass die Variationsbreite größer als meist angenommen ist und man sich eine zu hohe Genauigkeit vorgaukelt.

Zitat

Deine Schätzung trifft die Längen einigermaßen, liegt aber bei den Breiten mit unteren Grenze schon auf dem Median (bei der von dir vorgeschlagenen Rundung auf 1/4 µm). 80%- und 95%-Grenzen sind allerdings auch nur einen Rundungsschritt entfernt.

Bei den Breiten ist der Messfehler auch prozentual sehr hoch. Dabei ist aud 1/4 µm zu runden schon fast übergenau. Oft wird nur auf 0,5 µm gerundet (an der Uni hätte ich in meiner früheren Arbeitsgruppe nicht einmal auf 1/4 µm runden "dürfen" - da wurde später immer auf 0,5 µm gerundet)

Zitat

Ich würde dann tatsächlich nur den Mittelwert oder den Median anzugeben, wenn man nicht mehr berechnen (oder auszählen) möchte.

Da geht dann aber zu viel Information verloren. Nimm Steinpilzsporen - die schwanken grob gesagt zwischen 14 und 20 µm Länge - nur den Mittelwert anzugeben wäre da ein Verwerfen der Schwankungsbreite. Warum sollte man die ganz wegwerfen?

Zitat

Du rundest alle Werte außer die Mittelwerte. Warum die nicht?

Ich runde alle Einzelmesswerte, da eine Genauigkeit von unter einem Viertel Mikrometer einfach nicht gegeben ist. Der Messfehler liegt bei den meisten Mikroskopen noch darüber. Man vermisst entweder unscharfe Fotos oder unscharfe Sporen direkt per Messokular - man sieht ja nicht den Sporenran, sondern Beugungsmuster des Sporenrandes, die man ausmisst. Wie groß die Sporen wirklich ist, kann man ja nicht sagen. Man kann nur angeben, innerhalb welchen Intervalls die "wahren" Sporenmaße liegen müssten (z.B. mit einer Wahrscheinlichkeit von 99%).

Beispiel: ich messe ine Spore als 12,25 x 8,5 µm groß aus. Dann liegt die Länger irgendwo zwischen 12 und 12,5 µm, mit geringer Wahrscheinlichkeit sogar darüber oder darunter (wenn nicht noch weitere Faktoren wie "Spore bewegt sich", "Spore lag nicht ganz plan" usw. dazu kommen). Würde ich jetzt "schätzen", dass die Spore 12,16 µm lang wäre (wie es diese Ausmessprogramme am Foto ausspucken), ist das "komma eins sechs" Augenwischerei. Vielleicht ist die Spore auch nur 11,9 µm lang oder sie ist 12,4 µm lang - das kann man eben nicht so genau messen.

Gibt man also die gemessenen, gerundeten Werte als Grenzen an, so verwendet man das messbare Raster (z. B. 0,5-Mikrometerschritte).

Berechne ich aber einen Mittelwert, so sind ja durch den Ablesefehler manche Sporen als zu lang vermessen, andere als zu kurz vermessen worden. Das mittelt sich dann heraus. Man kann auch einen Bereich berechnen, innerhalb dessen der "reale" Mittelwert liegt - ausgehend von den Einzelmessungen der Sporen, wenn man den Einzelfehler jeder Messung kennt (und die Verteilung der Sporenlängen usw.). Du wirst dann feststellen, dass man hier durchaus auf eine Nachkommastelle heran kommt. Insofern ist es Usus, den Mittelwert mit einer Nachkommastelle anzugeben (manche Autoren nehmen sogar zwei Nachkommastellen, um nicht bei einem ,15 nicht auf ein ,2 hochrunden zu müssen, aber das ist dann für gewöhnlich wieder übergenau).

Zitat

Haben sie als berechnete Werte einen "höheren Anspruch" auf Genauigkeit? Dann müsste es ja auch legitim sein, andere berechnete Werte auf eine Dezimal-Nachkommastelle genau anzugeben, oder?

Das ist ja auch so. Deshalb werden ja auch die berechneten Intervallgrenzen auf eine Nachkommastelle genau angegeben, während die geschätzten Grenzen gerundet werden (das sollte jedenfalls so sein - manche Mykologen runden gar nicht nund geben dann geschätzte Werte wie 10,1-12,7 µm als Länge an - das ,1 kann man sich da sparen, ich denke mir das dann einfach weg).

Die Ausgangsfrage bleibt:

Angenommen, das berechnete Konfidenzintervall der Sporenlänge liegt bei Pilz A so: 9,1-9,5-9,9 µm (mit Mittelwertangabe)

Und angenommen, man gibt bei dem gleichen Pilz die Sporenlängen ganz klassich so an: 9-9,5-10 µm

Was bringen dem Bestimmer die sehr exakt berechneten Intervallgrenzen? Bei einer anderen Kollektion der gleichen Spezies A wird man vielleicht folgende Werte erhalten: 8,7-9,2-9,7 µm und geschätzt (und jetzt mal grob gerundet) als 8,5-9,2-9,5 µm. Auch hier wäre der Unterschied gerade mal 0,2 µm und damit geringer als die natürliche innerartliche Schwankung.

Vielleicht habe ich mich auch zu sehr mit Scheidenstreiflingen beschäftigt, bei denen die genauen Sporenmaße und auch die Sporenform jahrzehntelang überschätzt wurden. Man erhält bei der gleichen Art von Kollektion zu Kollektion äußerst unterschiedliche Intervalle / Maße. Mal sind die Sporen bei der gleichen Art bis 13 µm lang, mal bis 19 µm... Und dann soll es darum gehen, im Nullkommabereich eine Genauigkeit zu errechnen, die von der natürlichen Variationsbreite völlig geschluckt wird?

Deshalb frage ich ja so kritisch nach, inwiefern sich das Berechnen wirklich lohnt. Und auch wenn es nicht so klingen mag - ich bin da wirklich sehr offen, zumal ich in der Vergangenheit auch versucht hatte - zumindest bei meinen Kremplingen - mit Hilfe der Statistik das Maximum aus Sporenmessungen herauszukitzeln... Jetzt bin ich Amateur und daher pragmatisch - wenn mir gezeigt wird, dass das Intervallberechnen nicht nur der "Etiquette" dient, sondern tatsächlich einen Mehrgewinn an Aussagekraft hat, rechne ich diese auch gerne aus. Noch bin ich nicht überzeugt, dass es was bringt - noch sehe ich im Gegenteil die Gefahr, dass sie eine zu hohe Genauigkeit vorgaukelt.

LG
Christoph

**Craterelle** · 6. März 2018

Ahoi Christoph,

Zitat von Tricholomopsis

Mir geht es um die Anwendung und darum, welcher Mehraufwand sinnvoll ist und welcher Erkenntnisgewinn rauszuholen ist.

Ich als Neuling würde mich eher überfordert damit fühlen, einfach durch Blick auf eine Kolonne ungeordneter Wertepaare (Dieters waren ja zumindest nach Länge sortiert, das macht es schon etwas einfacher) eine zutreffende Schätzung abzugeben.

Ich wäre schon mit dem simpelsten Vorgehen, von 30 Messwerten die 3 größten und die 3 kleinsten herauszustreichen, vermutlich besser bedient, sofern nur Zettel und Stift als Hilfmittel zugelassen wären. Oder eben mit berechneten Werten. Wenn ein Computer zur Verfügung steht, ist der Mehraufwand m.E. so minimal, dass ich diese Methoden auch bei einem Erkenntnisgewinn nahe 0 bevorzugen würden.

LG, Craterelle

**Tricholomopsis** · 6. März 2018

Zitat von Craterelle

Ich als Neuling würde mich eher überfordert damit fühlen, einfach durch Blick auf eine Kolonne ungeordneter Wertepaare (Dieters waren ja zumindest nach Länge sortiert, das macht es schon etwas einfacher) eine zutreffende Schätzung abzugeben.

Servus Craterelle,

oh nein, natürlich sortiere ich die Werte vorher - sonst ist es zu unübersichtlich.

Zitat

Oder eben mit berechneten Werten. Wenn ein Computer zur Verfügung steht, ist der Mehraufwand m.E. so minimal, dass ich diese Methoden auch bei einem Erkenntnisgewinn nahe 0 bevorzugen würden.

Ja, solange es reicht, auf's "Knöpfchen zu drücken" - was wiederum Normalverteilung voraussetzt. Es ist aber natürlichvöllig o.k., wenn man Intervalle berechnen würde. Ich will das ja gar nicht madig machen. Ich traue diesen errechneten Werten nur nicht. Bei den geschätzten weiß ich, dass sie nicht zu genau genommen werden können. Es ist ein Merkmal unter vielen, das zudem m.E. oft überschätzt wird. Ich habe früher auch Intervalle ausgerechnet, um das zu testen - und ich bin wieder davon abgekommen. Das heißt nicht, dass anderes nicht Intervalle berechnen sollen

LG
Christoph

**Craterelle** · 7. März 2018

Hallo Christoph,

Es wirkt auf mich etwas widersprüchlich, dass du einerseits auf Angabe von Wertebereichen nicht verzichten magst, weil du sie zu wichtig findest, sie andererseits aber schätzen statt berechnen willst, damit niemand ihnen zu viel Bedeutung beimisst.

LG, Craterelle

**Tricholomopsis** · 7. März 2018

Zitat von Craterelle

Es wirkt auf mich etwas widersprüchlich, dass du einerseits auf Angabe von Wertebereichen nicht verzichten magst, weil du sie zu wichtig findest, sie andererseits aber schätzen statt berechnen willst, damit niemand ihnen zu viel Bedeutung beimisst.

Servus Craterelle,

mag sein - und ich habe auch gar kein Problem damit, dass dir das widersprüchlich vorkommt. Mir wurde gestern Nacht noch ein Gedanke per Mail zugeschickt, dem ich völlig zustimme, da das ein Grund dafdür sein kann, dass man bei diesem Thema aneinander vorbei diskutiert.

Man muss sich fragen, was man letzten Endes will... Ich selber will "nur" Pilze bestimmen, versuchen, unterschiedliche Arten zu unterscheiden, Differentialmerkamle ausarbeiten - sprich sehr praxisnah Pilzen Namen geben. Um dieses Ziel zu erreichen, meine ich jedenfalls, muss ich Sporenbereiche nicht auf 0,1 µm genau statistisch ausrechnen. Es reicht völlig, sie relativ grob zu schätzen. Und wenn durch das Schätzen zwei Arten nicht mehr trennbar sind, dann behaupte ich, dass auch die beste Statistik nichts nutzen wird - dann überlappen die Verteilungen zu sehr und man braucht weitere Trennmerkmale. Für mich sind die Sporenmaße ein Merkmal von vielen.

Wer aber das mathematische Problem spannend findet, wie man mit rechtsschiefen Verteilungen umgehen soll/kann, für den sind entsprechende Datensätze von beispielsweise Amaniten oder Volvariellen (usw.) sehr spannend. Das kann ich sehr gut nachvollziehen - und da kann man sehr tiefschürfend akademisch diskutieren.

Diese beiden Seiten reden dann aber schnell aneinander vorbei. Der reine Mykologie-Pragmatiker fragt dann (so wie ich) "Was ist der Mehrwert der Berechnung, wenn die Unterschiede im Kommastellenbereich liegen?" - Der an der akademischen Fragestellung der Statistik Interessierte schüttelt dann vermutlich sein Haupt und antwortet "Der Mehrwert ist doch selbsterklärend, so kann jeder unabhängig aus dem gleichen Datensatz reprtoduzierbar die gleichen Konfidenzintervalle nachprüfbar berechnen!" - Der Mykologe wiederum: "Und was bringt mir das jetzt für die Pilzbestimmung? Wenn eine andere Person vom gleichen Fruchtkörper Sporen misst, wird diese neue Stichprobe doch andere Intervallgrenzen ergeben - was soll also die angeblich hohe Genauigkeit, wenn der Faktor Mensch beim Messen ungenauer ist als das, was man dann berechnet?"

Dieser Dialog ist endlos fortsetzbar, da zwei Welten aufeinander treffen.

Für mich ist es durchaus interessant und spannend, mich in die statistisch-akademische Seite hineinzuversetzen. Und ich wäre neugierig, was wäre, wenn man aus dem gleichen Fruchtkörper in vivo an verschiedenen Tagen Sporenabwürfe bekäme (also ohne den Fruchtkörper zu rupfen), wie es bei Porlingen schon gemacht wurde. Ich wäre nicht überrascht, wenn da die Schwankungsbreite größer wäre als die Unsicherheit der groben Schätzung anhand der "man nimmt rechts und links drei Werte weg"-Methode im Vergleich zur Berechnung. Nur ist das dem Statistiker egal, denn er freut sich (zurecht), dass er für die Stichprobe des einen Tages ein sauberes Konfidenzintervall berechnen kann. Dass das Intervall beim selben Individuum an einem anderen Tag anders ausfallen dürfte, ist dem Statistiker ja ziemlich wurscht, denn auch da freut er sich über die Güte seiner Methodik. Dem Pilzbestimmer fehlt diese Freude am Rechnen und der sagt sich halt - "Mei, die Sporenmaße sind halt doch variabler, als man meint - da hängen so viele Faktoren mit drin wie Witterung(?), Fruchtkörperalter(!), Messmethode (Messperson) - drum nutze ich dieses eine Merkmal von vielen nur dann, wenn es klare Unterschiede gibt...". Und der Statistiker wird wieder reagieren mit "Ja, wie willst du denn sicher sein, dass die Unterschiede "klar" sind, wenn du keinen Test der Hypothese vornehmen kannst, dass ein Pilz mit dieser Stichprobe als Art A und nicht als Art B bestimmt wird, also wie wahrscheinlich es ist, z.B. zufällig zu viele kleine Sporen beim Messen zu erwischen, sodass man die Sporen irrtümlicherweise als zu Art A gehörig einstuft...?" - Und der Pragmatiker: "Äh... ja... aber die Hutfarben sind doch auch anders - und wenn dann auch noch die Sporen klein sind, dann passt es doch, oder?" - Und der Statistiker rauft sich die Haare, hat aber vielleicht noch nie im Leben ein Phlegmacium bestimmt...

Wichtig ist nur, dass beide Seiten normal und höflich miteinander umgehen. Ich stehe zu meiner "Grobmethode" und wende sie weiterhin an, bis mir jemand zeigt, dass sie das, was ich damit erreichen will, wirklich erschwert. Ob man Sporenlängen einer Art aber als 9,9-10,6-11,3 µm angibt oder gerundet als 10-10,6-11,25 µm ist mir persönlich völlig egal. Ich runde in Gedanken auch die errechneten Werte, da ich sie ja anwenden will. Ich glaube nicht - bis mir jemand das Gegenteil zeigt - dass man einen Pilz trennen könnte, der in der Tat ein um 0,1 µm verschobenen Intervallgrenze als Trennungsmerkmal besitzt. Und da sind wie wieder bei der Bestimmungspraxis. Ich bin kein Mathematiker - ich habe Physik und Biologie studiert. Und Physiker runden auch gerne - und ja, auch zwischen Physikern und Mathematikern können Welten liegen.

Beide Welten sind legitim und in beiden Welten kann man m.E. gut leben. Das denke ich auch von der Welt der Mathematik, auch wenn ich diese nicht wirklich gut kenne. Ich gönne aber jedem dieses Glücksgefühl, in dieser Welt neue Entdeckungen machen zu können oder auch Dinge dort wahrzunehmen, die man vorher nicht wahrgenommen hat. Und ich freue mich über wohl ähnliche Gefühle in der Welt der Biologie, die aber von der der Mathematik getrennt ist.

Leben und leben lassen - in all diesen Welten.

LG
Christoph

**Craterelle** · 7. März 2018

Hallo Christoph,

Vielen Dank für deine Antwort!

Zitat von Tricholomopsis

Wer aber das mathematische Problem spannend findet, wie man mit rechtsschiefen Verteilungen umgehen soll/kann, für den sind entsprechende Datensätze von beispielsweise Amaniten oder Volvariellen (usw.) sehr spannend.

Solltest du welche haben, oder auch nur Hinweise darauf, welche weiteren Gattungen typischerweise nicht normalverteilte Sporenmaße aufweisen, wäre ich dankbare Abnehmerin.

Zitat von Tricholomopsis

Und ich wäre neugierig, was wäre, wenn man aus dem gleichen Fruchtkörper in vivo an verschiedenen Tagen Sporenabwürfe bekäme (also ohne den Fruchtkörper zu rupfen), wie es bei Porlingen schon gemacht wurde.

In der Tat, auch eine äußerst interessante Fragestellung für Untersuchungen.

Zitat von Tricholompsis

Und ich freue mich über wohl ähnliche Gefühle in der Welt der Biologie, die aber von der der Mathematik getrennt ist.

Hm, vielleicht könntest du mich nochmal auf einen Abstecher in diese Welt mitnehmen, wenn du magst?

Ich versuche immer noch, die typischen Gründe für Mischpopulationen besser zu verstehen. Immer wieder genannt werden

Mehrkernigkeit,
variable Basidienzahl,

nur geht das meistens ein wenig durcheinander.

Mehrkernigkeit kann nach dem, was ich bisher gelesen habe, bei Ascomyceten vorkommen, aber bei Basidiomyceten vermutlich auch?

Und wenn sie dort vorkommt, steht sie in irgendeinem Zusammenhang zur Basidienzahl oder ist das ganz unabhängig voneinander?

Wenn das irgendwo gut erklärt ist und ich es nur noch nicht gefunden habe, bin ich auch mit Links oder Literaturverweisen glücklich.

LG, Craterelle

**Tricholomopsis** · 7. März 2018

Zitat von Craterelle

Solltest du welche haben, oder auch nur Hinweise darauf, welche weiteren Gattungen typischerweise nicht normalverteilte Sporenmaße aufweisen, wäre ich dankbare Abnehmerin.

Servus Craterelle,

da fällt mir als extremstes Beispiel Hygrocybe sect. Firmae ein - tropische Saftlinge, die zwei unterschiedliche Basidientypen besitzen - und damit zwei Sporenpopulationen, die sich bei manchen Arten nicht einmal überlappen. Da kann man dann sogar die Sporenpopulationen wirklich getrennt angeben. Bei anderen Arten der Sektion überlappen sie aber.

Ansonsten alles, was neben normalen Basidien auch z.B. Sklerobasidien bildet (wie eben Amanita, aber auch Armillariella).

Und eben alle, die nicht nur viersporige Basidien haben. Das sind fast alle... Ich überlege gerade, ob ich einen Röhrling kenne, der keine rechtsschiefe Verteilung hat...

Zitat

Ich versuche immer noch, die typischen Gründe für Mischpopulationen besser zu verstehen. Immer wieder genannt werden

Mehrkernigkeit,

variable Basidienzahl,

nur geht das meistens ein wenig durcheinander.

Mehrkernigkeit kann nach dem, was ich bisher gelesen habe, bei Ascomyceten vorkommen, aber bei Basidiomyceten vermutlich auch?

Ja klar... nimm Steinpilze als Beispiel. Die haben gerne dreisporige Basidien. Dabei ist eine Spore zweikernig, die anderen beiden einkernig. Es findet also eine Inzucht-Selbstkreuzung in der Basidie statt. Andere Kollektionen haben dann aber vornehmlich viersporige Basidien, wieder andere fast nur dreisporige. Das geht bei Boletus edulis (und Verwandten) hin und her.

Man geht unabhängig von der Kernzahl davon aus, dass die Basidien (natürlich um einen Mittelwert schwankend, je nach Basidiengröße) ein vorgegebenes Plasmavolumen in die Sporen abgeben. Bei zweisporigen Basidien sind dann die Sporen im Schnitt doppelt so voluminös wie die viersporigen. Am ehesten müsste eigentlich das Sporenvolumen normalverteilt sein, was bedeutet, dass auch bei einer symmetrischen Verteilung die Länge bzw. Breite nicht normalverteilt ist. Durch die vier unterschiedlichen Sporenpopulationen, die sich völlig vermischen (4-, 3-, 2-, und 1-sporige Basidien bilden unterschiedlich voluminöse Sporen), wird es dann rechtsschief. Jetzt ist aber das Mischungsverhältnis von den vier Basidientypen in sich wieder schwankend von Kollektion zu Kollektion oder abhängig vom Fruchtkörperalter?! Ach ja, beim Pfifferling gibt es dann auch noch 5- und 6-sporige Basidien; wenn man eine Kollektion mit nur 6-sporigen Basidien hat, ist das dann im Mikroskop sehr putzig (hatte ich schon).

Dann kommt das Phänomen der Sklerobasidien dazu, das manche Arten der Gattungen Amanita, Armillariellae und wenn ich's mir richtig gemerkt habe auch bei Volvariella vorkommen (das müsste ich nochmal nachrecherchieren). Oder das der Makro- und Mikrobasidien wie bei den oben genannten Saftlingen.

Was die Kernzahl angeht, wird das gerne genannt, da es Arbeiten gibt, die das Sporenvolumen mit der Kernzahl (innerhalb des selben Individuums) korreliert haben. Es ist aber eben nicht klar, ob bei einer Art mit vier- und zweisporigen Basidien die zweisporigen auch die doppelte Kernzahl aufweisen. Zudem kann es auch viersporige Basidien mit jeweils zweikernigen Sporen geben (Meiose erzeugt acht Kerne, es müssen nicht immer vier davon zerfallen).
Beim Steinpilz wurde es per Kernfärbung gezeigt. Es wurde übrigens mal ein Boletus edulis ssp. trisporus beschrieben. Den Beschreibern war gar nicht klar, dass der Steinpilz meist ohnehin dreisporige Basidien besitzt (und damit da dann in sich schon zwei Sporenpopulationen). Wenn bei einem Individuum dann einige einsporige Basidien (neben zweisporigen) auftreten, werden manchmal sehr große Sporen gebildet. Deshalb findet man bei Steinpilzen so unterschiedliche und teils widersprüchliche Angaben. Boletus marmorensis wurde z.B. aufgrund der großen Variationsbreite der Sporen beschrieben, die ihn von Boletus aereus abgrenzen soll (neben makroskopischen Nuancen) - mittlerweile wurden die beiden synonymisiert (genetisch bedingt, 6-Gen-Stammbäume). Das zeigt die Schwierigkeiten hinsichtlich der Sporenmaße.

Bei Scheidenstreiflingen kann eine Art, die meist nur bis 13 µm große Sporen besitzt, plötzlich bis zu 19 µm große Sporen auftreten (da gibt es ein publiziertes Beispiel - kann ich mal raussuchen... da die Sporen kugelig sind, kannst du dir die Volumenunterschiede ausrechnen - das dürfte an unterschiedlicher Häufigkeit von Sklerobasidien liegen, denke ich).

Wenn man nur sagen wir mal 30 Sporen misst und dann die "Ausreißer" rausschmeißt, um künstlich Normalverteilungen zu erzeugen, der wird all diese in meinen Augen interessanten biologisch bedingten Phänomene hinsichtlich der Sporenmaße nicht sehen. Dann liest man Aussagen wie "die Sporenmaße sind fast immer normalverteilt". Die Realität ist m.E. deutlich anders. Ich habe aber auch viel mit Amanita und vor allem mit Röhrlingen gemacht...

Ach, ein letztes Beispiel - wohl das extremste, das mir einfällt... Rhizopogon luteolus (ein hypogäischer Schmierröhrlingsverwandter) hat zwei- bis sechszehnsporige Basidien mitsamt der dadurch bedingten Schwankung der Sporengrößen - man hat also 15 Sporenpopulationen vermengt - und bekommt keinen Sporenabwurf. Was macht man da?! *hihi*.

Nur ein paar Beispiele

LG
Christoph

**Craterelle** · 8. März 2018

Hallo Christoph,

vielen, vielen Dank für die ausführlichen Erläuterungen!

Zitat von Tricholomopsis

Wenn man nur sagen wir mal 30 Sporen misst und dann die "Ausreißer" rausschmeißt, um künstlich Normalverteilungen zu erzeugen, der wird all diese in meinen Augen interessanten biologisch bedingten Phänomene hinsichtlich der Sporenmaße nicht sehen.

Das ist auch keineswegs mein Ansatz. Ich bin weiterhin der Ansicht, dass nicht normalverteilte Populationen mit Median und Quantilen zutreffender beschrieben sind. Allerdings war mir bis zu deinem Beitrag vorgestern nicht klar, dass das - obwohl es ja in der einfachsten Anwendung 3 links weg, 3 rechts weg ist - so revolutionär neu wäre.

Zitat von Tricholomopsis

Ach, ein letztes Beispiel - wohl das extremste, das mir einfällt... Rhizopogon luteolus (ein hypogäischer Schmierröhrlingsverwandter) hat zwei- bis sechszehnsporige Basidien mitsamt der dadurch bedingten Schwankung der Sporengrößen - man hat also 15 Sporenpopulationen vermengt - und bekommt keinen Sporenabwurf. Was macht man da?! *hihi*.

Oha! Etwas aus der engeren Verwandschaft habe ich mir lustigerweise ausgeguckt, um es irgendwann, wenn ich die Gelegenheit habe, zu mikroskopieren. Wie es aussieht, haargenau das richtige für Anfänger.

LG, Craterelle

**Craterelle** · 9. März 2018

Hallo Christoph,

Ich glaube, nach und nach verstehe ich immer besser, worauf du hinauswillst.

Ich könnte mir vorstellen, dass selbst bei einer Art mit perfekt normalverteilten Sporen (wenn es so etwas gibt) die rechnerische Prognose unzutreffend sein könnte, weil eben nicht mehrmals eine zufällige Stichprobe aus der Grundgesamtheit gezogen wird, wie es das mathematische Modell vorsieht, sondern jeder einzelne Fruchtkörper und jede Kollektion unzähligen Parametern ausgesetzt ist, deren Einfluss auf die Sporengröße unbekannt ist.

Gibt es eigentlich irgendwelche Untersuchungen zur praktischen Anwendung von Sporenstatistiken?

LG, Craterelle

**Craterelle** · 15. März 2018

Hallo Christoph,

Eine mathematische Frage habe ich doch noch. Das klingt zwar jetzt wie falsch adressiert, aber nachdem du es nicht nur oben schreibst, sondern ich diese Aussage auch in einer deiner Publikationen gelesen habe, wirst du sicher etwas dazu sagen können.

Zitat von Tricholomopsis

Am ehesten müsste eigentlich das Sporenvolumen normalverteilt sein, was bedeutet, dass auch bei einer symmetrischen Verteilung die Länge bzw. Breite nicht normalverteilt ist.

In der Theorie ist das schon logisch: Sind Länge und Breite perfekt normalverteilt, muss für das Volumen eine leicht rechtsschiefe Verteilung resultieren (Abb. 1). Ist hingegen das Volumen normalverteilt, wären die Verteilungen für Länge und Breite etwas linksschief (Abb. 2).

Ich frage mich nur, ob dieser Effekt groß genug ist, um in der Praxis jemals wahrnehmbar zu sein?

LG, Craterelle

Teilen