Home / Kaffeewissen / Wie wir Espressomühlen testen: Unser Mess- und Bewertungsprotokoll
    Espressomühlen
    Wie wir Espressomühlen testen: Unser Mess- und Bewertungsprotokoll

    Wie wir Espressomühlen testen: Unser Mess- und Bewertungsprotokoll

    In den letzten Jahren haben wir über 90 Espressomühlen getestet – vom Einsteigergerät für 150 € bis zur professionellen Single-Dosing-Mühle jenseits der 1.000 €. Was dabei entstanden ist, ist kein Bauchgefühl, sondern ein strukturiertes Mess- und Testprotokoll, das wir mit jedem Test weiterentwickelt haben.

    Dieser Artikel erklärt, wie wir vorgehen, warum wir genau diese Messwerte erheben und was hinter unseren Bewertungsschwellen steckt. Er dient gleichzeitig als Referenz für alle unsere einzelnen Mühlenberichte – dort verlinken wir jeweils auf die entsprechenden Abschnitte hier.

    2021 Aufnahme alte Kaffeeakademie

    Das Testprotokoll im Überblick

    Unser Test ist in vier Blöcke aufgeteilt, die zeitlich versetzt durchgeführt werden. So stellen wir sicher, dass wir sowohl den Kaltstart einer Mühle als auch ihr Verhalten nach Einlaufen und unter Belastung erfassen.

    Alle Mühlen werden mit demselben Kaffee getestet: dem Apas Espresso, einem natural aufbereiteten Brasilianer unserer Partnerkooperative APAS. Gleicher Kaffee, gleiche Bohnencharge – so schaffen wir Vergleichbarkeit über alle Mühlen hinweg.

    Block 1 – Einmahlen und Ausgangsprüfung: Zubehörcheck, 1 kg Kaffee einmahlen, erste Rezepteinstellung, erste Partikelverteilungsproben.

    Block 2 – Hauptmessungen: Temperatur, Lautstärke, Mahlgeschwindigkeit, Konstanzprüfung, weitere Partikelproben mit und ohne RDT (Ross Droplet Technique).

    Block 3 – Verstellungsprüfung: Ristretto, Lungo, Rückstellung auf Espresso – wie verhält sich die Mühle bei starken Mahlgradänderungen?

    Block 4 – Totraum: Absoluter, temporärer und permanenter Totraum werden exakt gemessen.

    Die Verkostungen finden parallel zu den jeweiligen Blöcken statt.

    Ausgangsmaterial und Einmahlen

    Bevor wir eine einzige Messung vornehmen, mahlen wir 1 kg Kaffee durch die Mühle. Das simuliert realistischen Gebrauch und stellt sicher, dass sich Mehl und Öle in der Mühle eingelaufen haben. Eine frisch ausgepackte Mühle verhält sich anders als eine, die 100 Shots hinter sich hat – und wir testen letztere.

    Dann prüfen wir das mitgelieferte Zubehör: Dosierbecher, Trichter, Pinsel, Schlüssel. Was dabei ist, notieren wir. Was fehlt, ebenfalls.

    Für den In-Out-Test mahlen wir dreimal 18 g Kaffee für jeweils 30 Sekunden und messen die Ausgabemenge. Das gibt uns eine erste Einschätzung von Totraum und Konstanz – noch vor allen anderen Messungen.

    Lautstärke

    Wir messen die Lautstärke mit einem kalibrierten Schallpegelmesser, positioniert 20 cm von der Mühle entfernt. Gemessen wird während einer Dauermahlung von 250 g Kaffee – nicht beim Kaltstart, sondern im eingeschwungenen Betrieb.

    Bewertung Dezibel
    Top / leise unter 80 dB
    Mittel / eher laut 80–90 dB
    Negativ / laut über 90 dB

    Warum diese Schwellen?
    80 dB entspricht ungefähr dem Lärm eines Staubsaugers in normalem Abstand – das ist der Punkt, ab dem eine Mühle in einer ruhigen Küche als störend wahrgenommen wird. Über 90 dB, also Rasenmäher-Niveau, ist für den Heimgebrauch schlicht zu laut. Unter 80 dB dagegen – wie etwa bei der Mazzer Philos mit 78,1 dB – ist eine Mühle auch früh morgens oder in einer offenen Küche akzeptabel.

    Wichtig:

    Der Mahlton hat zwei Dimensionen. Die reine Dezibel-Zahl sagt wenig über die Qualität des Geräuschs aus. Ein penetrant-eiernder Summton bei 73 dB (wie bei der Varia VS3) kann subjektiv störender wirken als ein gleichmäßiges Brummen bei 78 dB. Solche qualitativen Eindrücke halten wir in den Notizen fest.

    Mahltemperatur

    Wärme ist der unsichtbare Feind guter Extraktion. Zu heiß gemahlener Kaffee verliert flüchtige Aromastoffe noch vor der Extraktion – und Fette beginnen zu oxidieren. Wir messen die Temperatur des Mahlguts direkt nach dem Mahlen, fünfmal hintereinander mit je 18 g und 20 Sekunden Pause dazwischen, um den Aufwärmeffekt sichtbar zu machen.

    Bewertung Temperatur des Mahlguts
    Top unter 30 °C
    Gut 30,1–35 °C
    Mittel / warm 35,1–39 °C
    Negativ / sehr warm über 39 °C

    Warum diese Schwellen?
    Unter 30 °C ist das Mahlgut noch nahe Raumtemperatur – keine messbare thermische Belastung. Ab 35 °C beginnen wir in Verkostungen gelegentlich Unterschiede zu schmecken, besonders bei hellen, aromatisch delikaten Röstungen. Über 39 °C, wie wir es bei der Zuriga G2 mit 40,2 °C gemessen haben, ist eine echte Einschränkung: Sie disqualifiziert die Mühle für höhere Durchsätze, weil die Temperatur bei mehreren aufeinanderfolgenden Bezügen weiter ansteigt.

    Uns ist bewusst, dass diese Messung nur eine Näherung der Temperatur in der Mahlkammer ist. Die Temperatur während der Mahlung wird an das umliegende Material abgegeben, und der ausgeworfene Kaffee ist immer kühler, als der Kaffee in der Mahlkammer. Diese Art der Messung ist aber die präziseste, die uns mit unseren Mitteln zur Verfügung steht.

    Mahlgeschwindigkeit

    Die Geschwindigkeit wird auf zwei unterschiedliche Arten gemessen, die verschiedene Dinge aussagen und nicht direkt proportional vergleichbar sind.

    Messung A – Gramm in 10 Sekunden (voller Hopper): Die Mühle läuft mit vollem Bohnenbehälter. Gemessen wird, wie viel Gramm in 10 Sekunden ausgeworfen werden. Diese Messung ist besonders relevant für Mühlen, die für den Hopper-Betrieb konzipiert sind – sie zeigt das Maximalleistungspotenzial und hilft einzuschätzen, ob eine Mühle auch für den gastronomischen Einsatz geeignet sein könnte.

    Bewertung Gramm in 10 Sekunden
    Top über 40 g
    Gut 30,1–40 g
    Mittel 20,1–30 g
    Langsam 10–20 g
    Sehr langsam unter 10 g


    Messung B – Zeit für 18 g:
    Bei Hopper-Mühlen wird diese Messung ebenfalls mit vollem Hopper durchgeführt – der Wert steht daher in direktem Verhältnis zur 10-Sekunden-Messung. Bei Single-Dosing-Mühlen wird mit leerem Hopper gemessen. Hier fließt auch die Zeit für zusätzliche Stöße mit dem Blasebalg ein, die nötig sind, um den Kaffee vollständig auszutreiben. Die Gesamtdauer ist dadurch tendenziell länger und nicht direkt mit Hopper-Werten vergleichbar.

    Bewertung Zeit für 18 g
    Top 1–6 Sekunden
    Gut 6,1–10 Sekunden
    Mittel 10,1–15 Sekunden
    Langsam 15,1–20 Sekunden
    Sehr langsam über 20 Sekunden

    Warum ist Geschwindigkeit relevant?
    Sehr schnelle Mühlen mahlen mit hoher Leistung, was die Mahltemperatur erhöht. Sehr langsame Mühlen verlängern die Kontaktzeit des Kaffees mit dem Mahlwerk – das muss keine Schwäche sein, verändert aber den Workflow spürbar. Unsere Unteresuchungen der Drehgeschwindigkeit zeigen auch, dass Mühlen mit niedrigerer Drehzahl tendenziell ein schmaleres Hauptpeak haben; das bedeudet, dass sie gleichmäßiger mahlen.

    Die Mahlgeschwindigkeit ist für den Einsatz in der Gastro oder bei Catering-Einsätzen ein wichtiges Kriterium. Ein Geschwindigkeit von unter 10 Sekunden für 18 Gramm ist bei Frequenz wünschenswert.

    Totraum

    Totraum ist der Bereich in einer Mühle, in dem bereits gemahlener Kaffee liegen bleibt. Dieser Kaffee wird nicht sofort ausgeworfen, sondern erst bei der nächsten Mahlung – er ist also immer eine Portion älter als der frisch gemahlene Kaffee. Je größer der Totraum, desto stärker sind die geschmacklichen Konsequenzen: ranzig, scharf, unbalanciert. Ausführlich beschreiben wir das in unserem Artikel zum Totraum.

    Wir unterscheiden drei Arten: Temporärer Totraum leert und füllt sich mit jeder Mahlung – er ist der dominierende Faktor für die Alltagsqualität. Permanenter Totraum verklebt dauerhaft in Ritzen, rund um die Mahlscheiben oder hinter dem Flapper und beeinflusst das Aromaklima in der Mühle. Absoluter Totraum ist die Summe aus beidem.

    Für die Messung entfernen wir alle abnehmbaren Teile, pinseln die Mühle vollständig aus und wiegen die Rückstände.

    Bewertung Absoluter Totraum
    Sehr gut 0–2 g
    Gut / wenig 2,1–3,5 g
    Mittel 3,6–5 g
    Viel 5,1–9 g
    Sehr viel über 9 g

    Warum diese Schwellen?
    Bei 18 g Portionsgröße entsprechen 9 g Totraum fast dem halben Espresso – halb frisch, halb alt. Das schmeckt man. Unter 2 g ist der Einfluss auf das Ergebnis gering, solange man regelmäßig mahlt. Mühlen in diesem Bereich – etwa die Niche Zero (1,1 g) oder die Varia VS3 (1,1 g) – eignen sich besonders gut für Single Dosing und für den Wechsel zwischen verschiedenen Kaffeesorten.

    Der Totraum ist auch relevant bei der Einstellung des Mahlgrades! Je größer der temporäre Totraum, desto mehr Einfluss hat der "alte" Kaffee der letzten Mahlun auf das Brühverhalten des nächsten Espresso. Mit anderen Worten: hat eine Mühle 9 Gramm Totraum, so befinden sich nach eine Mahlgradverstellung noch 9 Gramm des alten Mahlgrades in der Mühle. Es ist essenziell diese auszumahlen, um den Effekt der Mahlgradeinstellung in der Extraktion sehen zu können. Wird das nicht gemacht, so wird das Finden des richtigen Mahlgrades zum Kreislauf der falschen Einstellung.

    Zusätzlich messen wir die Single-Dosing-Performance: Wie viel Kaffee bleibt zurück, wenn man exakt 18 g eingibt und die Mühle 30 Sekunden laufen lässt? 

    Bewertung Abweichung
    Top 0–0,15 g
    Gut 0,16–0,3 g
    Mittel 0,31–0,6 g
    Schlecht 0,61–1 g
    Sehr schlecht über 1 g

     

    Verstellungsprüfung: Wie treu ist die Mühle?

    Eine Mühle, die nach einer starken Mahlgradverstellung nicht mehr exakt auf den Ausgangspunkt zurückfindet, ist für alle, die mehrere Rezepte oder Kaffeesorten nutzen, ein echtes Problem. Wir prüfen das mit einer standardisierten Sequenz:

    1. Espresso (Ausgangsrezept): 18 g in, 45 g out, ~25 Sekunden
    2. Ristretto: 18 g in, 18 g out, 25 Sekunden
    3. Lungo / Café Crème: 18 g in, 120 g out, 25 Sekunden
    4. Rückkehr auf Espresso: 18 g in, 45 g out, 25 Sekunden

    Von jedem dieser Punkte nehmen wir eine 25-g-Probe für die Partikelverteilungsmessung. So sehen wir nicht nur, ob die Mühle zurückfindet, sondern auch wie sich das Mahlgut bei sehr feiner und sehr grober Einstellung physikalisch verändert. Die Abweichung des x50-Wertes zwischen T4 (Espresso) und T7 (Espresso nach Rückstellung) ist ein präziser Indikator für die Mahlgradreplizierbarkeit.

    Partikelverteilung

    Das ist der Kern unserer wissenschaftlichen Auswertung, und hier unterscheidet sich unser Protokoll von den meisten anderen Mühlenvergleichen. Wir analysieren alle Proben in Zusammenarbeit mit dem Coffee Excellence Center der ZHAW (Zürcher Hochschule für Angewandte Wissenschaften) mit einem Retsch Camsizer X2 – einem hochpräzisen Gerät für dynamische Bildanalyse.

    Alle Proben werden mit einem Probenteiler aufgeteilt, um Entmischung zwischen feinen und groben Partikeln zu verhindern. Gemessen werden bis zu sieben Proben pro Mühle: Werkszustand, Espresso, Ristretto, Lungo, Rückkehr Espresso – und teilweise weitergehende Untersuchungen, wie die Auswirkungen von Drehzahlverstellungen oder Slow Feeding Experimente.

    x50 (Median-Partikelgröße): Der Punkt, an dem 50 % des Mahlguts kleiner und 50 % größer sind. Bei Espresso liegt er typischerweise zwischen 150 und 350 µm, je nach Mühle und Einstellung. Er beschreibt den „durchschnittlichen Mahlgrad" und verschiebt sich feiner oder gröber mit der Einstellung. Allein ist er aber nur begrenzt aussagekräftig – er beschreibt die Mitte, nicht die Ränder.

    Feinanteil (Qf <100 µm): Der prozentuale Anteil der Partikel kleiner als 100 µm – der eigentliche Kaffeestaubanteil. Ein hoher Feinanteil erhöht Körper und Dichte eines Espressos, birgt aber das Risiko von Überextraktion und Bitterkeit. Er zwingt außerdem dazu, gröber zu mahlen, um überhaupt noch einen durchlaufenden Shot zu bekommen. Mühlen mit wenig Fines können deutlich feiner eingestellt werden und liefern oft klarere, nuanciertere Geschmacksprofile.

    60 % Coarse Peak Width (Hauptpeak-Breite): Der Größenbereich, in dem 60 % der groben Partikel (über 100 µm) enthalten sind. Eine schmale Verteilung bedeutet, dass die meisten Partikel ähnlich groß sind – gleichmäßige Extraktion, balancierter Geschmack. Eine breite Verteilung bedeutet Heterogenität: Während manche Partikel schon überextrahieren, bleiben andere weit zurück. In unseren Tests haben wir beobachtet: Sobald die Peak-Breite über ~300 µm steigt, schmecken Espressi häufig „verzettelt" – Säure und Bitterkeit stehen unverbunden nebeneinander, die Süße fehlt. Ausführlich beschreiben wir das im Artikel zur Partikelverteilung.

    Konstanzprüfung

    Eine gute Mühle mahlt nicht nur beim ersten Shot präzise – sie tut es beim fünfzehnten genauso. Für die Konstanzmessung mahlen wir 15 × 18 g mit je 30 Sekunden Abstand und messen jede Ausgabemenge auf 0,1 g genau. Daraus berechnen wir Mittelwert und Standardabweichung.

    Standardabweichungen um 0,1 g sind solide. Unter 0,05 g ist hervorragend. Über 0,2 g beginnt es, den Workflow zu stören – wer auf 0,1 g genau dosiert, braucht eine Mühle, die das auch hält.

    Bei Mühlen mit Grind-by-Weight-Funktion (wie der Eureka Libra 65 AP oder der Zuriga G2 GbW) prüfen wir zusätzlich, wie präzise die Waage arbeitet und wie sie mit Mahlgradänderungen umgeht.

    Espresso-Verkostungsprotokoll

    Alle Messwerte der Welt ersetzen nicht den entscheidenden Test: Wie schmeckt der Espresso? Wir verkosten parallel zu jeder Testphase und führen Verkostungen durch, bei der zum Ende einer größeren Testreihe alle getesteten Mühlen nebeneinander bewertet werden.

    Unser Verkostungsprotokoll orientiert sich am Bewertungsbogen der World Barista Championship, wir haben die Skala aber auf 10 Punkte erweitert und die Attribute differenzierter aufgeteilt. Wir bewerten zwei Dimensionen:

    • Geschmacksbalance umfasst Süße (balancierend, zeigt Extraktionsgleichmäßigkeit), Säure (Klarheit, Transparenz, Lebendigkeit – nicht Schärfe) und Bitterkeit (integriert und positiv vs. harsch und störend).
    • Taktile Erfahrung umfasst Gewicht (Schwere im Mundraum, unabhängig von Qualität), Textur (cremig, ölig, seidig, staubig – die Qualität des Gewichts) und Nachgeschmack (Länge und Qualität nach dem Schlucken).

    Ergänzt wird jede Bewertung durch eine freie Beschreibung. Mehr dazu im Espresso-Verkostungsprotokoll.

    RPM-Einstellung (Drehzahl)

    Nicht alle Mühlen bieten eine variable Drehzahlregelung – wenn vorhanden, wird sie im Test als eigener Datenpunkt behandelt. Die Drehzahl der Mahlscheiben beeinflusst das Verhältnis von Feinstaub zu Grobpartikeln, ohne dass der Mahlgrad verstellt werden muss.

    Bei höherer Drehzahl werden Bohnen mit mehr kinetischer Energie zerschlagen, was mehr Splitterbildung und damit mehr Fines erzeugt. Bei niedrigerer Drehzahl erfolgt die Zerkleinerung kontrollierter. Die Konsequenzen in der Tasse sind spürbar: Niedrige RPM liefern einen schmaleren Hauptpeak in der Partikelkurve, klarere Aromen und mehr Transparenz – aber weniger Körper. Hohe RPM erzeugen mehr Feinstaub, mehr Körper und dichtere Textur, erhöhen aber auch das Risiko für ungleichmäßige Extraktion.

    Die RPM-Einstellung ist damit ein Werkzeug zur Geschmacksteuerung, das unabhängig vom Mahlgrad wirkt – besonders wertvoll bei Single-Dosing-Mühlen wie dem DF64V, dem Lagom P64 oder der Varia VS6. Sie kann helfen, ein ausgefranstes Extraktionsprofil durch niedrigere Drehzahl zu beruhigen, oder einen körperbetonteren Espresso durch Erhöhung der Drehzahl zu erzeugen.

    Beispiel Varia VS6: Die VS6 bietet eine stufenlose Regelung zwischen 500 und 1.600 U/min. Bei 500 U/min zeigt die Partikelkurve einen schmaleren Hauptpeak – das Mahlgut ist homogener, die Tasse wirkt klarer. Bei 1.600 U/min verbreitert sich der Peak spürbar; im Espresso zeigt sich mehr Körper, mitunter aber auch eine ungleichmäßigere Extraktion. Wenn eine Mühle RPM-Einstellung bietet, dokumentieren wir mindestens zwei Einstellungen mit separaten Partikelproben und Verkostungen.

    Was das Protokoll nicht bewertet

    Ein gutes Testprotokoll definiert auch seine Grenzen.

    Design und Haptik fließen nicht in die Messwerte ein. Eine schön verarbeitete Mühle bekommt von uns dafür keinen Punktebonus – wer 1.000 € ausgibt, darf aber erwarten, dass keine Plastikteile wackeln, und das halten wir in den Notizen fest.

    Langzeitverhalten können wir in unserem Testrahmen nicht abbilden. Unsere alten Mazzer-Mühlen laufen seit 15+ Jahren – das ist Erfahrungswissen, kein Testergebnis.

    Filterkaffee testen wir nur dort, wo eine Mühle explizit als All-Purpose vermarktet wird. Manche Mühlen, wie die Eureka Libra 65 AP, überraschen dabei positiv.

    Alle Espressomühlen im Test

    Alle Ergebnisse auf einen Blick findest du in unserem großen Espressomühlen-Vergleich.

    Was denkst du?