Statistics Calculator
Calculate mean, median, mode, standard deviation, variance and more.
Geprüft von Aygul Dovletova · Zuletzt geprüft
Den Statistikrechner verwenden
- Datensatz einfügen oder eingeben in das Haupt-Textfeld. Der Parser teilt auf Kommas, Semikolons, Tabulatoren, Leerzeichen und Zeilenumbrüche auf, sodass CSV-Ausschnitte, Tabellenkalkulationsauswahlen und zeilengetrennte Logs alle funktionieren.
- Das Zusammenfassungs-Panel beobachten, wie es sich beim Tippen aktualisiert. Anzahl, Summe, Mittelwert, Median, Modus, Spannweite, Minimum, Maximum, Varianz und Standardabweichung werden bei jedem Eingabeereignis neu berechnet.
- Die Moduszeile überprüfen, wenn deine Daten Gleichstände haben: Das Panel zeigt jeden Wert, der gleichauf bei der höchsten Häufigkeit liegt, nicht einen einzelnen willkürlichen Gewinner.
- Ein Ergebnis kopieren, indem du auf den Wert klickst; er landet in deiner Zwischenablage, bereit für einen Bericht oder eine Tabellenzelle.
- Mit dem Löschen-Knopf zurücksetzen, wenn du von vorne beginnen möchtest; das Schließen des Tabs verwirft ebenfalls alles.
Wie die Zahlen berechnet werden
Mittelwert ist eine einfache Summe geteilt durch die Anzahl. Median sortiert eine Kopie des Arrays mit dem standardmäßigen numerischen Komparator .sort((a, b) => a - b) und nimmt das mittlere Element (oder den Durchschnitt der beiden mittleren Elemente bei gerader Anzahl). Modus verwendet eine Map<number, number> zum Zählen der Vorkommen in einem Durchlauf, dann scannt die Map nach der maximalen Häufigkeit. Spannweite ist max - min, beide mit Math.max(...arr) und Math.min(...arr) ermittelt.
Varianz verwendet den Online-Algorithmus von Welford anstelle der naiven Zweipassen-Formel Summe((x - Mittelwert)²) / n. Welford aktualisiert einen laufenden Mittelwert und eine laufende Summe der quadratischen Abweichungen in einem Durchlauf und vermeidet die katastrophale Auslöschung, unter der die Lehrformel leidet, wenn Werte groß und eng beieinander sind (ein bekanntes Problem, das Donald Knuth in The Art of Computer Programming, Band 2 beschreibt). Standardabweichung ist dann einfach Math.sqrt(Varianz). Alle Berechnungen finden innerhalb der Komponente statt; keine Daten verlassen den Browser, kein Analytics-Ereignis trägt deine Zahlen, und es gibt keinen serverseitigen Fallback.
Echte Situationen, die schnelle Statistiken erfordern
- Umfrage-Antworten aus einem Google Form-Export zusammenfassen, bevor sie in eine Präsentation übernommen werden.
- Durchschnitt und Standardabweichung der Zykluszeiten eines CI-Systems berechnen, um zu entscheiden, ob ein flackiger Test wirklich langsam ist.
- Prüfen, ob Mittelwert und Median eines Gehaltsdatensatzes voneinander abweichen, was ein schneller Indikator für Schiefe ist.
- Ein pandas-Ergebnis in einem Notebook durch Einfügen der Werte hier plausibilitätsprüfen.
- Eine Unterrichtsstunde über deskriptive Statistik abhalten, bei der das live aktualisierte Anzeigen der Formeln nützlicher ist als statische Folien.
- Eine A/B-Experiment-Stichprobe prüfen, bei der man einen Blick auf die Varianzen werfen möchte, bevor man einen t-Test durchführt.
Grenzfaelle, auf die man achten sollte
- Einzelwert-Datensätze haben Varianz 0 und Standardabweichung 0; das Werkzeug zeigt genau das anstelle eines Fehlers.
- Alle-gleich-Datensätze listen jeden Wert als Modus auf, weil jeder Wert gleichauf bei der höchsten Häufigkeit liegt; das entspricht Karl Pearsons ursprünglicher Definition.
- Leere Eingabe produziert nichts; das Panel bleibt leer, anstatt durch Null zu teilen und NaN zu melden.
- Wissenschaftliche Notation wie
1.5e3wird vonNumber()geparst, sodass1.5e3gleich1500ist. - Sehr große Werte können dazu führen, dass die naive Summe nach ungefähr 1015 in doppelpräziser Arithmetik an Präzision verliert; für extrem große Datensätze verwende Kahan-Summierung oder eine pandas-Pipeline.
- Negative Zahlen funktionieren unverändert, weil die Varianz auf quadratischen Abweichungen basiert; das Vorzeichen fällt heraus.
- Nicht-numerische Tokens werden still übersprungen anstatt das Parsen anzuhalten, was für eingefügte Logs vergebend ist, aber bedeutet, dass ein Tippfehler nicht gemeldet wird.
Population vs. Stichprobe und der Streit über (n-1)
Dieses Werkzeug berechnet die Populations-Varianz (geteilt durch n) und die Populations-Standardabweichung. Wenn du deine Daten als Stichprobe aus einer größeren Population behandelst und eine unverzerrte Schätzung der Populations-Varianz möchtest, teile die angezeigte Varianz durch (n - 1) / n; das ist Bessels Korrektur, gerechtfertigt durch die Tatsache, dass der Stichproben-Mittelwert selbst aus den Daten geschätzt wird und daher einen Freiheitsgrad verbraucht. Bei kleinen Stichproben (n < 30) ist der Unterschied erheblich, und Statistik-Lehrbücher empfehlen einheitlich die Stichprobenformel. Für großes n nähern sich beide an. Die Konvention, durch n versus n-1 zu teilen, ist auch der Grund, warum Tabellenkalkulationsbenutzer oft feststellen, dass VAR.P und VAR.S sich unterscheiden; beide sind im ISO/IEC 80000-2-Vokabular definiert.
Wann ein dediziertes Statistikpaket besser ist
Dieser Rechner bearbeitet deskriptive Statistik; alles Schließende - Konfidenzintervalle, t-Tests, ANOVA, Regression - gehört in R, Python (scipy.stats, statsmodels), Julia oder eine dedizierte Plattform wie JASP oder Stata. Tabellenkalkulationen (Excel, Google Tabellen, Numbers) bieten MITTELWERT, MEDIAN, STABWN, STABW und eine vollständige Diagrammschicht, bestrafen aber Datensätze über einige hunderttausend Zeilen. Befehlszeilen-Optionen wie datamash, awk oder jq sind hervorragend für Pipelines. Das Browser-Werkzeug gewinnt, wenn du einen bescheidenen Datensatz hast, die Antwort in unter fünf Sekunden brauchst und nichts Schwereres öffnen möchtest.
Häufig gestellte Fragen
Handelt es sich um die Populations- oder Stichproben-Standardabweichung?
Das Werkzeug berechnet die Populations-Standardabweichung, bei der die Summe der quadratischen Abweichungen durch <em>n</em> geteilt wird. Arbeitest du mit einer Stichprobe und möchtest die unverzerrte Stichproben-Standardabweichung, multipliziere die angezeigte Varianz mit <em>n</em>/(<em>n</em>-1), bevor du die Quadratwurzel ziehst, oder teile die Summe der quadratischen Abweichungen durch <em>n</em>-1. Beide Ergebnisse nähern sich für große Datensätze an, weichen aber merklich ab, wenn <em>n</em> unter 30 liegt.
Warum verwendet das Werkzeug den Algorithmus von Welford anstelle der Standardformel?
Die naive Zweipassen-Formel <code>Varianz = Summe((x - Mittelwert)²) / n</code> benötigt den vollständigen Mittelwert, bevor sie quadratische Abweichungen akkumulieren kann, und leidet unter katastrophaler Auslöschung bei großen, eng beieinanderliegenden Werten. Der Algorithmus von Welford aus dem Jahr 1962 aktualisiert einen laufenden Mittelwert und eine laufende Summe quadratischer Abweichungen in einem Durchlauf mit einer numerisch stabilen Rekurrenz. Knuth beschreibt ihn in <em>TAOCP</em> Bd. 2; jede ernsthafte Statistikbibliothek verwendet ihn oder eine Variante intern.
Verlassen meine Daten je den Browser?
Nein. Der Rechner ist eine clientseitige Preact-Komponente, und der Parser, der Zusammenfasser sowie der Welford-Akkumulator leben alle in dieser Komponente. Es gibt keinen Abruf zu einem Backend, kein Analytics-Ereignis, das an deinen Datensatz geknüpft ist, und keinen localStorage-Schreibvorgang. Du kannst sensible Daten (Gehaltsangaben, medizinische Messungen, proprietäre Kennzahlen) mit derselben Zuversicht einfügen wie in eine Desktop-Anwendung.
Was tut der Rechner, wenn jeder Wert genau einmal vorkommt?
Genau genommen ist jeder Wert gleichauf bei der höchsten Häufigkeit, sodass es keinen eindeutigen Modus gibt. Verschiedene Lehrbücher behandeln das unterschiedlich: Manche sagen, es gibt keinen Modus, andere sagen, jeder Wert ist ein Modus. Dieses Werkzeug nimmt die zweite, wörtlichere Sichtweise und listet alle Werte auf. Siehst du eine riesige Modusliste, ist das das Signal, dass deine Daten keine Wiederholung haben.
Wie wird der Median bei einer geraden Anzahl von Werten berechnet?
Das Werkzeug sortiert die Werte aufsteigend und nimmt das arithmetische Mittel der beiden mittleren Elemente. Für <em>n</em> = 6 ist das <code>(sortiert[2] + sortiert[3]) / 2</code> mit nullbasiertem Index. Das stimmt mit der Definition von <code>numpy.median</code>, <code>R</code>s <code>median()</code> und ISO 80000-2 überein. Manche älteren Lehrbücher wählen stattdessen den niedrigeren der beiden Werte, was dieses Werkzeug nicht tut.
Kann ich direkt eine CSV-Spalte einfügen?
Ja. Der Parser teilt auf Kommas, Semikolons, Tabulatoren, Leerzeichen und Zeilenumbrüche auf und toleriert gemischte Trennzeichen; ein einspaltige CSV-Einfügung aus einer Tabellenkalkulation oder ein zeilengetrennte Log funktionieren beide. Werte, die <code>Number()</code> nicht bestehen, werden still ignoriert, sodass eine Kopfzeile wie "Wert" oben in der Einfügung übersprungen wird, anstatt die Zählung zum Absturz zu bringen.
Was ist die praktische Obergrenze für die Datensatzgröße?
Irgendwo nördlich einer Million Werte pro Lauf wird auf einem modernen Laptop problemlos verarbeitet; der Engpass ist der Kopier-Sortier-Schritt für den Median, nicht der Welford-Durchlauf. Für größere Datensätze oder Streaming-Situationen, bei denen du nicht alles im Speicher halten kannst, wechsle zu einem Werkzeug, das inkrementell arbeiten kann (pandas mit aufgeteilten Lesevorgängen, DuckDB oder <code>awk</code>) oder erstelle eine serverseitige Zusammenfassung.
Warum sieht die Summe manchmal einige Dezimalstellen daneben aus?
IEEE 754 doppelpräzises Gleitkomma hat eine 52-Bit-Mantissen-Auflösung (ungefähr 15 bis 17 Dezimalstellen). Das Summieren von Tausenden von Zahlen mit Nachkommastellen kann genug Rundungsfehler ansammeln, dass die angezeigte Summe von der echten mathematischen Summe um einige ULPs abweicht. Der Welford-Algorithmus kontrolliert das für die Varianz; für die Summe selbst würde eine Kahan-Summierung es vollständig eliminieren, allerdings mit kleinen Leistungskosten.
Was ist der Unterschied zwischen Spannweite, Varianz und Standardabweichung?
Spannweite ist die einzelne Zahl <code>max - min</code>, nützlich, aber sehr empfindlich gegenüber Ausreißern. Varianz ist die durchschnittliche quadratische Abweichung vom Mittelwert, ausgedrückt in der Quadrateinheit der Originaleinheit. Standardabweichung ist die Quadratwurzel der Varianz, wieder in der Originaleinheit, und ist das übliche Streumaß, weil sie direkt mit dem Mittelwert vergleichbar ist. Zusammen bieten sie drei zunehmend informative Sichtweisen darauf, wie weit die Daten gestreut sind.
Kann ich Quartile und Perzentile mit diesem Werkzeug berechnen?
Nicht in der aktuellen Version. Das Panel zeigt die fünf Maße der zentralen Tendenz plus Streumaße (Varianz, Standardabweichung, Spannweite), berechnet aber nicht Q1, Q3, den Interquartilsabstand oder beliebige Perzentile. Diese sind in einem separaten statistischen Zusammenfassungswerkzeug verfügbar, oder du kannst sie von <code>numpy.percentile</code> oder einer Tabellenfunktion wie <code>QUARTILE.INC</code> erhalten.
Ist die Sortierung stabil bei Duplikatwerten?
Sortierstabilität beeinflusst die Ergebnisse nicht, weil gleiche Werte für Median, Modus, Minimum und Maximum ununterscheidbar sind. V8, SpiderMonkey und JavaScriptCore verwenden alle stabile Sortierungen in modernen Versionen.
Kann ich das als Medianalter-Rechner für eine Altersliste verwenden?
Ja. Füge die Alter als komma- oder zeilengetrennte Liste ein, und die Medianzeile gibt das zentrale Alter in Sekunden aus, ohne spezielles "Medianalter-Rechner"-Branding. Für eine Stichprobe von 17 Alter ist es der 9. Wert in sortierter Reihenfolge; bei einer geraden Anzahl ist es der Mittelwert der beiden mittleren Werte. Verwende dasselbe Eingabefeld für jede andere Mittelpunkt-Statistik - Medianeinkommen, Median-Antwortzeit, Median-Satzlänge - weil die Formel dieselbe ist.
Ist das für einen Grundkurs Statistik geeignet?
Es ist für den elementaren Statistikgebrauch gebaut. Mittelwert, Median, Modus, Spannweite, Varianz und Standardabweichung sind die sechs deskriptiven Maße, die in jedem Einführungs-Lehrbuch vorkommen, und das Panel beschriftet sie in derselben Reihenfolge. Schüler können einen kleinen Datensatz einfügen, alle sechs nebeneinander sehen und Handberechnungen überprüfen. Für schließende Statistik - Konfidenzintervalle, Hypothesentests, Regression - wechsle zu einem dedizierten Paket wie R oder Python, da diese Analyseebene hier nicht in den Anwendungsbereich fällt.
Mehr Math & Calculators
Age Calculator
Calculate exact age in years, months and days from a birthdate.
Open toolArea & Volume Calculator
Calculate area of 2D shapes and volume of 3D solids.
Open toolBMI Calculator
Calculate your Body Mass Index and find your weight category.
Open toolByte / Bit Converter
Convert between bits, bytes, KB, MB, GB, TB and PB.
Open toolDiscount Calculator
Calculate discount amount, sale price, savings, and discounted value with optional sales tax. Supports stacked coupons.
Open toolFibonacci Sequence Generator
Generate Fibonacci numbers up to any length.
Open tool