1. Was versteht man unter Statistik und Daten?
Statistik ist die Lehre von Methoden zur Analyse quantitativer Informationen (Zahlen und zählbare Informationen). Statistik ist also ein Oberbegriff für unterschiedliche Methoden der Datenanalyse (z.B. Mittelwertberechnungen, Kreuztabellierung oder Regressionsanalyse). In der Alltagssprache aber sind mit „Statistik“ oft aufbereitete Daten, also zusammenfassende Tabellen oder Diagramme, gemeint.
Als Daten versteht man logisch gruppierte Informationseinheiten. Sie sind das Ergebnis systematischer Erhebungen, etwa anhand von Befragungen, Beobachtungen, Interviews, Experimenten oder das Resultat von Verwaltungsvorgängen. Im letztgenannten Fall spricht man auch von „prozessgenerierten“ oder „prozessproduzierten Daten“. Diese Datenform ist in der Deutschsprachigen Gemeinschaft am häufigsten.
Daten für die Statistik sammeln und bearbeiten
Sie sollten darauf achten, dass Sie zunächst möglichst unbearbeitete Informationen sammeln. Diese „Daten“ werden in einem zweiten Schritt nach Bedarf aufbereitet.
Im Idealfall verfügen Sie für jeden Merkmalsträger - also für jede Person, jede Gebietseinheit, jeden Antrag oder jede Akte - über die relevanten Angaben in zunächst möglichst unbearbeiteter Form. Die Angaben sollten noch nicht zusammengefasst (aggregiert) sein.
Bevorzugen Sie zum Beispiel Datensätze, in denen zur Akte XYZ das Geburtsjahr und nicht etwa die Zugehörigkeit zu einer Altersklasse notiert wurde. So können Sie die Altersklassen später beliebig berechnen und Mittelwerte ausweisen. Auch haben Sie z.B. mehr Auswertungsoptionen, wenn Sie für eine Gemeinde die Flächengröße und Einwohnerzahl besitzen, als wenn Ihnen nur das „Produkt“ in Form der Einwohnerdichte vorliegt.
Daten speichern
Speichern Sie die „Datensätze“ z.B. in einem Tabellenblatt einer Excel-Datei. Benutzen Sie dabei für jeden Merkmalsträger (jede Akte, jede Person oder jeden Antrag,…), am besten eine Zeile. Teilen Sie jedem Merkmalsträger – und somit jeder Zeile - eine Identifikationsnummer zu.
Die Auswertungen dieser Datensätze, z.B. zusammenfassende Häufigkeitstabellen oder Diagramme, speichern Sie dann in anderen Tabellen- bzw. Diagrammblättern ab, ohne dabei die Rohwerte zu „zerstören“. Kommen später bei der Interpretation der Tabellen und Diagramme weitere Fragen auf, ermöglicht diese Vorgehensweise zusätzliche Auswertungen.
Tipp: Wenn Sie Ihre Daten in Excel bearbeiten, sollten Sie sich unbedingt das Arbeiten mit Pivot-Tabellen (auch Kreuztabellen genannt) aneignen. Mit Pivot-Tabellen erstellen Sie in Sekunden die unterschiedlichsten Häufigkeitstabellen. Auch die Berechnung von Prozenten und Mittelwerten geschieht automatisch. Einen kostenlosen Online-Kurs dazu finden Sie zum Beispiel auf www.teialehrbuch.de