Stefan Th. Gries

Research: the complete overview

Home

Statistik für Sprachwissenschaftler

Contact information

published by Vandenhoeck und Ruprecht

Disclaimer

Last updated: 25 December 2010

Errors, broken links, feedback, suggestions ... please let me know!


Hinweise zu SPSS

Dies ist ein Teil der Begleitseite zu Gries, Stefan Th. 2008. Statistik für Sprachwissenschaftler. Vandenhoeck und Ruprecht. Auf dieser Webseite werden ein paar Hinweise dazu gegeben, wie viele der im Buch diskutierten Verfahren mit SPSS gerechnet werden können. Allerdings ist zuvor eine Vorabbemerkung erforderlich: Ich persönlich finde, dass der Leser unbedingt nicht SPSS verwenden sollte:

  1. R ist inzwischen die führende Anwendung und Programmierumgebung für Statistik oder zumindest auf dem allerbesten Wege dahin.
  2. Viele Dinge sind mit der Benutzeroberfläche SPSS gar nicht möglich: wenn Sie eine Analyse machen und sie nach drei Monaten wiederholen wollen, dann müssen Sie genau wissen, welche Optionen gewählt wurden etc. und sich dann durchklicken – in R laden Sie einfach das Skript und alles läuft von alleine.
  3. Aus diesem Grund ist auch der Austausch kompletter statistischer Analysen viel einfacher: Sie verschicken einfach das Skript und alles wird repliziert, und das sogar über verschiedene Computersysteme:
  4. SPSS ist nicht in gleicher Form für alle Betriebssysteme verfügbar – R schon.
  5. Ich habe schon mehrere R-Programme geschrieben, die ich Linguisten überall zur Verfügung stellen kann, ohne dass diese eine kommerzielle Anwendung kaufen müssen – mit der SPSS Benutzeroberfläche wäre das sehr viel umständlicher.
  6. SPSS kann bestimmte Dateigrössen gar nicht bearbeiten: Als Korpuslinguist hatte ich öfter schon Datensätze, die SPSS nicht mal laden konnte.
  7. R ist eine Programmierumgebung, die neben Statistik auch noch ganz anderen Dinge zur Verfügung stellt: in meiner Einführung in die Korpuslinguistik beispielsweise bespreche ich, wie man nahezu alles, was ein Korpuslinguist je machen wollen würde, auch mit R machen kann; R kann dazu in HTML, PDF oder LaTeX ausgeben, mit SQL, Perl, Python interfacen. D.h., der Anwender muss nur eine Anwendung lernen, und nicht SPSS für Statistik, X für Konkordanzen, Y für fortgeschrittene Grafiken, ... Das bedeutet auch, dass R flexibler mit unterschiedlichen Arten umgehen kann, in denen Daten vorliegen.
  8. Da R open source software ist, gibt es eine lebhafte community, die R ständig weiter entwickelt und bugfixes innerhalb kürzester Zeit und kostenfrei zur Verfügung stellt.
  9. SPSS ist für Dozenten und Studenten in Deutschland nicht allzu teuer, aber das heisst nicht, dass es für Unis günstig ist, und immer mehr Institutionen verwenden R, weil es nicht einzusehen ist, für ein Programm wie SPSS, das viel weniger kann als R, auch noch jährlich (!) Lizenzgebühren zu bezahlen – selbst Dozenten und Studenten können SPSS dann manchmal nur am Campus benutzen und nur im oft eingeschränkten Rahmen der verfügbaren Lizenz (oft sind nicht alle Module verfügbar oder die Studentenversion erlaubt nur bestimmte Datensatzgrössen) – mit R hat man immer alles, was es gibt.

Also, verwenden Sie lieber R, so wie es im Buch diskutiert wird, oder den R commander (indem Sie die library (Rcmdr) und die dazugehoerigen anderen Pakete installieren und dann library(Rcmdr)¶ in R eingeben). Das hat den Vorteil, dass Sie weiterhin viele Vorteile von R geniessen, aber auch ein point-and-click interface benutzen können und dabei sogar noch R Syntax kennenlernen können: wann immer Sie etwas im R commander tun, bekommen Sie die R-Syntax angezeigt, die für Ihre Anwendung ausgeführt wurde:

R commander": Das Hauptfenster

R commander: Importieren von Datendateien



Nun – trotz allem – zu SPSS ...

Laden und speichern einer Datei

Um die typische Art von Datendatei in SPSS zu laden, ist es oft am einfachsten, in der Menüleiste die Funktion "File: Read Text Data ..." zu verwenden. In dem dann folgenden Menü wählen Sie die entsprechende Textdatei und starten damit einen Text Import Wizard. Im ersten Schritt können Sie wählen, ob Sie ein vordefiniertes Format zum Laden verwenden wollen; hier antworten Sie wahrscheinlich "No". Im zweiten Schritt spezifizieren Sie, wie die Daten aufgebaut sind. Fast immer werden die Spalten durch ein bestimmtes Zeichen – einen Tabstop – begrenzt und haben Sie die Spaltennamen in der ersten Zeile. Im dritten Schritt müssen Sie üblicherweise nichts tun, wenn Sie einfach die ganze Datei laden wollen. Im vierten Schritt definieren Sie das Spaltentrennzeichen und das Zeichen, dass Text definiert. Im fünften Schritt können Sie für jede einzelne Spalte definieren, was für Daten sie enthält. Üblicherweise werden Sie die Formate "Numeric" und "String" verwenden wollen. Im letzten Schritt können Sie das definierte Format speichern oder, wahrscheinlich meistens, einfach nur die Datei laden. Um eine Datei zu speichern, wählen Sie in der Menüleiste "File: Save" oder "File: Save As ...".


Grundsätzliche Anmerkungen

Fast alle Verfahren funktionieren auf die gleiche Art. Sie wählen über die Menüleiste "Analyze:" und wählen das gewünschte Verfahren, was dann normalerweise ein Fenster öffnet, in dem Sie die beteiligten Variablen und allerlei Optionen auswählen können. Hier ein Beispiel für ein solches Fenster:

Links sehen Sie die im Datensatz enthaltenen Variablen. Um eine Variable wie z.B. KONSTRUKTION1 als abhängige Variablen in einer logistischen Regression zu definieren, klicken Sie links auf den Variablennamen und dann auf die Taste mit dem seitwärts zeigenden Dreieck links neben dem Feld mit dem Namen "Dependent". Um Variablen als unabhängige Variablen (hier als "Covariates" bezeichnet") zu definieren, klicken Sie links auf die Variablennamen und dann auf die Taste mit dem seitwärts zeigenden Dreieck links neben dem Feld mit dem Namen "Covariates" etc. Um dann Einstellungen für Kategorialvariablen vorzunehmen, klicken Sie dann unten auf die Taste "Categorical" etc. Weitere methodenspezifische Einstellungen können dann über die Tasten "Options" oder vergleichbare Tasten in anderen Verfahren definiert werden. In den folgenden Zeilen wird gezeigt, wo in SPSSs Menüstruktur Sie die meisten im Buch diskutierten Verfahren finden, wo Sie dann die Variablen etc. wie oben definieren können.


Kapitel 3: Deskriptive Statistik


Kapitel 4: Analytische Statistik


Kapitel 5: Ausgewählte mehrfaktorielle Verfahren