Sie können aus einer oder mehreren bestehenden Variablen eine neue Variable berechnen. Das ist z.B. dann sinnvoll, wenn Sie die log-transformierten Werte einer Variablen benötigen, oder wenn Sie den Mittelwert aus mehreren Variablen bilden möchten, z.B. bei Likert-Skalen.
Du willst mehr Durchblick im Statistik-Dschungel?
So geht es:
- Gehen Sie im Menü auf „Transformieren → Variable berechnen“
- Geben Sie in das Feld „Zielvariable“ einen Namen für die neue Variable ein. Achten Sie darauf, dass keine Leerzeichen und keine Sonderzeichen enthalten sind.
- Geben Sie in das Feld „Numerischer Ausdruck“ die Formel zur Berechnung der neuen Variable ein. Dazu können Sie die benötigten Variablen aus der Variablenliste links per Anklicken und Pfeil-Klicken einfügen und sich an der Auflistung der Funktionen rechts bedienen. Wenn Sie z.B. die Variable „Alter“ logtransformieren möchten, so geben Sie als numerischen Ausdruck „LN(Alter)“ ein. Wenn Sie aus den Variablen „frage1“, „frage2“ und „frage3“ den Mittelwert berechnen möchten, so geben Sie „MEAN(frage1, frage2, frage3) ein.
- Klicken Sie auf „OK“
Nun finden Sie in der Datenansicht ganz rechts eine neue Spalte, in der Ihre neu berechnete Variable steht.
Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.
Sehr geehrte Frau Keller,
im Rahmen meiner Masterarbeit zu Thema „Geschlechtsspezifische Unterschiede in Bezug auf die Determinanten der Kundenzufriedenheit“ führe ich eine quantitative Marktforschung durch.
Mich interessiert u.a. der Zusammenhang zwischen Geschlecht und gewissen Determinanten der Kundenzufriedenheit (zB Sortiment) beim Lebensmitteleinkauf. Jetzt gibt es aber nicht nur eine Frage im Fragebogen, die nach dem Sortiment fragt, sondern vier Indikatoren, die das Sortiment operationalisieren. Diese vier Indikatoren (1-10 skaliert) gehören zusammen und bilden quasi das Sortiment.
Wie fasse ich nun die vier Indikatoren zu einem übergeordneten Item (dann wohl mit dem Variablenname SORTIMENT) zusammen?
Ich habe es über Transformieren/Variable berechnen und mit MEAN(Indikator1 + Indikator 2 …) versucht. Das ergibt jedoch nicht nur Werte von 1 bis 10 (meine Skala), sondern auch Zahlen mit Kommastellen, was Kreuztabellen nicht möglich macht. Wäre es richtig diese Wert umzukodieren und in der Variablenansicht wieder eine Skala von 1 bis 10 zu bilden.
Können Sie mir weiterhelfen?
Vielen herzlichen Dank im Voraus!
Beste Grüße,
Danijela Jovic
Liebe Frau Jovic,
die Verwendung von MEAN ist da völlig richtig und es ist in Ordnung, dass dann auch Kommazahlen vorkommen. Sie verwenden diese neue Variable dann als metrische Variable, machen keine Kreuztabellen, sondern berechnen sich Mittelwert, Standardabweichung usw. und untersuchen für den Geschlechtervergleich die Variable auf Lageunterschied, z.B. mit dem t-Test, wenn sie normalverteilt sind, ansonsten mit dem Mann-Whitney U Test.
Diese Vorgehensweise können Sie übrigens auch schon bei den einzelnen Items verwenden. Das ist deutlich übersichtlicher als Kreuztabellen mit so vielen Stufen (1-10).
Schöne Grüße
Daniela Keller
Sehr geehrte Frau Keller,
für eine Semesterarbeit muss ich eine Megaanalyse durchführen. In zum Datensatz dazugehörigen Fragebogen wurde das Informationsverhalten durch verschiedene Ausprägungen (z.B. Onlinemedien, Tageszeitungen etc.) erhoben. Im Datensatz selbst gibt es aber keine Variable „Informationsverhalten“ mit den einzelnen Ausprägungen, sondern einzelne Ausprägungen wurden als getrennte Dummy-Variablen aufgefasst. So habe ich im Datensatz eine Variable „Onlinemedien“ mit den Werten „1-ja“ und „0-nein“ usw. Diese Einzelvariablen würde ich gerne wieder zur eigentlichen Obervariable zusammenfassen, sodass die jetzigen „Variablen“ wieder Ausprägungen mit entsprechenden Fallzahlen darstellen – also eine Variable „Informationsverhalten“ mit z.B. „1-Onlinemedien“, „2-Tageszeitungen“ usw, damit ich über deskriptive Statistiken beispielsweise auf Anhieb sehen kann, welche Medien am häufigsten genutzt werden und allgemein wie das Informationsverhalten verteilt ist. Könnten Sie mir bitte erklären, wie ich dazu komme?
Mit freundlichen Grüßen,
Annika H.
Hallo Annika,
das hört sich nach einem Mehrfachantwortenset an. Das lässt sich mit Häufigkeiten und Balkendiagrammen darstellen.
Schöne Grüße
Daniela
Sehr geehrte Frau Keller,
für meine Bachelorarbeit möchte ich eine gerichtete Hypothese mit Hilfe des ChiQuadratTests prüfen. Das Ergebnis ist hoch signifikant, doch die Kreuztabelle spricht genau gegen die Annahme der Hypothese, so dass das Ergebnis eigentlich nicht-signifikant sein dürfte. Durch die Signifikanz weiß ich jetzt, dass es eine Abhängigkeit meiner zwei Variablen gibt, doch sagt dies ja nicht direkt etwas über die zu überprüfende einseitige Hypothese aus oder? Können Sie mir bei dieser Fragestellung eventuell weiterhelfen?
Mit freundlichen Grüßen
Theresa
Hallo Theresa, wenn das Ergebnis signifikant ist und die Zahlen in der Tabelle für die andere (nicht gewünschte) Richtung sprechen, dann hast du die andere Richtung als signifikant nachgewiesen. Die von dir gewünschte Richtung konntest du dann nicht nachweisen, sondern hast sogar das Gegenteil nachgewiesen.
Haben Sie besten Dank!
Sehr geehrte Frau Keller,
für meine Masterarbeit möchte ich u.a. untersuchen, ob im jungen Erwachsenenalter eher die Familie oder die Freunde oder sonstige Personen den größten Einfluss auf die Intentionen, gesundheitsbewusster zu leben, haben. Dazu sollten die Probanden in einem Fragebogen ihre Netzwerkpersonen angeben (Name + Beziehungsart). Ich habe jetzt Familienmitglieder mit 1 kodiert, Freunde mit 2 und Sonstige mit 3. Aber irgendwie ist mir jetzt unklar, wie ich mit diesen Daten meine Fragestellung untersuchen kann?! Können Sie mir da weiterhelfen?
Liebe Nina,
wie sieht denn der Rest des Fragebogens aus? Welche anderen Variablen hast du erhoben…
Schöne Grüße
Daniela
Liebe Frau Keller,
ich bin gerade dabei, die Fragebögen, die ich für meine Masterarbeit habe ausfüllen lassen, in SPSS einzugeben. Ich habe bereits alle Variablen kodiert und auch im Vorfeld eingestellt, dass mir die relevanten Mittelwerte aus den jeweiligen Items berechnet werden (über TRANSFORMIEREN – VARIABLE BERECHNEN). Das hat für die beiden Fragebögen, die ich zu dem Zeitpunkt schon eingetragen hatte auch wunderbar geklappt. Nun sehe ich aber, dass diese Befehle für alle Daten, die ich jetzt im Nachhinein (nach der „Programmierung“) eingebe, die Befehle nicht mehr ausgeführt werden und nix mehr berechnet wird. Es kann ja aber nicht Sinn der Sache sein, dass man erst wenn alle Daten eingetragen sind, solche Einstellungen vornehmen kann und somit auch keine Daten mehr nachtragbar sind oder? Kann man irgendwo einstellen, dass alle neuen Werte auch in die Berechnungen aufgenommen werden? ich konnte leider dazu bisher nichts finden.
Vielen Dank und herzliche Grüße,
Mirja
Hallo Mirja,
soweit ich weiß, geht das nicht automatisch. Es ist also schon so, dass du erst eingeben und dann berechnen musst. Eventuell kannst du dir über die Syntax helfen: wenn du noch einmal die neue Variable berechnest (wie du beschrieben hast), dann klicke am Ende nicht auf „OK“ sondern auf „Einfügen“. Dann wird der Code für diese Berechnung in einer Syntax-Datei geschrieben. Diese Syntax-Datei speicherst du dann. Wenn du neue Daten eingegeben hast und daraus wieder die Mittelwerte berechnen willst, öffnest du die Syntax-Datei, markierst den Inhalt und klickst auf den grünen Pfeil. Damit wird der Mittelwert neu berechnet.
Schöne Grüße
Daniela
Vielen Dank für die schnelle Antwort! 🙂
Herzliche Grüße, Mirja
Liebe Frau Keller,
ich arbeite im Rahmen meiner Masterarbeit das erste Mal mit SPSS und bin ein wenig unsicher. Ich habe drei Fragebögen (Fragebogen 1: 35 Items, Fragebogen 2: 35 Items, Fragebogen 3: 57 Items) entwickelt, die Items sind dabei auf einer Skala einzuschätzen (0=nie, 1=selten, 2=häufig, 3=immer). Diese Bögen wurden von Schülern und Lehrern ausgefüllt.
Jetzt habe ich in SPSS die Daten eingegeben, jedes Item aller Bögen ist eine Variable (also insgesamt 127 Variablen). Die Itemvariablen sind, aufgrund der Ratingskala, ordinalskaliert, das hab ich in der Variablensicht so eingestellt. Ich würde die Items jetzt gerne zu Bögen und Skalen (wie in den Fragebögen auch) zusammenfassen, um damit weiterzuarbeiten (z.B. würde ich mit den Bögen gerne eine Rangkorrelation nach Spearman machen).
Nur: Wie fasse ich die Itemvariablen richtig zusammen? Ich dachte, dass ich dafür über Transformieren –> Variable berechnen gehen könnte. Numerischer Ausdruck für einen der Bögen (z.B. Fragebogen 1 mit 35 Items) wäre dann Median (Var1, Var2 … Var35). Ist das so korrekt? Also bietet sich der Median hierfür an? Es sind ja ordinalskalierte Daten, deswegen kann ich ja kein arithmetisches Mittel oder was anderes bilden.
Oder muss ich die Daten auf anderem Wege transformieren oder berechnen/zusammenfassen?
Vielen herzlichen Dank für Ihre Hilfe!
Isabel
Hallo Isabel,
was du hier erhoben hast sind Likert-Skalen. Die sind streng genommen ordinal, haben sich aber auch in der Verwendung als metrische als gut erwiesen. Aus diesen Likert-Skalen wird sehr oft der Mittelwert oder ein Summenwert als Gesamtscore der Skala gebildet. Du könntest also schon den Mittelwert nehmen. Allerdings solltest du vorab untersuchen, ob deine Items auch gut zusammen passen, so dass es überhaupt Sinn macht, sie zusammen zu fassen. Schau dir dazu z.B. mal Cronbachs Alpha an.
Schöne Grüße
Daniela
Vielen herzlichen Dank für Ihre rasche Antwort! Ich war diesbezüglich etwas unsicher, da mir in dem einen Statistik-Seminar, dass ich im Studium hatte, eingetrichtert wurde, dass man bei ordinalen Variablen unter keinen Umständen das arithmetische Mittel berechnen dürfe. Aber es scheint eine Konvention in der Wissenschaft zu sein, das bei den Likert-Skalen (eben so eine Ratingskala, wie ich sie in den Bögen zur Einschätzung genutzt habe) trotzdem zu machen? Ich werde mich morgen noch einmal an SPSS setzen und die Items zusammenfassen (mittels MEAN dann anscheinend).
Und tatsächlich habe ich für die einzelnen Bögen schon Cronbachs Alpha berechnet, die Werte sind im okayen (>0.7 bei einem Bogen) bis sehr guten Bereich (>0.9 bei den anderen beiden). Also die Items passen anscheinend schon gut zusammen?
Auf jeden Fall vielen herzlichen Dank! Sowieso ein sehr guter Blog, der viel Licht ins Dunkle bringt.
Hallo Isabel,
ja, Likert-Skalen werden sehr häufig wie intervallskalierte verwendet. Die Cronbachs Alpha Werte sind gut. Damit können Sie weiter arbeiten!
Schöne Grüße
Daniela Keller
Liebe Frau Keller,
ich habe eine Frage, bei der Sie mir hoffentlich weiterhelfen können. Ich habe für verschiedene Produkte in Bezug auf eine bestimmte Person (z.B. Mutter) abgefragt, ob der Proband bereit wäre, dieses Produkt mit der Person zu teilen oder nicht (1= nicht teilen, 2=teilen). Nun habe ich Variablen auf Produkt- und Personenebene. Meine Variablennamen lauten z.B. Mutter_Gießkanne (also ist der Proband bereit, mit der Mutter die Gießkanne zu teilen), Vater_gießkanne, Bruder_gießkanne, Mutter_buch (analog zu den anderen: Ist der Proband bereit, mit der Mutter das Buch zu teilen), Vater_buch, Burder_buch etc. Ich frage also verschiedene Kombinationen von Personen und Produkten ab und generiere dabei immer eine Variable mit der Ausprägung 1 oder 2 (= Produkt geteilt). Nun möchte ich mir bspw. in SPSS anzeigen lassen, wie oft bei der Mutter geteilt wurde, also wie oft die Ausprägung 2 in Mutter_ Gießkanne, Mutter_Buch etc. vorkommt. Wie kann ich das in SPSS umsetzen, da es hier um eine Häufigkeitsauszählung von einem Wert (2) in mehreren Variablen geht?
Vielen Dank im Voraus und beste Grüße,
Nadine
Hallo Nadine,
das geht nicht direkt in SPSS. Du musst hier für jede Variable einzeln die Häufigkeiten auszählen (Häufigkeitstabellen erstellen lassen) und dann dieHäufigkeiten für alle Variablen „von Hand“ zusammenzählen.
Die Alternative wäre, dass du die Daten umstrukturierst, indem du alle Mutter-Variablen untereinander in eine Spalte kopierst und dann diese Spalte mit einer Häufigkeitstabelle auswertest. Aber das ist wahrscheinlich nicht weniger umständlich…
Schöne Grüße
Daniela
Vielen Dank Frau Keller, damit haben Sie mir sehr weitergeholfen:-) Viele Grüße
Vielen Dank – mir auch! Ich hatte eine ähnliche Frage 🙂
Herzliche Grüße aus Ö,
Sabine Fuchs
Liebe Frau Keller,
ich habe ein Fragebogen für mein Arbeit erhoben, in dem ich die Studiengänge gruppieren möchte. Ich habe viele Bachelorfächer die nur ein paar mal gewählt wurden. Um sinnvolle Ergebnisse zu kriegen möchte ich die ähnliche Fächer zusammenfassen und eine neue Variable bilden.
Ich benutze Pspp ( ist ähnlich wie SPSS) wie kann ich bei diesem Program neue Variablen anhand diese einzelnen Fächer erstellen?
Vielen Dank im Voraus
Sümeyra
Hallo Sümeyra,
mit Pspp kenne ich mich nicht aus. In SPSS ginge das über Tranformieren -> Umkodieren in andere Variable.
Schöne Grüße
Daniela
Hallo Frau Keller,
ich schreibe eine Studienarbeit bzgl. Stressempfinden unter Studierenden. Diesbezüglich möchte ich die Hypothese testen, dass Studierende mit mittlerem subjektiven Stresserleben ihr Studium häufiger in Regelstudienzeit schaffen als Studierende mit niedrigem oder hohem Stresserleben.
Das Stressniveau ist der Mittelwert einer Skala. Habe diesbezüglich bereits 2 Gruppen gebildet (Gruppe 1: nicht-mittleres Stressniveau, Gruppe 2: mittleres Stressniveau). Die Frage nach der Regelstudienzeit ist mit ja/nein beantwortet worden.
Jetzt habe ich also 2 Variablen, die jeweils nominalskaliert sind. Mit welchem Test kann ich prüfen, ob die Studierenden der Gruppe „mittleres Stressniveau“ tatsächlich signifikant häufiger ihr Studium in Regelstudienzeit abschließen? Ein Chi-Quadrat-Test hilft mir ja nur bei der Aussage, ob signifikante Unterschiede bestehen?
Vielen herzlichen Dank für Ihre Hilfe!
Hallo Lisa,
der Chi-Quadrat Test würde hier schon passen. Er untersucht den Zusammenhang zwischen Regelstudienzeit ja/nein und Stress nichtmittel/mittel. Das ist das gleiche, wie wenn man untersucht, ob zwischen den beiden Stress-Gruppen signifikante Unterschiede in der Regelstudienzeit bestehen bzw. ob die Häufigkeit der Regestudienzeit „ja“ sich in den Gruppen unterscheidet. Das passt also. Da das aber eine 2×2-Tabelle ist, wäre sogar Fishers Exakter Test noch besser.
Schöne Grüße
Daniela
Liebe Frau Keller,
heute bin ich auf einem Problem gestoßen. Ich habe eine Studie in zwei Ländern durchgeführt und würde für einige Variable sowie für Regressionen Länderunterschiede berechnen. Ich habe zwei Datensätze, in denen bis ein-paar Variablen alle ähnlich kodiert sind. Die Datensätze habe ich gematcht und in jedem Datensatz eine Lädervariable z.B. für De und für CH erstellt.
DATASET ACTIVATE DataSet2.
COMPUTE Land_De=1.
COMPUTE Land_CH=1.
Im gematchten Datensatz würde ich gerne eine Variable erzeugen, die die Fälle umfassen, wenn De=1 und CH=0, wenn 2 Gruppe erzeugt werden. Wie kann ich diese Variable erzeugen. Wenn ich keine zwei Gruppen habe, kann ich z.B. mit einfaktorieller Varianzanalyse keine Unterschiede auf der Läderebene berechnen.
Für Ihren Tipp wäre ich sehr verbunden.
Besten Dank im Voraus.
Viele Grüße
Sophie
Hallo Sophie,
ich habe noch nicht ganz verstanden, was du vorhast, wie deine Daten aktuell aussehen und wie sie aussehen sollen. Kannst du es vielleicht an einem Beispiel erklären? Danke!
Daniela
Hi Daniela,
Danke für Deine Rückmeldung. Ich glaube, ich habe das Problem gelöst.
Beste Grüße
Sophie
Liebe Frau Keller,
ich hoffe Sie können mir bei folgender Frage weiterhelfen:
In meiner Untersuchung zur Masterarbeit habe ich meine abhängige Variable „Weiterempfehlung“ mit der ich eine Varianzanalyse durchführen möchte. Diese wird einerseits durch eine Prozentfrage („Wie wahrscheinlich ist es, dass Sie xy weiterempfehlen würden?“) und andererseits durch 3 Items zur Weiterempfehlung abgebildet.
Meine Frage ist a) ob ich einfach diese 4 Items über die Mean-Funktion bei Spss zu einer Variable „Weiterempfehlung“ zusammen kann
oder ich b) nur die 3 Items über Mean zu einer Variable zusammen muss und ob ich c) auch einfach nur die Prozentfrage als abhängige Variable nehmen kann?
Ich habe alle 3 Varianten bereits ausprobiert und bekomme bei Möglichkeit a) und c) sig. Ergebnisse raus und bei Möglichkeit c) gar kein sig. Ergebnis, was für mein Untersuchungsergebnis sehr schlimm wäre.
Für Ihre Hilfe wäre ich Ihnen sehr dankbar.
Liebe Grüße
Derya Kaplan
Hallo Derya,
grundsätzlich ist hier alles möglich. Sinn macht eine Zusammenfassung von mehreren Variablen, wenn sie nachweislich das gleiche messen. Dazu könntest du z.B. Korrelationen oder Cronbachs Alpha (Reliabilität) berechnen. Wenn hier gute Werte vorliegen, macht das Zusammenfassen Sinn.
Schöne Grüße
Daniela
Hallo Frau Keller,
ich hätte eine Frage bezüglich des Zusammenführen zweier Variablen. Ich möchte gerne eine Variable „Qualitätszeitungen“ haben, die sich aus jeweils 2 Variablen zusammensetzten soll. Also die Leute, die keine der beiden Zeitungen lesen, jene die eine der Beiden Zeitungen lesen und jene, die beide Zeitungen lesen. Wenn ich jetzt bei Variable berechnen eingebe = ZeitungA + ZeitungB zeigt es nur die Fälle an, in denen beide Zeitungen gelesen worden sind. Was muss ich hier berechnen wenn ich alle Ergebnisse haben möchte?
bräuchte hier dringend Hilfe!
Danke!
LG
Hallo Ann-Marie,
das liegt vermutlich daran, dass bei den Originalvariablen nur für „Zeitung lesen“ ein Wert drin steht (z.B. 1) und die anderen („nicht lesen“) einfach leer sind. Du musst also erst die leeren („nicht lesen“) durch Nuller ersetzen. Danach funktioniert das Zusammefassen.
Schöne Grüße
Daniela
Hallo Frau Keller,
ich hoffe, Sie können mir weiterhelfen. Ich zerbreche mir den Kopf.
Zunächst eine hoffentlich leichtere Frage. Ich habe hier schon gelesen, dass ich mehrere Items zu einem Konstrukt über den Mittelwert zusammenfassen kann. Jedoch kann ich dies nicht auch mit einer explorativen Faktorenanalyse machen? Ich habe zb. für die UV „Vertrauen“ 5 Items, die auf einem Faktor hoch laden. Kann ich nicht einfach die Werte speichern und dann den entstandenen Faktor als unabhängige Variable „Vertrauen“ benennen und diesen für eine Regression weiterverwenden? Die Bedingungen für eine Faktorenanalyse sind bei mir erfüllt.
Zweite Frage: Ich habe eine Umfrage bei zwei unterschiedlichen Online-Plattformen durchgeführt (nenne ich A und B). Ich will zunächst überprüfen, ob drei unabhängige Variablen eine abhängige Variable beeinflussen (gerichtete Hypothesen 1-3). Jedoch habe ich für die Auswertung insgesamt 6 UV und 2 AV, da die Umfrage auf die Plattform bezogen war (zB „Die Mitglieder von Plattform A sind ehrlich zueinander“->stimme überhaupt nicht zu etc.). Jedoch möchte ich bei meinen Hypothesen 1-3 ja nur untersuchen, ob „generell“, also unabhängig von der Plattform, ein Einfluss besteht. Muss ich dazu die jeweiligen Variablen zusammenfassen, um anschließend eine Regressionsanalyse durchführen zu können? Wenn ja, wie?
Danke für Ihre Hilfe!
Viele Grüße
Hallo Sabrina,
ja, du kannst mit einer Faktorenanalyse die Zugehörigkeit der Items zu den Variablen bestätigen und anschließend die Items entsprechend zusammen fassen.
Zur zweiten Frage: Wenn das genau die gleichen Fragen/Variablen sind, dann kannst du sie gemeinsam verwenden. Zusammenfassen kannst du sie, indem du die Datensätze einfach untereinander kopierst, so dass die ensprechenden Spalten in einer gemeinsamen Spalte auftauchen.
Schöne Grüße
Daniela
Hallo Frau Keller,
ich schreibe gerade an meiner Masterarbeit „Externe U3 Kinderbetreuung in der Pfalz“. Ich würde gerne eine neue Variable erstellen, weiß aber nicht wie. In meinem Fragebogen habe ich die Frage: Welche Erwerbssituation trifft auf Sie zu? Sie sind zurzeit…
Darauf folgen die Antwortmöglichkeiten:
…erwerbstätig.
…in einer schulischen/beruflichen Ausbildung.
…in Mutterschaftsurlaub, Elternzeit ohne Erwerbstätigkeit.
…nicht erwerbstätig.
Jetzt würde ich gerne aus dem Item „erwerbstätig“ eine neue Variable bilden. Kann ich das? Wenn Ja, wie mache ich das in SPSS?
Vielen herzlichen Dank im Voraus.
Viele Grüße
Maren
Hallo Maren,
das geht über „Umkodieren in andere Variable“. Dabei definieren Sie, dass alle, die bisher „erwerbstätig“ hatten z.B. eine 1 bekommen, alle anderen eine 0.
Schöne Grüße
Daniela
Hallo Frau Keller,
ich schreibe gerade an meiner Masterarbeit und würde gerne wissen wie ich die Mittelwerte mit SPSS von Variablen zentralisiere? (Ich möchte keine z-Standardisierung).
Vielen Dank
Hallo Jennifer,
du kannst einfach eine neue Variable berechnen, wobei du von jeder Beobachtung den Mittelwert der Ursprungsvariablen abziehst.
Für weitere spezielle Fragen – nicht direkt zum Blogbeitrag hier – kannst du meine Facebookgruppe Statistikfragen nutzen: https://www.facebook.com/groups/785900308158525/
Schöne Grüße
Daniela
Hallo Frau Keller,
in meinem Fragebogen tauchen 11 Items auf, die mit einer 6-stufigen Likert-Skala beantwortet wurden. Diese habe ich bereits umkodiert in 1-3=0 und 4-6=1. Nun benötige ich eine neue Variable, die mir anzeigt, ob über alle Items eine 1 auftaucht oder eben nur Nullen. Wie gebe ich das in Spss ein?
Viele Grüße
Katrin
Hallo Katrin,
Ich hoffe, dass ich dich nicht missverstehe, aber du könntest das umkodieren auch einfach von SPSS durchführen lassen und erhälst somit eine neue Variable.
Schau dir hierzu doch einfach mal diesen Blogbeitrag an 😉
Liebe Grüße
Theresa
Hallo Frau Keller,
ich habe für meine Masterarbeit die Selbstwirksamkeitserwartung erhoben und möchte nun für zwei meiner Hypothesen einmal nur die VPn mit hoher und einmal nur die mit niedriger Selbstwirksamkeitserwartung in die Berechnung mit einbeziehen. Ich habe bereits ein dichotomes Item über einen Mediansplit definiert.
Kann ich dieses in zwei einzelne Items SWE_hoch und SWE_niedrig unterteilen, oder wie verfahre ich hier am besten?
Vielen herzlichen Dank schon einmal im Voraus,
Viele Grüße,
Jana
Hallo Jana,
du kannst mit dem schon vorhandenen dichotomen Merkmal deine Dateien aufteilen (z.B: Daten splitten oder Fälle auswählen in SPSS) und dann auf den einzelnen Subdatensätzen weiter rechnen. Weitere Variablen brauchst du meiner Ansicht nach nicht.
Für weitere spezielle Fragen kannst du meine Facebookgruppe Statistikfragen nutzen: https://www.facebook.com/groups/785900308158525/
Schöne Grüße
Daniela
Sehr geehrte Frau Keller,
im Rahmen meiner Masterarbeit im Bereich Marketing untersuche ich den Einfluss von verschiedenen Markenfits (zwei Automobilmarken) auf die Einstellung zu deren Kooperationsprodukt. Dabei habe ich im Fragebogen z.B. nach der wahrgenommenen Qualität und nach dem Markenwissen zu jeder einzelnen Marke gefragt (Skala 1-6, mit 1 trifft zu und 6 trifft nicht zu). Die Auswertung soll anhand einer multiplen Regressionsanalyse erfolgen, wofür ich zuerst für jedes Konstrukt die Faktorwerte berechnet habe. Anschließend habe ich mit den errechneten Faktorwerten die verschiednen Fits (difference score) mittels Transformation (=ABS(Qualität Marke 1 – Qualität Marke 2)) berechnet. Ist dies die richtige Vorgehensweise?
Zum Schluss habe ich den Zusammenhang zwischen den Fits und der Einstellung zum Kooperationsprodukt (berechnete Faktorwerte) hergestellt.
Kann ich die Werte wie oben beschrieben in Zusammenhang setzen? Oder ändert sich durch die Fit-Berechnung irgendwas?
Nachdem ich die Analyse mittels SPSS einmal durchlaufen lassen habe, hat sich herausgestellt, dass eigentlich kein Zusammenhang zwischen den Fits und der Einstellung zu den Kooperationsprodukten besteht bzw. bei einem Konstrukt ein schwacher negativer Zusammenhang zu sehen ist. Wie kann ich meine Daten weiter analysieren, um evtl. Ursachen dafür zu finden?
Über ein Feedback würde ich mich sehr freuen. Vielen Dank schon einmal im Voraus.
Viele Grüße
Inga
Hallo Inga,
für spezielle Fragen – nicht den Blogbeitrag betreffend – kannst du meine Facebookgruppe Statistikfragen nutzen: https://www.facebook.com/groups/785900308158525/
Schöne Grüße
Daniela
Liebe Frau Keller,
auch ich bräuchte einmal Ihr Feedback bzgl. folgender Frage: Ich habe mir in SPSS von 9 verschiedenen Variablen Mittelwerte ausgeben lassen. Nun möchte von diese neun Mittelwerten nochmal den Gesamtmittelwert (aus allen neun Mittelwerten) berechnen. Die zuvor berechneten Mittelwerte stehen in SPSS aber nur um Output und sind mir nicht als Variablen verfügbar. Kann ich in SPSS den „Overall“-Mittelwert berechnen oder muss ich die zuvor neun berechneten Mittelwerte in Excel übertragen um dort weiter rechnen zu können?
Vielen Dank für Ihre Antwort und freundliche Grüße
Nadine
Hallo Nadine,
ich denke, hier musst Du mit Excel weiter arbeiten.
Schöne Grüße
Daniela
Hallo, ich habe genau die selbe Frage. Allerdings kann ich die Mittelwerte in Excel, zum Bespiel mit einem gepaarten T-Test nicht mehr vergleichen. Wie kann ich vorgehen, wenn ich Mittelwerte einer Summenscore (= eine Variable) vergleichen kann?
LG
Carina
Hallo Carina,
was genau ist Deine Frage: willst Du in Excel rechnen? Hast Du nur die Mittelwerte…?
Schöne Grüße
Daniela
Sehr geehrte Frau Keller,
im Rahmen meiner Abschlussarbeit habe ich anhand eines Fragenbogens mittels dreier Fragen (5-stufige Likert Skala) Affinität abgefragt. Ich habe daraus eine neue Variable erstellt und diese anhand n.affin<X<affin gruppiert. Nun fehlen mir aber Wertelabels für diese beiden Gruppen um einen t-Test durchzuführen. Ich bräuchte dringend Ihre Hilfe!
Vielen Dank im Voraus und freundliche Grüße
Colin Pfister
Hallo Colin,
als Wertelabels werden die Zahlen eingegeben, die als Codes in den Daten für die Gruppen verwendet werden.
Schöne Grüße
Daniela
Liebe Frau Keller,
Erstmal Kompliment zu der tollen Seite, ist wirklich sehr hilfreich!
Ich arbeite im Moment an einer Fragebogenauswertung und möchte gerade die Variablen berechnen. Leider erscheint in der Spalte der neuen Variable bei manchen Probanden nur ein Punkt, aber kein Mittelwert. Bei den Werten ist keine Auffälligkeit, alles 1-5 (Likert), Missing Values sind ausgeschlossen. Was kann da los sein?
Vielen Dank im Voraus!
Stefan
…schon erledigt, vielen Dank! 🙂
Hallo Frau Keller,
im Rahmen meiner Bachelorarbeit im Bereich Personal, habe ich folgende Frage.
Ich habe eine Umfrage über neue Technologien am Arbeitsplatz durchgeführt und möchte sie geren mit SPSS auswerten. Jetzt stehe ich vor einem Problem und hoffe, dass sie mir weiter helfen können.
Es handelt sich dabei um folgende Frage: „Bitte geben Sie an, zu welcher Altersgruppe Sie sich zugehörig fühlen: den Zwanzigern, Dreißigern, Vierzigern, Fünfzigern, Sechszigern, Siebzigern oder den Achtzigern.“ (Likert Skala). Diese stehen horizontal. Vertikal gibt es vier Aussagen, zB.: „Die meiste Zeit fühle ich mich wie in meinen:“.
Im SPSS stehen diese Aussagen jetzt untereinander. Da sie alle die gleichen Antwortmöglichkeiten haben, möchte ich diese gerne in einer Tabelle zusammenfassen und nicht in vier einzelne Tabellen. Ich möchte nichts berechnen oder ähnlichen, sondern lediglich, dass sie in einer Tabelle stehen (damit es übersichtlicher aussieht).
Ich hoffe ich könnte ihnen das Problem etwas bildlich darstellen.
Vielen Dank schonmal im voraus und viele Grüße!
Lisa
Hallo Lisa,
ich weiß nicht, ob ich den Datenaufbau richtig verstanden habe, aber das hört sich so an, als bräuchtest Du eine Kreuztabelle…?
Schöne Grüße
Daniela
Hallo Frau Keller,
ich verzweifel gerade an einem recht „einfachen“ Problem. Ich habe in zwei Fragebögen genau die gleiche Frage gestellt. Ein vereinfachtes Beispiel:
Ich habe einen Fragebogen für Kinder und einen für Eltern. Beide sollen folgende Frage beantworten (nur eine Antwortmöglichkeit): „Was essen sie am liebsten: A) Reis B) Nudeln C) Burger. Jetzt habe ich zwei Variabeln und möchte ein Diagramm, in dem beide Gruppen vertreten sind. Wenn ich eine neue Variable bilde, kommen Fehlermeldungen bei der Diagrammbildung. Vermute es hängt mit der Auswahl rechts zusammen (Funktionsgruppe).
Liebe Grüße
Leon B.
Hallo Leon,
das kann ich so nicht beantworten, wenn ich nicht weiß, wie die Daten aufgebaut sind.
Schöne Grüße
Daniela
Liebe Frau Keller,
Ich sitze gerade auch an meiner Bachelorarbeit und bin Ihnen für diese tolle Website unglaublich dankbar.
Meine Frage ist folgende: Ich habe eine Skala zur Erfassung der Stimmung bei den Befragten. Sie ist eine 5-stufige Likertskala (1 = überhaupt nicht, 5 = äußerst). Die einzelnen Items sind 10 Adjektive, die negative Stimmungen ausdrücken (z.b. nervös, verärgert,…) und 10 Adjektive, die positive Stimmungen beschreiben (z.B. angeregt, ausgelassen,…). Wenn ich diese Items zusammenfassen möchte, um in späteren Test den Zusammenhang einer bestimmten Bildart (die ich im Fragebogen zeige) mit der Stimmung zu untersuchen, wie sollte ich da vorgehen? Fasse ich für die neue Variable (positive Stimmung) die 10 positiven Items über den Befehl „Mean()“ zusammen und wiederhole das für die negativen Items, sodass ich zwei Variablen erhalte. Oder macht es in ihren Augen mehr Sinn, die hälfte der Items zu recodieren und aus allen Mittelwerten einen Gesamtscore für die Stimmung zu bilden?
Vielen Dank schon mal,
Anna
Hallo Anna,
meist prüft man zunächst mittels Cronbachs Alpha, wie gut die Items zusammen passen, bevor man sie zusammen fasst. Wenn Cronbachs Alpha für alle gemeinsam passt, würde ich alle gemeinsam zusammen fassen (eben die eine Hälfte umkodiert).
Weitere Fragen könnt Ihr gern in meiner Facebook-Gruppe Statistikfragen https://www.facebook.com/groups/785900308158525/ diskutieren.
Schöne Grüße
Daniela
Sehr geehrte Frau Keller,
im Rahmen meiner Masterarbeit habe ich über die Funktion „Select Cases“ habe ich meinen Datensatz (n = 313) in drei Probandengruppen (Gefühltes Übergewicht, Übergewicht und unbedenkliche Fälle) unterteilt. Meine Dozentin, meinte ich solle für die folgende Inferenzstatistik eine einfaktorielle Anova verwenden. Hierbei kann aber nur ein Faktor angegeben werden. Sie meinte dazu, dass ich alle drei Probandengruppen zu einem Faktor zusammenfügen muss und für die Anova die Post-Hoc-Tests wählen muss, da dieser mir die Ergebnisse wiederum nach den drei Untergruppen aufgeteilt ausgibt.
Ich habe mal probiert, wieder über select cases alle Fälle zu einem Faktor zusammenzufügen. Das funktioniert dann bei der Anova jedoch nicht, da sie mir sagt, es würden keine drei Gruppen vorliegen, und somit wird kein Posthoc Test erstellt?
Meine Frage: Wie kann ich die drei Gruppen im Datensatz zusammenfügen und diese dann in einem Faktor zusammenfügen, damit die Anova mit Posthoctest im Anschluss gelingt.
Grüße
Nils
Hallo Nils,
Du brauchst eine Gruppenvariable (eine Spalte im Datensatz), die Dir Deine drei Gruppen definiert, z.B. mit 1 kodiert für Übergewicht, 2 für kein Übergewicht usw.
Weitere Fragen könnt Ihr gern in meiner Facebook-Gruppe Statistikfragen https://www.facebook.com/groups/785900308158525/ diskutieren.
Schöne Grüße
Daniela
Hallo Frau Keller,
im Rahmen meiner BA verzweifel ich gerade echt an einem kleinen Problemchen:
Ich würde gerne aus den Variablen
Schulabschlüsse
1) Abgang von der Schule ohne Abschluss
2) Hauptschulabschluss
3) Realschulabschluss oder mittlere Reife
4) Fachhochschulreife (Fachoberschule usw.)
5) Abitur oder fachgebundene Hochschulreife
6) Gehen noch zur Schule
&
Ausbildungsabschlüsse
1) Beruflich-betriebliche Ausbildung (Lehre)
2) Meister-, Techniker-, Fachschule, abgeschlossen
3) Universitäts- oder Fachhochschulabschluss
4) Haben einen anderen beruflichen Abschluss
5) Noch in beruflicher Ausbildung (Auszubildende/r,…)
6) Student/in
7) Keinen beruflichen Ausbildungsabschluss
einzelne Items verwenden und zu einer neuen Variable „Bildungsabschlüsse“ zusammenstellen, um einen Gruppenvergleich vornehmen zu können.
Diese soll wie folgt gruppiert sein:
Bildungsabschlüsse
– Abgang von der Schule ohne Abschluss
– Allgemeine Schulabschlüsse (Hauptschulabschluss, Realschulabschluss oder mittlere Reife, Fachhochschulreife, Abitur oder fachgebundene Hochschulreife)
– Ausbildungsabschluss (Beruflich-betriebliche Ausbildung (Lehre), Meister-, Techniker-, Fachschule, abgeschlossen)
– Universitäts- oder Fachhochschulabschluss
Haben Sie da vlt eine Lösung für?
Viele Grüße,
Julia
Habe noch vergessen zu erwähnen, dass jeweils der höchste Bildungsabschluss von Interesse ist. Es müsste also soetwas rein wie: Wenn Ausbildungsabschluss angekreuzt wurde, dann wird der Schulabschluss für diese Person nicht gezählt.
In den Variablen zu Schulabschlüssen und Ausbildungsabschlüssen konnten die Personen jeweils nur eine Antwort ankreuzen (also nicht Haupt- und Realschulabschluss).
Hallo Julia,
das würde ich wohl mit umkodieren von den Variablen lösen, je nachdem, wie sie aktuell kodiert sind (als Zahlen, oder als Text), erstmal in Zahlen umkodieren, dann die eine Variable mit z.B. 10 multiplizieren. Dann liesen sich die beiden addieren (die eine originale und die andere multiplizierte) und man kann immernoch nachvollziehen, was die beiden Ziffern bedeuten. Dann könnte man diese neue zweistellige Variable umkodieren in die Bildungsabschlüsse, die gewünscht sind.
Schöne Grüße
Daniela
Hallo Frau Keller,
in meiner Bachelorarbeit geht es darum die Beurteilungen von VPs aus EG und KG zu vergleichen. Sie haben zu 64 Items auf einer 5-Stuffigen Skala (1 überhaupt kein Bild – 2 vage und trüb – 3 unklar aber erkennbar – 4 einigermaßen lebhaft – 5 sehr lebhaft) ihre Einschätzungen gegeben. Jetzt möchte ich wissen, ob die Gruppen sich unterscheiden , bzw. ob die Antworten in der EG tendentiell höhere Werte haben oder nicht. Da die Daten ordinalskaliert sind, habe ich den U-Test gerechnet und alle Daten dabei wurden einfach zusammengeworfen. Jetzt stellt sich die Frage, ob es nicht sinnvoller wäre die Daten erstmal nach VPs zu aggregieren, d.h. pro Versuchsperson einen Wert zu bilden und dann mit diesen neuen Werten weiter zu rechnen. ich bin mir allerdings nicht sicher zu welchem Wert genau wäre es besser die Daten zusammenzufassen? Median?(aber ist er denn informativ genug) Mittelwert? (aber ist das eine zulässige Operation für ordinalskalierte Daten?) Oder ist das Aggregieren hier völlig überflüssig?
Könnten Sie mir bitte weiterhelfen?
Beste Grüße,
Marina
Hallo Marina,
ja, wenn diese 64 Items das gleiche messen, dann will man sie meist zusammen fassen (meist als Mittelwert oder Summe), damit auch die Analyse später weniger umfangreich wird. Ob die 64 Items zusammen gefasst werden dürfen, lässt sich mit einer Faktorenanalyse und der Berechnung von Cronbachs Alpha untersuchen.
Weitere Fragen könnt Ihr gern in meiner Facebook-Gruppe Statistikfragen https://www.facebook.com/groups/785900308158525/ diskutieren.
Schöne Grüße
Daniela
Sehr geehrte Frau Keller,
für meine Bakkarbeit möchte ich wissen wie häufig 23 verschiedene Kommunikationsthemen in 2 Verschiedenen Zeiträumen vorkommen. Jedes Kommunikationsthema ist eine Dummyvariable. Eine Variable für die 2 Zeiträume wurde erfolgreich festgelegt. Habe Schwierigkeiten die 23 Kommunikationsthemen zu einer sinnvollen Variablen zusammenzufassen damit in der Auswertung eine Gesamtübersicht vorhanden ist in der man die Häufigkeit der Nennung des jeweiligen Themas im Untersuchungszeitraum ablesen kann. Hätten Sie da einen Tipp?
Hallo David,
dafür musst Du in SPSS über „Mehrfachantwortenset definieren“ gehen. Dafür gibt es zwei Möglichkeiten im Menü, einmal unter „Daten“, einmal unter „Häufigkeiten“.
Schöne Grüße
Daniela