
Du hast sicher schon von metrischen Variablen gehört und gelesen. Eine Variable gilt als metrisch, wenn sie auf einer gleichabständigen Skala gemessen wird.
Gleichabständige Skala bedeutet, dass überall auf dieser Skala die Schritte gleich bedeutend sind. Also so, wie auf einem Lineal. Fast alles, was wir messen, messen wir auf einer gleichabständigen Skala. Zum Beispiel
- Gewicht,
- Länge,
- Abstand,
- Dauer,
- Alter,
- Laborparameter wie pH-Wert
- usw.
Es gibt aber auch Fälle in denen nicht auf einer gleichabständigen Skala gemessene Parameter trotzdem in der statistischen Anwendung wie metrische Variablen verwendet werden. Das ist dann der Fall, wenn der Parameter ordinal skaliert ist und viele Ausprägungen annimmt. Häufig wird in der Praxis bei Zähldaten und Likert-Skalen so vorgegangen. Diese Daten sind streng genommen ordinal, werden aber meist wie metrische Variablen verwendet.
William D. Berry schreibt dazu (Understanding Regression Assumptions. Sage university Paper Series on Quantitative Applications in the Social Sciences, 07-092. Newbury Park, CA: Sage, 1993, S. 47):
Du willst mehr Durchblick im Statistik-Dschungel?
Under certain conditions, it may also be appropriate to treat a quantitative ordered discrete variable as if it were continuous […] In particular, when a quantitative ordered discrete variable takes on a wide range of values (as does the number of employees in an organization), it is probably reasonably to treat the variable as if it were continuous. In contrast, it is clearly inappropriate to treat any ordered discrete variable with a small number of values (say, five or fewer) as continuous. In between these extremes the choice is less obvious, but, as a general guideline, the greater the number of values assumed by a quantitative ordered discrete variable, the more reasonable an assumption of approximate continuousness […]
Wenn wir also eine ordinal skalierte Variable haben, die mehr als fünf Ausprägungen annimmt, so können wir sie wie eine metrische Variable in unserer Datenanalyse verwenden. Je mehr Ausprägungen es sind, umso eher können wir davon ausgehen, dass wir die Variable wie eine metrische Variable verwenden können. Wir sollten hier dann aber besonders auf die Voraussetzungen wie Normalverteilung achten, wenn wir Signifikanztests rechnen. Ist die Voraussetzung nicht erfüllt, so sollten wir hier direkt auf nicht-parametrische Verfahren zurückgreifen, die auch bei ordinal skalierten Daten passend sind. Und bei allen Analysen sollten wir im Hinterkopf behalten, dass es sich streng genommen um eine ordinale Variable handelt und unser Vorgehen natürlich immer transparent berichten.
Bildquelle: pixabay, fotoblend

Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.
Hallo Daniela,
damit du meine Frage verstehst, muss ich ein wenig ausholen: Im Rahmen meiner Masterarbeit habe ich einen Fragebogen entworfen.
Dieser Fragebogen besteht aus zwei Teilen. Der erste teil beinhaltet 50 Fragen zum Thema Schutzfaktoren in der schulischen Arbeit. Im zweiten Teil thematisieren 29 Fragen die Gesundheitskompetenz. Bezüglich der Formulierung Formulierung der Aufgaben, habe ich mich für die Formulierung von positiven Statements entschieden. Die Konstruktion der Antwortskala habe ich als diskrete Ratingskala mit abgestuften Skalenpunkten gestaltet. Zudem habe die einzelnen Skalenpunkte verbal benannt, um eine einheitlichere Vorstellung der Proband*innen bezüglich der Skalenpositionen zu gewährleisten. Die Skala ist bipolar angelegt, mit einem positiven Pol für starke Zustimmung und einem negativen Pol für starke Ablehnung. Die Skala ist wie folgt formuliert: trifft genau zu, trifft eher zu, trifft eher nicht zu, trifft überhaupt nicht zu. Dabei habe ich auf eine neutrale Mittelkategorie verzichtet. Für die Grundauswertung habe ich ein Schema definiert, mit dem die erfassten Daten einer Variablen gewichtet werden können. Jeder Antwortmöglichkeit auf der Skala ist eine bestimmte Punktzahl zugeordnet . Beispielsweise entspricht „trifft genau zu“ der Punktzahl 3, „trifft eher zu“ der Punktzahl 2, „trifft eher nicht zu“ der Punktzahl 1 und „trifft überhaupt nicht zu“ der Punktzahl 0. Demnach kann für den ersten Teil eine maximale Punktzahl von 150 Punkten und im zweiten Teil von 87 Punkten erreicht werden. Nun möchte ich im Anschluss an den Fragebogen und den daraus resultierten Daten eine Analyse durchführen mit der ich feststellen kann, inwieweit ein Zusammenhang zwischen der Präsenz schulischer Schutzfaktoren und einer stärker ausgeprägten Gesundheitskompetenz besteht. Ich habe an eine Korrelationsanalyse gedacht. Ich würde die 150 Punkte (schulische Schutzfaktoren) als 100% sehen und als das vollständige Vorhandensein der schulischen Schutzfaktoren definieren und diese auf der y-Achse auftragen. Dann würde ich die 87 Punkte (Gesundheitskompetenz) als 100% auf der X-Achse notieren. Im Anschluss daran würde ich die Werte der Teilnehmer*innen ausrechnen und eintragen, um anhand dessen einen (positiven) Zusammenhang darzustellen. Ist das grundsätzlich so möglich?
Hallo Andreas,
ja, so kannst du das machen. Dadurch, dass die beiden Skalen so viele Abstufungen haben (0 bis 87 bzw. 0 bis 150), nimmst du sie auf jeden Fall wie metrisch. Und dann kannst du das von dir besschriebene Streudiagramm erstellen und könntest auch eine Korrelation dazu berechnen.
LG Daniela
Ich schreibe meine MA zu COVID-19 und habe gruppen mit einer Ausprägung von keine Infektion, mittelstarke Infektion und schwere Infektion und soll innerhalb einer multiplen Regression sowie auch Moderationsanalyse diese als eine metrische Variable behandeln. Ist das statistisch gesehen korrket? Was gibt es da inhaltlich zu beachten?
Halo Lona,
mit nur 3 Stufen ist das deutlich zu wenig, um die Variable als metrisch zu verwenden. Ich würde sie als ordinal verwenden. Das heißt, wenn die Variable die abhängige Variable in deinem Modell sein soll, dann wird die ordinale Regression verwendet.
LG Daniela
Hallo,
ich schreibe zurzeit meine BA und habe folgendes Problem:
Ich habe den Fragebogen zur sozialen Erwünschtheit (SDS-CM) verwendet und bin mir nun ziemlich unsicher, ob es sich hierbei um eine Nominal- oder Ordinalskala handelt. Wäre es denn überhaupt möglich, eine Skala zu bilden und könnte ich dann im Nachhinein mit dem Skalenwert eine Korrelation berechnen? Müsste ich dann ein Skalensumme oder Skalenmittelwert bilden?
Hallo Derya,
ich kenne den Fragebogen nicht, deshalb kann ich dir nicht konkret sagen, ob das nominal oder ordinal ist. Aber überleg dir, ob die Kategorien inhaltlich sinnvoll sortiert sind (ordinal) oder nicht (nominal).
LG Daniela
Wie sieht es bei der Verwendung einer fünfstufigen Ordinal-Skala (sehr zufrieden bis sehr unzufrieden) für die Verwendung bei einer Clusteranalyse aus?
Ist die metrische Behandlung der Variablen hier machbar und/oder sinnvoll? Dadurch lassen sich bspw. dann ja weitere Proximitätsmaße verwenden.
Vielen Dank.
Hallo Daniel,
ich persönlich würde die 5-stufige Skala hier wie metrisch verwenden. Aber das ist sicher ein Fall, über den man diskutieren kann.
LG Daniela
Hallo Daniela,
heißt das, auch wenn ich ein einziges Item (6 Antwortmöglichkeiten -> „trifft überhaupt nicht zu“ bis „trifft voll zu“) habe, kann ich dieses Item/diese Variable metrisch behandeln?
Bei Likertskalen ist mir das ja klar, aber diese bestehen ja in der Regel aus mehreren Items…
Liebe Grüße
Stefan
Hallo Stefan,
ja, nach dem Zitat von Berry dürfen wir zumindest ab 6 Abstufungen das in Betracht ziehen. Er schreibt aber auch „je mehr Abstufungen, umso besser“. Mit 6 Abstufungen ist das also ein Grenzfall. Es kommt auch immer darauf an, was man weiter damit vor hat. Rein deskriptiv wie metrisch verwenden (Mittelwert berechnen usw.) ist bei 6 Abstufungen sicher unproblematisch. Bei Verwendung in deiner linearen Regression würde ich in dem Fall ganz gut auf die Voraussetzungen achten und die Diagramme zur Prüfung von z.B. Homoskedastizität und Normalverteilung sehr gut inspizieren.
LG Daniela
P.S.: Kennst Du schon die Statistik-Akademie? https://statistik-und-beratung.de/mitgliederbereich-lp/ Hier bekommst Du Antworten auf alle Deine Fragen zur Statistik und viel Material zum Statistik verstehen und anwenden von mir.