Wie unterscheiden sich Vollerhebung und Stichprobe?

25.-27. Juni 2020

Erhebungungen gibt es schon sehr lange in der Geschichte der Menschheit. Bereits in der Bibel sind Zensen, also Volkszählungen erwähnt. Eine Vollerhebung ist ein Zensus, wenn auch nicht im Sinne einer Volkszählungen per se. Vielmehr werden heute komplexe Stichprobenverfahren genutzt, um mittels zufälliger Stichprobe die Grundgesamtheit adäquat abzubilden, wobei die Voraussetzung immer ist, dass berechenbare Wahrscheinlichkeiten gegeben sind.

Eine Vollerhebung ist also simplerweise die Erhebung aller verfügbaren Einheiten einer Menge von Objekten. Meist kann man diese Menge aber nicht vollständig abbilden. Daher greift man auf Teilmengen dieser Grundgesamtheit zurück, die möglichst in ihrer prozentualen Eigenschaftsverteilung der Gesamtmenge entspricht. Stichproben sind als möglichst maßstabsgetreue Modelle einer Gesamtmenge. Hat die Stichprobe die richtigen Eigenschaften, so kann man von ihr auf die Grundgesamtheit schließen. Also Aussagen vom kleinen auf das große Ganze mit einer angebbaren Wahrscheinlichkeit übertragen.

Welche Arten der Stichprobenziehung gibt es?

Es werden generell zwei Arten der Stichprobenziehungen unterschieden[12]:

Unter diese beiden Hauptkategorien vereinen sich verschiedene Arten der Stichprobenziehung. Zu den zufälligen Auswahlen gehören:

Bewusste Verfahren werden zudem in:

unterschieden.

Wie zieht man einfache Zufallsstichproben?

Bei der Ziehung von Stichproben, besteht im Grunde immer das Ziel der Grundgesamtheit bzw. Zielpopulation, über die eigentlich eine Aussage gemacht werden soll.

Im Prozess der Stichprobenziehung gibt es sehr spezifische und weitreichende Probleme, die schon dabei anfangen genau zu sagen, wer überhaupt zu der Grundgesamtheit gehört und wer nicht.

Hat man eine Zielpopulation mittels einer Auswahlliste definiert, kommt es zu weiteren Problemen. Sind alle auf der Liste, die darauf sein sollten? Sind Einheiten doppelt abgebildet? Sind überhaupt alle berechtigt auf der Liste zu sein?

Die Liste als Frame population (Auswahlgesamtheit) von der man zieht, entspricht folglich nicht 100 prozentig der Zielpopulation, sollte sie aber möglichst abdecken. Hat man aus der Liste einige Einheiten ausgewählt, die man dann untersuchen möchte, hat man die Untersuchungsgesamtheit (survey population).

Wer hätte es gedacht: es treten noch mehr Probleme auf! Habe ich Einheiten gezogen, die einer Untersuchung nicht zur Verfügung stehen, aus welchen Gründen auch immer? Waren doch einige Einheiten auf der Liste, die dort nicht sein sollten? Kann ich überhaupt alle Einheiten in Bezug auf jede meiner Fragen untersuchen?

Es ergibt sich, dass wir zwar eine Bruttostichprobe haben, aber nicht alle vollständig untersuchen konnten. Arbeiten können wir also inhaltlich nur mit der Nettostichprobe. Somit können wir durch Subtraktion die Ausschöpfung als Differenz von Brutto und Netto berechen oder etwas genauer die Ausschöpfungsquote als Relation der beiden angeben.

Probleme der Stichprobenziehung

Alle aufgetreten Probleme in diesen so einfach erscheinenden Prozess sind messtheoretischer Art und werden unter den Begriffen:

zusammengefasst. Dabei gibt es eine Vielzahl von Konzepten, die darunter subsummiert werden.

Um diesen Problemen methodisch begegnen zu können und sie zu lösen, haben Wissenschaftlerinnen und Wissenschaftler viele verschiedene Verfahren entwickelt, die alle ihre Vor- und Nachteile haben. Sie fußen dabei auf einer gemeinsamen Überlegung, dass Einheiten nicht ohne Grund aus Erhebungen rausfallen, sondern angebbare Wahrscheinlichkeiten besitzen, daher kann man durch Schätzverfahren solche Werte abbilden und durch Imputation und Gewichtung solchen Problemen entgegen wirken.

In Bezug auf Fragekonstruktionen und Antwortverhalten hat sich, insbesondere in der psychologischen Forschung, die Item Response Theorie oder probabilistische Testtheorie etabliert. Diese untersucht und modelliert Antwortverhalten von Befragten und versucht dieses auf Persönlichkeitseigenschaften dieser Befragten zurückzuführen, um Antwortverhalten vorhersagen zu können. Die wohl bekanntesten IRT Modelle sind Rasch-Skalen.

Fraglich bleibt: Wie sehen Stichprobenverfahren im Detail aus? Wie werden sie definiert und wie führt man sie durch? Welche Arten von Probleme werden unter den oben gennaten zusammengefasst? Wie funktionieren Gewichtung und Imputation? Wie konstruiert man gute Items?

Gemeinsam können wir diese Fragen und weitere gerne beantworten. Schreibe mir einfach eine Mail.