Small Area-Methoden zur Schätzung von durchschnittlichen Bestandsmieten auf Gemeindeebene

Methodenbeschreibung

Seitens verschiedener Nutzergruppen amtlicher statistischer Ergebnisse wird zunehmend ein Bedarf an verlässlichen Auswertungen auf möglichst kleinräumiger Ebene formuliert. Insbesondere bei Stichprobenerhebungen liegen auf kleinräumiger Ebene jedoch häufig zu wenige Daten vor, um hieraus Ergebnisse ableiten zu können, die den hohen qualitativen Ansprüchen der amtlichen Statistik genügen. Small Area-Methoden können eine Möglichkeit bieten, um trotz weniger Informationen aus einer vorliegenden Stichprobe Ergebnisse auf kleinräumiger Ebene zu veröffentlichen.

Die grundlegende Funktionsweise der Small Area-Schätzung – genauer gesagt: des Fay-Herriot-Modells, einem speziellen Small Area-Verfahren – wird im Folgenden anhand unseres Anwendungsbeispiels zur Schätzung der durchschnittlichen Bruttokaltmiete pro Quadratmeter Wohnfläche für alle Gemeinden in Nordrhein-Westfalen auf Basis des Mikrozensus möglichst intuitiv, auch für Interessierte ohne spezielles statistisches Hintergrundwissen, erläutert. Anhand der Darstellungen in den aufklappbaren Elementen erhalten methodisch Interessierte zudem Einblicke in die statistisch-formale Methodik der Small Area-Schätzung.

Bei der Planung einer Stichprobenerhebung wird festgelegt, für welche regionalen Ebenen auf Basis der gewonnenen Stichprobeninformationen Ergebnisse hochgerechnet und veröffentlicht werden sollen. Anhand dieser Festlegung wird dann ein Stichprobenumfang berechnet, der für alle für die Veröffentlichung vorgesehenen regionalen Ebenen eine hohe Ergebnisqualität sicherstellt. Die Stichprobe des Mikrozensus ist beispielsweise so konzipiert, dass in jedem Berichtsjahr etwa ein Prozent der Haushalte befragt wird und daraus verlässliche Ergebnisse bis auf Kreisebene hochgerechnet werden können.

Small Area-Methoden können nützlich sein, wenn auf Basis einer Stichprobe Auswertungen auf einer tieferen regionalen Ebene erfolgen sollen als durch die Stichprobenkonzeption ursprünglich vorgesehen ist. Bislang in der deutschen amtlichen Statistik gängige Methoden stoßen hier an ihre Grenzen: Bricht man z. B. den Stichprobenumfang des Mikrozensus von der Kreisebene auf die Gemeindeebene herunter, so liegen für viele Gemeinden zu geringe Stichprobenumfänge vor, um daraus verlässliche Ergebnisse abzuleiten. Daher verzichtet die amtliche Statistik im Allgemeinen auf die Veröffentlichung von Gemeindeergebnissen auf Basis des Mikrozensus. Small Area-Methoden können Abhilfe für das Problem zu geringer Stichprobenumfänge schaffen.

Eine Small Area-Schätzung beruht auf dem sog. Borrowing Strength-Prinzip: Neben den vorhandenen (teilweise wenigen) Stichprobeninformationen werden zusätzlich externe Informationen herangezogen, um die Qualität der Schätzergebnisse zu verbessern. Indem das Potenzial dieser zusätzlichen Informationen genutzt (wörtlich: deren „Kraft ausgeborgt“) wird, sollen die Schätzunsicherheit, die aus den zu geringen Stichprobenumfängen resultiert, verringert und die Schätzergebnisse damit stabilisiert werden.

Im Folgenden werden die einzelnen Schritte der Schätzmethodik des von uns verwendeten Fay-Herriot-Modells erläutert und anhand unserer Anwendung auf die Schätzung durchschnittlicher Bruttomietpreise auf Gemeindeebene auf Basis der Mikrozensus-Stichprobe veranschaulicht. In den aufklappbaren Elementen finden sich detaillierte Informationen zur statistisch-methodischen Vorgehensweise. Unsere Small Area-Schätzung wird in drei aufeinander aufbauenden Schritten durchgeführt.

Schritt 1: Berechnung eines Schätzwerts aus den vorhandenen Stichprobendaten

Zunächst betrachten wir die Stichprobeninformationen, die für jede Gemeinde in der vorhandenen Stichprobe vorliegen. In unserer Anwendung zeigt sich hier für die 396 Gemeinden in Nordrhein-Westfalen ein sehr unterschiedliches Bild (vgl. Abbildung 1): Während große kreisfreie Städte wie Köln oder Düsseldorf sehr viele Stichprobeneinheiten aufweisen, liegen für viele eher kleinere Gemeinden nur sehr wenige Informationen aus der auf Kreisebene gezogenen Stichprobe des Mikrozensus vor. In bestimmten Gemeinden sind sogar überhaupt keine Haushalte in die Stichprobe gezogen worden.

Small Area Methode - Histogramm - Abbildung 1

Abbildung 1: Anzahl der Haushalte in der Stichprobe des Mikrozensus 2018 je Gemeinde

Unabhängig von der Stichprobengröße berechnen wir im ersten Schritt der Small Area-Schätzung einen Schätzwert für die durchschnittliche Bruttokaltmiete pro Quadratmeter für jede Gemeinde auf Basis der vorliegenden Informationen. Diese direkt aus der vorliegenden Stichprobe geschätzten Werte bezeichnen wir im Folgenden als unsere „Stichproben-Schätzwerte“. Für ausgewählte Gemeinden sind diese in Tabelle 1 dargestellt.

Gemeinde/Krfr. Stadt	Anzahl Beobachtungen	Stichproben-Schätzwerte (in EUR/m²)	Schätz- unsicherheit
Ahaus	73	6,568	0,0536
Viersen	145	7,16	0,0378
…	…	…	…
Köln	3 144	10,022	0,0102
Düsseldorf	2 085	9,812	0,0147
Essen	1 869	7,558	0,0049
…	…	…	…
Gronau (Westf.)	77	6,435	0,1145
…	…	…	…
Winterberg	9	4,326	1,7872
Niederzier	18	7,995	1,398
Telgte	31	4,204	3,4185

Tabelle 1: Anzahl der Haushalte in der Stichprobe des Mikrozensus 2018, Stichproben-Schätzwerte und Schätzunsicherheit für den durchschnittlichen Bruttomietpreis pro Quadratmeter für ausgewählte Gemeinden

Für die amtliche Statistik ist die Messung der sog. Schätzunsicherheit ein entscheidendes Kriterium zur Beurteilung der Qualität der einzelnen Stichproben-Schätzwerte: Mit dem Mittleren Quadratischen Fehler* verwenden wir hierfür eine bekannte statistische Maßzahl. Kleine Werte des Mittleren Quadratischen Fehlers deuten dabei auf eine hohe Qualität und somit auf verlässliche Schätzergebnisse hin.

Aufgrund der stark unterschiedlichen Stichprobenumfänge in den einzelnen Gemeinden weisen die gemeindespezifischen Schätzwerte jedoch wesentliche Qualitätsunterschiede auf (vgl. Tabelle 1, letzte Spalte). Während aufgrund der umfangreichen Stichproben lediglich geringe Stichprobenfehler für die Schätzwerte für die kreisfreien Städte zu beobachten sind, ist die Schätzunsicherheit in den eher kleinen Gemeinden mit nur wenigen befragten Haushalten so beträchtlich, dass eine amtliche Veröffentlichung derartiger Schätzwerte in dieser Form nicht in Frage kommen würde. Trotzdem liefern diese Stichproben-Schätzwerte relevante Informationen für die weitere Schätzung.

Für Gemeinden ohne Stichprobeninformationen lässt sich kein Stichproben-Schätzwert berechnen. Wie sich für diese Gemeinden trotzdem ein valider Schätzwert berechnen lässt, wird im letzten Abschnitt dargelegt.

* Der Mittlere Quadratische Fehler gibt an, wie stark die mit einem bestimmten Verfahren geschätzten Werte um den gesuchten (zu schätzenden) Wert streuen. Er berücksichtigt sowohl die Verzerrung als auch die Varianz des für die Schätzung verwendeten Verfahrens.

Detaillierte methodische Erläuterung zu Schritt 1

Aus methodischer Sicht handelt es sich bei den in diesem Schritt berechneten Stichproben-Schätzwerten lediglich um gewichtete Mittelwerte. Hierfür wird der sog. Horvitz-Thompson-Schätzer verwendet:

Um für jede Gemeinde aus der jeweils vorliegenden Stichprobe den Stichproben-Schätzwert zu berechnen, werden neben den in der Stichprobe vorliegenden Datenpunkten , zudem die jeder Stichprobeneinheit zugehörigen Hochrechnungsfaktoren herangezogen. Der Schätzwert für die mittlere Bruttokaltmiete pro Quadratmeter ergibt sich dann durch:

Die so entstehenden Stichproben-Schätzwerte sind unverzerrt für die Schätzung des gemeindespezifischen Mittelwertes, können jedoch hohe Standardfehler bzw. einen hohen Mittleren Quadratischen Fehler aufweisen.

Schritt 2: Einbeziehung der externen Informationen

Die Grundidee der Small Area-Schätzung besteht darin, die Schätzunsicherheit unserer Schätzwerte auf Gemeindeebene zu verringern, indem zusätzliche, externe Informationen für die Schätzung herangezogen werden. Für die Umsetzung dieser Grundidee sind zwei Aspekte zu berücksichtigen: Die Auswahl der externen Merkmale sowie deren methodische Einbeziehung.

Bei der Auswahl von externen Informationen sollten zunächst Vorüberlegungen getroffen werden, welche verfügbaren externen Kennzahlen einen potenziellen Zusammenhang zum zu schätzenden Merkmal aufweisen könnten. Außerdem ist zu beachten, dass alle in Frage kommenden Kennzahlen aggregiert auf der regionalen Ebene vorliegen müssen, für welche die Small Area-Schätzung vorgenommen werden soll.

In unserer Anwendung möchten wir den durchschnittlichen Bruttomietpreis pro Quadratmeter für alle Gemeinden in Nordrhein-Westfalen schätzen. Wir nehmen in unseren Pool von externen Informationen insgesamt 37 Merkmale auf, die möglicherweise einen statistischen Zusammenhang zur Höhe des Mietpreises aufweisen und aggregiert auf Gemeindeebene verfügbar sind: z. B. verschiedene demografische und sozioökonomische Faktoren, Kennzahlen zur Bautätigkeit und zum Arbeitsmarkt sowie vergangene Wahlergebnisse.

Durch die Zusammenstellung des Pools der externen Kennzahlen treffen wir keine inhaltliche Vorfestlegung darüber, welche konkreten Kennzahlen zur Schätzung der Bruttomietpreise herangezogen werden. Die Auswahl der externen Kennzahlen, die wir für die Verbesserung der Schätzung verwenden werden, erfolgt anhand eines statistischen Selektionsverfahrens im Vorfeld der eigentlichen Schätzung. Dabei werden die Kennzahlen ausgewählt, die den stärksten messbaren Zusammenhang mit der Höhe der geschätzten durchschnittlichen Bruttomietpreise der Gemeinden aufweisen. Somit fließt nur ein Teil der im Pool befindlichen externen Kennzahlen final in die Schätzung des durchschnittlichen Bruttomietpreises ein.

Selektierte Merkmale aus dem Pool externer Kennzahlen für unsere Anwendung

Aus dem von uns zusammengestellten Pool externer Informationen, die für die Schätzung der durchschnittlichen Bruttokaltmieten potenziell hilfreich sein können, hat ein statistisches Selektionsverfahren folgende Kennzahlen für die Small Area-Schätzung ausgewählt:

Siedlungsdichte
Durchschnittliche Höhe des monatlichen Anspruchs an Wohngeld
Durchschnittlich genutzte Wohnfläche
Natürlicher Bevölkerungssaldo
Anteil der sozialversicherungspflichtigen Beschäftigten im produzierenden Gewerbe
Anteil an obdachlosen Personen
Wahlanteil der FDP bei der Bundestagswahl 2017
Wahlanteil der AfD bei der Bundestagswahl 2017
Wahlanteil der Piraten bei der Bundestagswahl 2017

Statistische Selektionsverfahren vergleichen verschiedene Konstellationen bei der Zusammenstellung von bestimmten externen Kennzahlen miteinander und entscheiden anhand eines festgelegten Kriteriums, welche Anzahl und Auswahl an externen Kennzahlen auf Basis der vorliegenden Daten eine „bestmögliche“ Schätzung des durchschnittlichen Mietpreises ermöglichen. In unserer Anwendung haben wir als Kriterium für den Vergleich der verschiedenen Merkmalskombinationen Akaikes Informationskriterium (kurz: AIC) verwendet.

Bitte beachten Sie: Die Auswahl der Kennzahlen sollte nicht inhaltlich interpretiert werden. Das Selektionsverfahren verfolgt hierbei einen rein pragmatischen Ansatz, indem diejenigen Kennzahlen ausgewählt werden, die einen besonders hohen Zusammenhang zu den Stichproben-Schätzwerten aufweisen und somit ein möglichst hohes Potenzial zur deren Stabilisierung bieten.

Der tatsächliche Einbezug der externen Informationen in die Schätzung der durchschnittlichen Bruttomietpreise pro Quadratmeter erfolgt über ein statistisches Modell. Dabei wird unterstellt, dass ein fixer Zusammenhang zwischen dem durchschnittlichen Bruttomietpreis und den externen Variablen besteht, der nicht auf einzelne Gemeinden beschränkt, sondern gemeindeübergreifend gültig ist. Mit Hilfe eines sog. Regressionsmodells wird dieser Zusammenhang geschätzt: Die in Schritt 1 berechneten Stichproben-Schätzwerte für die durchschnittlichen Bruttomietpreise je Gemeinde werden dabei stellvertretend für die tatsächliche Höhe des durchschnittlichen Bruttomietpreises herangezogen.

Als Ergebnis des zweiten Schritts unserer Small Area-Schätzung halten wir Folgendes fest: Wir haben neben unseren Stichproben-Schätzwerten aus Schritt 1 nun weitere Informationen gefunden, mit denen sich die Höhe des durchschnittlichen Bruttomietpreises je Quadratmeter in den einzelnen Gemeinden erklären lässt.

Detaillierte methodische Erläuterung zu Schritt 2

Die externen Merkmale, die für die Schätzung durch das Selektionsverfahren ausgewählt wurden und aggregiert auf Gemeindeebene vorliegen, werden im Folgenden mit bezeichnet. Um den gemeindeübergreifend gültigen Zusammenhang zwischen den Stichproben-Schätzwerten für alle Gemeinden aus Schritt 1 und externen Merkmalen zu berechnen, wird folgendes Regressionsmodell geschätzt:

Als Resultat dieser Schätzung erhalten wir den Vektor der geschätzten Regressionskoeffizienten. Der Vektor enthält alle Informationen über den Zusammenhang zwischen den Stichproben-Schätzwerten und den externen Merkmalen und quantifiziert damit unsere zusätzlichen Informationen, die wir zur Stabilisierung unserer Schätzungen verwenden wollen.

Auffällig ist die Existenz zweier Störgrößen, und , im Regressionsmodell. Hierbei stellt einen zufälligen Effekt mit Erwartungswert 0 dar, der die nicht durch die externen Kennzahlen erklärbare Variation der durchschnittlichen Mietpreise zwischen den einzelnen Gemeinden abbildet. Die Varianz dieses übergreifenden Zufallseffekts wird ebenfalls im Rahmen der Schätzung des Regressionsmodells geschätzt. Außerdem bezeichnet den zufälligen Schätzfehler mit Erwartungswert 0 und gemeindespezifischer Varianz , der durch die Schätzung der gemeindespezifischen Mietpreise in Schritt 1 entsteht.

Schritt 3: Berechnung der Small Area-Schätzwerte für alle Gemeinden

Im letzten Schritt können wir nun die eigentliche Small Area-Schätzung durchführen und einen Schätzwert für die durchschnittliche Bruttokaltmiete pro Quadratmeter für jede Gemeinde berechnen. Hierzu führen wir die Ergebnisse aus den beiden vorangegangenen Schritten zusammen und berechnen einen Small Area-Schätzer für jede Gemeinde als eine gewichtete Summe der gemeindespezifischen Stichproben-Schätzwerte (aus Schritt 1) und der aus den externen Kennzahlen errechneten Informationen (aus Schritt 2). Das folgende Schema veranschaulicht das Vorgehen bei der Berechnung:

Stichproben-Schätzwert für Gemeinde ⋅ Gewichtung des Stichproben-Schätzwerts
+ Gewonnene Informationen aus externen Kennzahlen ⋅ Gewichtung der externen Informationen

= Small Area-Schätzer für Gemeinde

Die entscheidende Rolle bei der finalen Schätzung der Small Area-Ergebnisse spielen die Gewichtungen, mit denen die Stichproben-Schätzwerte und die Informationen aus den externen Kennzahlen vor der Addition multipliziert werden. Für diese gilt Folgendes:

Beide Gewichtungen addieren sich in Summe zu Eins. Das bedeutet: Ist die Gewichtung der Stichproben-Schätzung hoch (z. B. 0,9), erhalten die Informationen aus den externen Kennzahlen eine geringe Gewichtung (im Beispiel: 0,1).
Es handelt sich um gemeindespezifische Gewichtungen, d. h. jede Gemeinde weist ein individuelles Gewichtungspaar auf.
Die Gewichtungen werden nicht anwenderseitig festgelegt, sondern ergeben sich allein als Resultat aus der Durchführung der Schätzung in den Schritten 1 und 2.

Die Gewichtungen geben damit für jede Gemeinde an, welchen Einfluss die Informationen aus der vorliegenden Stichprobe und die Informationen aus den externen Kennzahlen jeweils auf den Schätzwert für den durchschnittlichen Mietpreis in einer Gemeinde nehmen.

Die konkreten Gewichtungswerte stellen Indikatoren für den Grad der Verlässlichkeit unserer Stichproben-Schätzwerte dar und kommen wie folgt zustande: Weist die für eine Gemeinde vorhandene Stichprobe eine hohe Streuung bzw. eine hohe Unsicherheit auf, z. B. aufgrund nur weniger vorliegender Stichprobeneinheiten, so ist die Gewichtung der Stichproben-Schätzwerte für diese Gemeinde tendenziell gering – denn die Informationen, die wir aus den Stichproben-Schätzwerten erhalten, sind in diesem Fall relativ wenig belastbar und sollten daher nur geringfügigen Einfluss auf die Berechnung unseres Small Area-Schätzwerts dieser Gemeinde nehmen. Gleichzeitig hätten die aus den externen Kennzahlen gewonnenen Informationen eine entsprechend hohe Gewichtung, sodass wir uns bei der Berechnung des Small Area-Schätzers in diesem Fall eher auf das Erklärungspotenzial der externen Kennzahlen stützen. Liegen allerdings sehr viele bzw. sehr verlässliche Stichprobeninformationen in einer Gemeinde vor, so erhält der entsprechende Stichproben-Schätzwert eine hohe Gewichtung. Die Informationen aus den externen Kennzahlen weisen dann folglich eine geringe Gewichtung auf: Weil bereits geeignete Informationen aus der Stichprobe vorliegen, sind wir auf die zusätzlichen Informationen in diesem Fall weniger stark angewiesen.

Die berechneten Gewichtungen in unserer Anwendung bestätigen diesen Zusammenhang (vgl. Abbildung 2): Die Gewichtungen der Stichproben-Schätzwerte weisen insbesondere in den Gemeinden mit großen Stichprobenumfängen einen Wert nahe 1 auf. In diesen Fällen benötigen wir somit nur wenig Unterstützung durch die externen Kennzahlen bei der Berechnung eines verlässlichen Schätzwerts. In kleinen Gemeinden mit tendenziell wenigen vorliegenden Stichprobeneinheiten sind die Gewichtungen der Stichproben-Schätzwerte eher gering und die Gewichtung der Information aus den externen Kennzahlen folglich hoch.

Abbildung 2: Verteilung der berechneten Gewichtungen der Stichproben-Schätzwerte für alle Gemeinden

Detaillierte methodische Erläuterung zu Schritt 3

Formal ergibt sich der Small Area-Schätzer für die durchschnittliche Bruttokaltmiete pro Quadratmeter in Gemeinde durch:

Dabei bezeichnen den Horvitz-Thompson-Schätzer für das Stichprobenmittel aus Schritt 1, den Vektor der externen Kennzahlen für Gemeinde sowie die geschätzten Regressionskoeffizienten aus Schritt 2. Insgesamt stellt der Ausdruck die aus den externen Kennzahlen gewonnenen Informationen dar, die zusätzlich für die gemeindespezifische Schätzung der durchschnittlichen Bruttokaltmiete verwendet werden.

Das gemeindespezifische Gewicht berechnet sich aus der im Rahmen von Schritt 1 geschätzten Varianz der Stichproben-Schätzwerte aus Gemeinde sowie der gemeindeübergreifenden Varianz des Regressionsmodells aus Schritt 2:

Sind alle drei Schritte durchgeführt, erhalten wir unsere gewünschten Small Area-Schätzungen für die durchschnittliche Bruttokaltmiete pro Quadratmeter für jede Gemeinde in Nordrhein-Westfalen.

Nachdem wir unsere Small Area-Schätzung durchgeführt haben, müssen wir das Schätzergebnis sorgfältig evaluieren. Damit wollen wir sicherstellen, dass unsere Small Area-Schätzung einerseits erfolgreich war und außerdem keine systematischen Verzerrungen aufweist. Diese Verzerrungen können potenziell dann entstehen, wenn bestimmte Annahmen, deren Gültigkeit für die Anwendung des hier verwendeten Small Area-Modells vorausgesetzt wurden, in der Realität nicht haltbar sind.

Zur Evaluation unserer Schätzergebnisse führen wir folgende Maßnahmen durch:

Zunächst wollen wir überprüfen, ob wir unser Hauptziel des Einsatzes der Small Area-Schätzung – die Stabilisierung unserer Schätzergebnisse durch die Nutzung externer Informationen – überhaupt erreicht haben. Dazu berechnen wir den Mittleren Quadratischen Fehler der Small Area-Schätzwerte und stellen diese den entsprechenden Mittleren Quadratischen Fehlern der Stichproben-Schätzwerte für ausgewählte Gemeinden gegenüber:

Gemeinde/Krfr. Stadt	Anzahl Beobachtungen	Vergleich der Schätzer (in EUR/m²)		Schätzerunsicherheit
Gemeinde/Krfr. Stadt	Anzahl Beobachtungen	Stichprobe	Small Area	Direkt	Small Area
Ahaus	73	6,568	6,568	0,0536	0,0438
Viersen	145	7,16	7,159	0,0378	0,0326
…	…	…	…	…	….
Köln	3 144	10,022	10,008	0,0102	0,0099
Düsseldorf	2 085	9,812	9,815	0,0147	0,0139
Essen	1 869	7,558	7,566	0,0049	0,0049
…	…	…	…	…	…
Gronau (Westf.)	77	6,435	6,548	0,1145	0,0774
…	…	…	…	…	…
Winterberg	9	4,326	6,047	1,7872	0,2169
Niederzier	18	7,995	5,557	1,398	0,2078
Telgte	31	4,204	6,773	3,4185	0,2295

Tabelle 2: Mittlere Quadratische Fehler für Stichproben-Schätzwerte und Small Area-Schätzwerte für ausgewählte Gemeinden

Die Ergebnisse in Tabelle 2 verdeutlichen, dass die Anreicherung der Stichprobeninformationen durch die externen Kennzahlen insbesondere in den Gemeinden zu einer deutlichen Verringerung der Schätzunsicherheit führt, die eher geringe Stichprobenumfänge aufweisen (und für die in Schritt 3 der Small Area-Schätzung eine tendenziell geringere Gewichtung der Stichproben-Schätzwerte berechnet wurde).

Für diese Gemeinden hat die Small Area-Schätzung somit zu einer deutlichen Verbesserung der Schätzung im Sinne einer höheren Schätzgenauigkeit geführt. In vielen kreisfreien Städten kann der Mittlere Quadratische Fehler jedoch nur noch geringfügig gesenkt werden: Hier lagen bereits so viele Stichprobeninformationen vor, dass die Informationen aus den externen Kennzahlen nur zu einer unwesentlichen Verbesserung der Schätzung beitragen. In Abbildung 3 werden die Mittleren Quadratischen Fehler der Small Area- und der Stichproben-Schätzwerte für alle Gemeinden grafisch gegenübergestellt. Hieran zeigt sich, dass insbesondere bei einer sehr hohen Schätzunsicherheit des Stichproben-Schätzers die Small Area-Methodik in der Lage ist, diese Schätzunsicherheit deutlich zu reduzieren.

Small Area Methode - Streudiagramm - Abbildung 3

Im zweiten Schritt wollen wir anhand einer einfachen Grafik beurteilen, ob die Small Area-Schätzungen eine systematische Verzerrung aufweisen. Dazu tragen wir die teilweise mit hohen Schätzunsicherheiten behafteten, jedoch unverzerrten Stichproben-Schätzwerte sowie die Ergebnisse der Small Area-Schätzung aller Gemeinden in ein Streudiagramm ein (vgl. Abbildung 4). Falls keine systematische Verzerrung vorliegt, sollten die Datenpunkte der Gemeinden zufällig um die Winkelhalbierende streuen. Andernfalls sollte ein systematisches Muster der Streuung erkennbar sein. In Abbildung 4 ist jedoch allenfalls bei den Gemeinden mit eher niedrigem Mietniveau eine kleine systematische Abweichung nach unten zu erkennen (d. h. der Small Area-Schätzer berechnet bei diesen Gemeinden tendenziell ein etwas niedrigeres Mietniveau als die Stichprobendaten).

Small Area Methode - Streudiagramm - Abbildung 4

Abbildung 4: Streudiagramm der Small Area-Schätzwerte und der Stichproben-Schätzwerte

Neben den beiden dargestellten Methoden zur Evaluation der Schätzergebnisse können (und sollten) weitere Instrumente der Modelldiagnostik angewendet werden (z. B. ein QQ-Plot zur Überprüfung der Modellannahmen). Im Ergebnis lässt sich festhalten, dass die Small Area-Schätzung in unserer Anwendung grundsätzlich zum gewünschten Resultat einer Stabilisierung der Schätzergebnisse führt. Insbesondere können für die Gemeinden, für welche sich allein mit den vorliegenden Stichprobeninformationen kein verlässliches Schätzergebnis ableiten lässt, mithilfe der Small Area-Methodik trotzdem valide Schätzung des Mietniveaus durchgeführt werden. Hierfür müssen geringfügige Verzerrungen bei der Schätzung in Kauf genommen werden.

Erweiterung der Small Area-Schätzung um eine räumliche Komponente: Großstädte weisen im Allgemeinen ein höheres Mietniveau als eher ländlich geprägte Gegenden auf. Insbesondere in Ballungsgebieten wird jedoch auch das Mietniveau umliegender Gemeinden durch die direkte Nähe und Stadt-Umland-Beziehungen (z. B. Pendlerverflechtungen oder Stadt-Umland-Wanderungen) zu einer Großstadt beeinflusst. Dieser Effekt lässt sich durch eine Erweiterung der Small Area-Methodik in die Schätzung der durchschnittlichen Bruttokaltmiete einbeziehen. Dazu wird das Small Area-Schätzmodell in Schritt 2 um eine „Nachbarschaftsinformation“ für alle Gemeinden erweitert. Auch in unserer Veröffentlichung haben wir diese Erweiterung genutzt.
Berechnung von Schätzern für Gemeinden ohne Stichprobeninformationen: In Schritt 1 unserer Small Area-Schätzung wurden Stichproben-Schätzwerte berechnet, die die Basis für die weitere Small Area-Schätzung bilden. Allerdings liegen für eine kleine Anzahl an Gemeinden überhaupt keine Stichprobeninformationen aus der Stichprobe des Mikrozensus vor. Für diese Gemeinden kann somit kein Stichproben-Schätzwert berechnet werden. In einem solchen Fall können jedoch trotzdem Small Area-Schätzwerte berechnet werden, indem vollständig auf die Informationen aus den externen Kennzahlen zurückgegriffen wird. In Schritt 3 der Small Area-Schätzung erhalten diese für die betreffenden Gemeinden somit die Gewichtung 1. In unserer Veröffentlichung haben wir dieses Verfahren für insgesamt sechs Gemeinden genutzt.

Articus, C.: „Small-Area-Verfahren zur Schätzung regionaler Mietpreise“, Wirtschaft und Statistik. Ausgabe 2/2014, Seite 113 ff.
Fay, R. E. und Herriot, R. A.: “Estimates of Income for Small Places: An Application of James-Stein Procedures to Census Data”, Journal of the American Statistical Association, Band 74/1979, Ausgabe 366, Seite 269 ff.
Münnich, R., Burgard, J. P. und Vogt, M.: Small Area-Statistik: Methoden und Anwendungen, AStA Wirtschafts- und Sozialstatistisches Archiv. Jahrgang 6, Seite 149 ff.

Small Area-Methoden zur Schätzung von durchschnittlichen Bestandsmieten auf Gemeindeebene

Für welche Situationen kann eine Small Area-Schätzung nützlich sein?

Auf welchem Grundprinzip basiert die Small Area-Schätzung?

Wie läuft eine Small Area-Schätzung ab?

Schritt 1: Berechnung eines Schätzwerts aus den vorhandenen Stichprobendaten

Schritt 2: Einbeziehung der externen Informationen

Schritt 3: Berechnung der Small Area-Schätzwerte für alle Gemeinden

Welche Möglichkeiten bestehen zur Evaluation der Schätzergebnisse?

Welche Erweiterungen der Small Area-Schätzungen können durchgeführt werden?

Literaturhinweise

Kontakt Small Area Estimation

Experimentelle Statistik

Daten zum Download