Landesbetrieb IT.NRW
Statistik und IT-Dienstleistungen  

Small Area-Methoden zur Schätzung von durchschnittlichen Bestandsmieten auf Gemeindeebene

Methodenbeschreibung

Seitens verschiedener Nutzer­gruppen amtlicher statistischer Ergebnisse wird zunehmend ein Bedarf an verlässlichen Auswertungen auf möglichst kleinräumiger Ebene formuliert. Insbesondere bei Stichprobenerhebungen liegen auf kleinräumiger Ebene jedoch häufig zu wenige Daten vor, um hieraus Ergebnisse ableiten zu können, die den hohen qualitativen Ansprüchen der amtlichen Statistik genügen. Small Area-Methoden können eine Möglichkeit bieten, um trotz weniger Infor­mationen aus einer vorliegenden Stichprobe Ergebnisse auf klein­räumiger Ebene zu veröffentlichen.

Die grundlegende Funktions­weise der Small Area-Schätzung – genauer gesagt: des Fay-Herriot-Modells, einem speziellen Small Area-Verfahren – wird im Folgenden anhand unseres Anwendungs­beispiels zur Schätzung der durchschnittlichen Brutto­kaltmiete pro Quadratmeter Wohnfläche für alle Gemeinden in Nordrhein-Westfalen auf Basis des Mikro­zensus möglichst intuitiv, auch für Interessierte ohne spezielles statistisches Hinter­grund­wissen, erläutert. Anhand der Darstellungen in den aufklappbaren Elementen erhalten methodisch Interessierte zudem Einblicke in die statistisch-formale Methodik der Small Area-Schätzung.

Für welche Situationen kann eine Small Area-Schätzung nützlich sein?

Bei der Planung einer Stichprobenerhebung wird festgelegt, für welche regionalen Ebenen auf Basis der gewonnenen Stich­proben­informationen Ergebnisse hochgerechnet und veröffentlicht werden sollen. Anhand dieser Festlegung wird dann ein Stich­probe­numfang berechnet, der für alle für die Veröffentlichung vorgesehenen regionalen Ebenen eine hohe Ergebnis­qualität sicherstellt. Die Stichprobe des Mikro­zensus ist beispiels­weise so konzipiert, dass in jedem Berichtsjahr etwa ein Prozent der Haushalte befragt wird und daraus verlässliche Ergebnisse bis auf Kreis­ebene hochgerechnet werden können.

Small Area-Methoden können nützlich sein, wenn auf Basis einer Stichprobe Auswertungen auf einer tieferen regionalen Ebene erfolgen sollen als durch die Stichproben­konzeption ursprünglich vorgesehen ist. Bislang in der deutschen amt­lichen Statistik gängige Methoden stoßen hier an ihre Grenzen: Bricht man z. B. den Stichprobenumfang des Mikrozensus von der Kreisebene auf die Gemeinde­ebene herunter, so liegen für viele Gemeinden zu geringe Stichproben­umfänge vor, um daraus verlässliche Ergebnisse abzuleiten. Daher verzichtet die amtliche Statistik im Allgemeinen auf die Veröffentlichung von Gemeinde­ergebnissen auf Basis des Mikrozensus. Small Area-Methoden können Abhilfe für das Problem zu geringer Stichprobe­numfänge schaffen.

Auf welchem Grundprinzip basiert die Small Area-Schätzung?

Eine Small Area-Schätzung beruht auf dem sog. Borrowing Strength-Prinzip: Neben den vorhandenen (teilweise wenigen) Stichproben­informationen werden zusätzlich externe Informationen heran­gezogen, um die Qualität der Schätz­ergebnisse zu verbessern. Indem das Potenzial dieser zusätzlichen Informationen genutzt (wörtlich: deren „Kraft ausgeborgt“) wird, sollen die Schätz­unsicherheit, die aus den zu geringen Stichproben­umfängen resultiert, verringert und die Schätzergebnisse damit stabilisiert werden.

Wie läuft eine Small Area-Schätzung ab?

Im Folgenden werden die einzelnen Schritte der Schätz­methodik des von uns verwendeten Fay-Herriot-Modells erläutert und anhand unserer Anwendung auf die Schätzung durchschnitt­licher Brutto­mietpreise auf Gemeinde­ebene auf Basis der Mikrozensus-Stichprobe veranschaulicht. In den aufklappbaren Elementen finden sich detaillierte Infor­mationen zur statistisch-methodischen Vorgehens­weise. Unsere Small Area-Schätzung wird in drei auf­einander aufbauenden Schritten durchgeführt.

Schritt 1: Berechnung eines Schätzwerts aus den vorhandenen Stichprobendaten

Zunächst betrachten wir die Stichprobeninformationen, die für jede Gemeinde in der vorhandenen Stichprobe vorliegen. In unserer Anwendung zeigt sich hier für die 396 Gemeinden in Nordrhein-Westfalen ein sehr unterschiedliches Bild (vgl. Abbildung 1): Während große kreisfreie Städte wie Köln oder Düsseldorf sehr viele Stichprobeneinheiten aufweisen, liegen für viele eher kleinere Gemeinden nur sehr wenige Informationen aus der auf Kreisebene gezogenen Stichprobe des Mikrozensus vor. In bestimmten Gemeinden sind sogar überhaupt keine Haushalte in die Stichprobe gezogen worden.

Small Area Methode - Histogramm - Abbildung 1

Abbildung 1: Anzahl der Haushalte in der Stichprobe des Mikrozensus 2018 je Gemeinde

 

Unabhängig von der Stichprobengröße berechnen wir im ersten Schritt der Small Area-Schätzung einen Schätzwert für die durchschnitt­liche Brutto­kaltmiete pro Quadratmeter für jede Gemeinde auf Basis der vor­liegenden Informationen. Diese direkt aus der vorliegenden Stich­probe geschätzten Werte bezeichnen wir im Folgenden als unsere „Stichproben-Schätzwerte“. Für ausge­wählte Gemeinden sind diese in Tabelle 1 dargestellt.

Gemeinde/Krfr. Stadt Anzahl
Beobachtungen
Stichproben-Schätzwerte
(in EUR/m²)
Schätz-
unsicherheit
Ahaus 73 6,568 0,0536
Viersen 145 7,16 0,0378
Köln 3 144 10,022 0,0102
Düsseldorf 2 085 9,812 0,0147
Essen 1 869 7,558 0,0049
Gronau (Westf.) 77 6,435 0,1145
Winterberg 9 4,326 1,7872
Niederzier 18 7,995 1,398
Telgte 31 4,204 3,4185

Tabelle 1: Anzahl der Haushalte in der Stichprobe des Mikrozensus 2018, Stichproben-Schätzwerte und Schätzunsicherheit für den durchschnittlichen Bruttomietpreis pro Quadratmeter für ausgewählte Gemeinden

Für die amtliche Statistik ist die Messung der sog. Schätzunsicherheit ein entscheidendes Kriterium zur Beurteilung der Qualität der einzelnen Stichproben-Schätzwerte: Mit dem Mittleren Quadratischen Fehler* verwenden wir hierfür eine bekannte statistische Maßzahl.  Kleine Werte des Mittleren Quadratischen Fehlers deuten dabei auf eine hohe Qualität und somit auf verlässliche Schätzergebnisse hin.

Aufgrund der stark unterschiedlichen Stichproben­umfänge in den einzelnen Gemeinden weisen die gemeindes­pezifischen Schätz­werte jedoch wesentliche Qualitätsunterschiede auf (vgl. Tabelle 1, letzte Spalte). Während aufgrund der umfang­reichen Stich­proben lediglich geringe Stichprobenfehler für die Schätzwerte für die kreisfreien Städte zu beobachten sind, ist die Schätz­unsicherheit in den eher kleinen Gemeinden mit nur wenigen befragten Haus­halten so beträchtlich, dass eine amtliche Veröffent­lichung derartiger Schätzwerte in dieser Form nicht in Frage kommen würde. Trotzdem liefern diese Stich­proben-Schätzwerte relevante Informationen für die weitere Schätzung.

Für Gemeinden ohne Stichproben­informationen lässt sich kein Stichproben-Schätzwert berechnen. Wie sich für diese Gemeinden trotzdem ein valider Schätz­wert berechnen lässt, wird im letzten Abschnitt dargelegt.

* Der Mittlere Quadratische Fehler gibt an, wie stark die mit einem bestimmten Verfahren geschätzten Werte um den gesuchten (zu schätzenden) Wert streuen. Er berück­sichtigt sowohl die Verzerrung als auch die Varianz des für die Schätzung verwendeten Verfahrens.

Aus methodischer Sicht handelt es sich bei den in diesem Schritt berechneten Stichproben-Schätzwerten lediglich um gewichtete Mittelwerte. Hierfür wird der sog. Horvitz-Thompson-Schätzer verwendet:

Um für jede Gemeinde aus der jeweils vorliegenden Stichprobe den Stichproben-Schätzwert zu berechnen, werden neben den in der Stichprobe vorliegenden Datenpunkten , zudem die jeder Stichprobeneinheit zugehörigen Hochrechnungsfaktoren herangezogen. Der Schätzwert für die mittlere Bruttokaltmiete pro Quadratmeter ergibt sich dann durch:

Small Area Formel_1.png

Die so entstehenden Stichproben-Schätzwerte sind unverzerrt für die Schätzung des gemeindespezifischen Mittelwertes, können jedoch hohe Standardfehler bzw. einen hohen Mittleren Quadratischen Fehler aufweisen.

Schritt 2: Einbeziehung der externen Informationen

Die Grundidee der Small Area-Schätzung besteht darin, die Schätz­unsicherheit unserer Schätz­werte auf Gemeindeebene zu verringern, indem zusätzliche, externe Informationen für die Schätzung herangezogen werden. Für die Umsetzung dieser Grund­idee sind zwei Aspekte zu berücksichtigen: Die Auswahl der externen Merkmale sowie deren methodische Einbeziehung.

Bei der Auswahl von externen Informationen sollten zunächst Vorüber­legungen getroffen werden, welche verfügbaren externen Kennzahlen einen potenziellen Zusammen­hang zum zu schätzenden Merkmal aufweisen könnten. Außerdem ist zu beachten, dass alle in Frage kommenden Kennz­ahlen aggregiert auf der regionalen Ebene vorliegen müssen, für welche die Small Area-Schätzung vorgenommen werden soll.

In unserer Anwendung möchten wir den durchschnitt­lichen Brutto­miet­preis pro Quadrat­meter für alle Gemeinden in Nordrhein-Westfalen schätzen. Wir nehmen in unseren Pool von externen Informationen insgesamt 37 Merkmale auf, die möglicherweise einen statistischen Zusammen­hang zur Höhe des Miet­preises aufweisen und aggregiert auf Gemeindeebene verfügbar sind: z. B. verschiedene demografische und sozioökonomische Faktoren, Kennzahlen zur Bautätigkeit und zum Arbeitsmarkt sowie vergangene Wahlergebnisse.

Durch die Zusamme­nstellung des Pools der externen Kenn­zahlen treffen wir keine inhaltliche Vorfest­legung darüber, welche konkreten Kenn­zahlen zur Schätzung der Bruttomietpreise herangezogen werden. Die Auswahl der externen Kennzahlen, die wir für die Verbesserung der Schätzung verwenden werden, erfolgt anhand eines statistischen Selektionsverfahrens im Vorfeld der eigentlichen Schätzung. Dabei werden die Kennzahlen ausgewählt, die den stärksten messbaren Zusammenhang mit der Höhe der geschätzten durch­schnitt­lichen Bruttomiet­preise der Gemeinden aufweisen. Somit fließt nur ein Teil der im Pool befindlichen externen Kenn­zahlen final in die Schätzung des durchschnitt­lichen Brutto­miet­preises ein.

Aus dem von uns zusammengestellten Pool externer Informationen, die für die Schätzung der durchschnittlichen Bruttokaltmieten potenziell hilfreich sein können, hat ein statistisches Selektionsverfahren folgende Kennzahlen für die Small Area-Schätzung ausgewählt:

  • Siedlungsdichte
  • Durchschnittliche Höhe des monatlichen Anspruchs an Wohngeld
  • Durchschnittlich genutzte Wohnfläche
  • Natürlicher Bevölkerungssaldo
  • Anteil der sozialversicherungspflichtigen Beschäftigten im produzierenden Gewerbe
  • Anteil an obdachlosen Personen
  • Wahlanteil der FDP bei der Bundestagswahl 2017
  • Wahlanteil der AfD bei der Bundestagswahl 2017
  • Wahlanteil der Piraten bei der Bundestagswahl 2017

Statistische Selektionsverfahren vergleichen verschiedene Konstell­ationen bei der Zusammen­stellung von bestimmten externen Kenn­zahlen miteinander und entscheiden anhand eines festgelegten Kriteriums, welche Anzahl und Auswahl an externen Kennzahlen auf Basis der vorliegenden Daten eine „bestmögliche“ Schätzung des durchschnittlichen Mietpreises ermöglichen. In unserer Anwendung haben wir als Kriterium für den Vergleich der verschiedenen Merkmalskombinationen Akaikes Informationskriterium (kurz: AIC) verwendet.

Bitte beachten Sie: Die Auswahl der Kenn­zahlen sollte nicht inhaltlich interpretiert werden. Das Selektions­verfahren verfolgt hierbei einen rein pragmatischen Ansatz, indem diejenigen Kenn­zahlen ausgewählt werden, die einen besonders hohen Zusammen­hang zu den Stichproben-Schätz­werten aufweisen und somit ein möglichst hohes Potenzial zur deren Stabili­sierung bieten.

Der tatsächliche Einbezug der externen Informationen in die Schätzung der durchschnittlichen Bruttomietpreise pro Quadratmeter erfolgt über ein statistisches Modell. Dabei wird unterstellt, dass ein fixer Zusammen­hang zwischen dem durchschnittlichen Bruttomietpreis und den externen Variablen besteht, der nicht auf einzelne Gemeinden beschränkt, sondern gemeindeübergreifend gültig ist. Mit Hilfe eines sog. Regressions­modells wird dieser Zusammenhang geschätzt: Die in Schritt 1 berechneten Stichproben-Schätzwerte für die durchschnittlichen Bruttomietpreise je Gemeinde werden dabei stellvertretend für die tatsächliche Höhe des durchschnittlichen Bruttomietpreises herangezogen.

Als Ergebnis des zweiten Schritts unserer Small Area-Schätzung halten wir Folgendes fest: Wir haben neben unseren Stichproben-Schätzwerten aus Schritt 1 nun weitere Informationen gefunden, mit denen sich die Höhe des durchschnitt­lichen Brutto­miet­preises je Quadrat­meter in den einzelnen Gemeinden erklären lässt.

Die externen Merkmale, die für die Schätzung durch das Selektionsverfahren ausgewählt wurden und aggregiert auf Gemeindeebene vorliegen, werden im Folgenden  mit bezeichnet. Um den gemeindeübergreifend gültigen Zusammenhang zwischen den Stichproben-Schätzwerten für alle Gemeinden  aus Schritt 1 und externen Merkmalen zu berechnen, wird folgendes Regressionsmodell geschätzt: 

Als Resultat dieser Schätzung erhalten wir den Vektor der geschätzten Regressionskoeffizienten. Der Vektor enthält alle Informationen über den Zusammen­hang zwischen den Stichproben-Schätz­werten und den externen Merkmalen und quantifiziert damit unsere zusätzlichen Informationen, die wir zur Stabilisierung unserer Schätz­ungen verwenden wollen.

Auffällig ist die Existenz zweier Störgrößen, und , im Regressionsmodell. Hierbei stellt einen zufälligen Effekt mit Erwartungs­wert 0 dar, der die nicht durch die externen Kenn­zahlen erklärbare Variation der durchschnitt­lichen Miet­preise zwischen den einzelnen Gemeinden abbildet. Die Varianz dieses übergreifenden Zufallseffekts wird ebenfalls im Rahmen der Schätzung des Regressionsmodells geschätzt. Außerdem bezeichnet den zufälligen Schätz­fehler mit Erwartungs­wert 0 und gemeindespezifischer Varianz , der durch die Schätzung der gemeinde­spezifischen Mietpreise in Schritt 1 entsteht.

Schritt 3: Berechnung der Small Area-Schätzwerte für alle Gemeinden

Im letzten Schritt können wir nun die eigentliche Small Area-Schätzung durchführen und einen Schätzwert für die durchschnitt­liche Brutto­kalt­miete pro Quadratmeter für jede Gemeinde berechnen. Hierzu führen wir die Ergebnisse aus den beiden vorangegangenen Schritten zusammen und berechnen einen Small Area-Schätzer für jede Gemeinde als eine gewichtete Summe der gemeindespezifischen Stichproben-Schätzwerte (aus Schritt 1) und der aus den externen Kenn­zahlen errechneten Informationen (aus Schritt 2). Das folgende Schema veranschaulicht das Vorgehen bei der Berechnung:

    Stichproben-Schätzwert für Gemeinde   ⋅  Gewichtung des Stichproben-Schätzwerts
+ Gewonnene Informationen aus externen Kennzahlen  ⋅  Gewichtung der externen Informationen


= Small Area-Schätzer für Gemeinde

 

Die entscheidende Rolle bei der finalen Schätzung der Small Area-Ergebnisse spielen die Gewichtungen, mit denen die Stich­proben-Schätzwerte und die Informationen aus den externen Kennzahlen vor der Addition multi­pliziert werden. Für diese gilt Folgendes:

  • Beide Gewichtungen addieren sich in Summe zu Eins. Das bedeutet: Ist die Gewichtung der Stichproben-Schätzung hoch (z. B. 0,9), erhalten die Informationen aus den externen Kennzahlen eine geringe Gewichtung (im Beispiel: 0,1).
  • Es handelt sich um gemeindespezifische Gewichtungen, d. h. jede Gemeinde  weist ein individuelles Gewichtungspaar auf.
  • Die Gewichtungen werden nicht anwenderseitig festgelegt, sondern ergeben sich allein als Resultat aus der Durchführung der Schätzung in den Schritten 1 und 2.

Die Gewichtungen geben damit für jede Gemeinde an, welchen Einfluss die Informationen aus der vorliegenden Stichprobe und die Informationen aus den externen Kennzahlen jeweils auf den Schätzwert für den durchschnittlichen Mietpreis in einer Gemeinde nehmen.

Die konkreten Gewichtungswerte stellen Indi­katoren für den Grad der Verlässlichkeit unserer Stichproben-Schätzwerte dar und kommen wie folgt zustande: Weist die für eine Gemeinde vorhandene Stichprobe eine hohe Streuung bzw. eine hohe Unsicherheit auf, z. B. aufgrund nur weniger vorliegender Stichprobeneinheiten, so ist die Gewichtung der Stichproben-Schätzwerte für diese Gemeinde tendenziell gering – denn die Infor­mationen, die wir aus den Stichproben-Schätzwerten erhalten, sind in diesem Fall relativ wenig belastbar und sollten daher nur geringfügigen Einfluss auf die Berechnung unseres Small Area-Schätz­werts dieser Gemeinde nehmen. Gleichzeitig hätten die aus den externen Kennzahlen gewonnenen Informationen eine entsprechend hohe Gewichtung, sodass wir uns bei der Berechnung des Small Area-Schätzers in diesem Fall eher auf das Erklärungs­potenzial der externen Kennzahlen stützen. Liegen allerdings sehr viele bzw. sehr verlässliche Stichproben­informationen in einer Gemeinde vor, so erhält der ent­sprechende Stichproben-Schätzwert eine hohe Gewichtung. Die Informationen aus den externen Kennzahlen weisen dann folglich eine geringe Gewichtung auf: Weil bereits geeignete Infor­mationen aus der Stichprobe vorliegen, sind wir auf die zusätzlichen Infor­mationen in diesem Fall weniger stark angewiesen.

Die berechneten Gewichtungen in unserer Anwendung bestätigen diesen Zusammenhang (vgl. Abbildung 2): Die Gewichtungen der Stichproben-Schätzwerte weisen insbesondere in den Gemeinden mit großen Stichprobenumfängen einen Wert nahe 1 auf. In diesen Fällen benötigen wir somit nur wenig Unter­stützung durch die externen Kennzahlen bei der Berechnung eines verläss­lichen Schätz­werts. In kleinen Gemeinden mit tendenziell wenigen vorliegenden Stichproben­einheiten sind die Gewichtungen der Stichproben-Schätzwerte eher gering und die Gewichtung der Information aus den externen Kennzahlen folglich hoch.

Grafik 2 - Small Area Methoden

Abbildung 2: Verteilung der berechneten Gewichtungen der Stichproben-Schätzwerte für alle Gemeinden

Formal ergibt sich der Small Area-Schätzer für die durchschnittliche Bruttokaltmiete pro Quadratmeter in Gemeinde durch:

.

Dabei bezeichnen den Horvitz-Thompson-Schätzer für das Stichprobenmittel aus Schritt 1, den Vektor der externen Kennzahlen für Gemeinde sowie die geschätzten Regressionskoeffizienten aus Schritt 2. Insgesamt stellt der Ausdruck die aus den externen Kennzahlen gewonnenen Informationen dar, die zusätzlich für die gemeindespezifische Schätzung der durchschnittlichen Bruttokaltmiete verwendet werden.

Das gemeindespezifische Gewicht berechnet sich aus der im Rahmen von Schritt 1 geschätzten Varianz der Stichproben-Schätzwerte aus Gemeinde sowie der gemeindeübergreifenden Varianz des Regressionsmodells aus Schritt 2:

Small Area Formel_4

 

Sind alle drei Schritte durchgeführt, erhalten wir unsere gewünschten Small Area-Schätzungen für die durchschnittliche Bruttokaltmiete pro Quadratmeter für jede Gemeinde in Nordrhein-Westfalen.

Welche Möglichkeiten bestehen zur Evaluation der Schätzergebnisse?

Nachdem wir unsere Small Area-Schätzung durchgeführt haben, müssen wir das Schätzergebnis sorg­fältig evaluieren. Damit wollen wir sicherstellen, dass unsere Small Area-Schätzung einerseits erfolg­reich war und außerdem keine systematischen Verzerrungen aufweist. Diese Verzerrungen können potenziell dann entstehen, wenn bestimmte Annahmen, deren Gültig­keit für die Anwendung des hier verwendeten Small Area-Modells vorausgesetzt wurden, in der Realität nicht haltbar sind.

Zur Evaluation unserer Schätzergebnisse führen wir folgende Maßnahmen durch:

Zunächst wollen wir überprüfen, ob wir unser Hauptziel des Einsatzes der Small Area-Schätzung – die Stabilisierung unserer Schätzergebnisse durch die Nutzung externer Informationen – überhaupt erreicht haben. Dazu berechnen wir den Mittleren Quadratischen Fehler der Small Area-Schätzwerte und stellen diese den entsprechenden Mittleren Quadratischen Fehlern der Stichproben-Schätzwerte für ausgewählte Gemeinden gegenüber:

Gemeinde/Krfr. Stadt Anzahl Beobachtungen Vergleich der Schätzer (in EUR/m²) Schätzerunsicherheit
Stichprobe Small Area Direkt Small Area
Ahaus 73 6,568 6,568 0,0536 0,0438
Viersen 145 7,16 7,159 0,0378 0,0326
….
Köln 3 144 10,022 10,008 0,0102 0,0099
Düsseldorf 2 085 9,812 9,815 0,0147 0,0139
Essen 1 869 7,558 7,566 0,0049 0,0049
Gronau (Westf.) 77 6,435 6,548 0,1145 0,0774
Winterberg 9 4,326 6,047 1,7872 0,2169
Niederzier 18 7,995 5,557 1,398 0,2078
Telgte 31 4,204 6,773 3,4185 0,2295

Tabelle 2: Mittlere Quadratische Fehler für Stichproben-Schätzwerte und Small Area-Schätzwerte für ausgewählte Gemeinden

Die Ergebnisse in Tabelle 2 verdeutlichen, dass die Anreicherung der Stichprobeninformationen durch die externen Kenn­zahlen insbesondere in den Gemeinden zu einer deutlichen Verringerung der Schätzunsicherheit führt, die eher geringe Stichprobenumfänge aufweisen (und für die in Schritt 3 der Small Area-Schätzung eine tendenziell geringere Gewichtung der Stichproben-Schätzwerte berechnet wurde).

Für diese Gemeinden hat die Small Area-Schätzung somit zu einer deutlichen Verbesserung der Schätzung im Sinne einer höheren Schätzgenauigkeit geführt. In vielen kreisfreien Städten kann der Mittlere Quadratische Fehler jedoch nur noch geringfügig gesenkt werden: Hier lagen bereits so viele Stichprobeninformationen vor, dass die Infor­mationen aus den externen Kenn­zahlen nur zu einer unwesentlichen Verbesserung der Schätzung beitragen. In Abbildung 3 werden die Mittleren Quadratischen Fehler der Small Area- und der Stichproben-Schätzwerte für alle Gemeinden grafisch gegenüber­gestellt. Hieran zeigt sich, dass insbesondere bei einer sehr hohen Schätzunsicherheit des Stichproben-Schätzers die Small Area-Methodik in der Lage ist, diese Schätz­unsicherheit deutlich zu reduzieren.

Small Area Methode - Streudiagramm - Abbildung 3

Im zweiten Schritt wollen wir anhand einer einfachen Grafik beurteilen, ob die Small Area-Schätzungen eine systematische Verzerrung aufweisen. Dazu tragen wir die teilweise mit hohen Schätz­unsicher­heiten behafteten, jedoch unverzerrten Stichproben-Schätzwerte sowie die Ergebnisse der Small Area-Schätzung aller Gemeinden in ein Streudiagramm ein (vgl. Abbildung 4). Falls keine system­atische Verzerrung vorliegt, sollten die Datenpunkte der Gemeinden zufällig um die Winkel­halbierende streuen. Andernfalls sollte ein systematisches Muster der Streuung erkenn­bar sein. In Abbildung 4 ist jedoch allenfalls bei den Gemeinden mit eher niedrigem Miet­niveau eine kleine systematische Abweichung nach unten zu erkennen (d. h. der Small Area-Schätzer berechnet bei diesen Gemeinden tendenziell ein etwas niedrigeres Miet­niveau als die Stichproben­daten).

Small Area Methode - Streudiagramm - Abbildung 4

Abbildung 4: Streudiagramm der Small Area-Schätzwerte und der Stichproben-Schätzwerte

Neben den beiden dargestellten Methoden zur Evaluation der Schätz­ergebnisse können (und sollten) weitere Instru­mente der Modell­diagnostik angewendet werden (z. B. ein QQ-Plot zur Überprüfung der Modellannahmen). Im Ergebnis lässt sich fest­halten, dass die Small Area-Schätzung in unserer Anwendung grund­sätzlich zum gewünschten Resultat einer Stabi­lisierung der Schätz­ergebnisse führt. Insbesondere können für die Gemeinden, für welche sich allein mit den vorliegenden Stichprobeninformationen kein verlässliches Schätz­ergebnis ableiten lässt, mithilfe der Small Area-Methodik trotzdem valide Schätzung des Mietniveaus durchgeführt werden. Hierfür müssen gering­fügige Verzerrungen bei der Schätzung in Kauf genommen werden.

Welche Erweiterungen der Small Area-Schätzungen können durchgeführt werden?

  • Erweiterung der Small Area-Schätzung um eine räumliche Komponente: Großstädte weisen im Allgemeinen ein höheres Mietniveau als eher ländlich geprägte Gegenden auf. Insbesondere in Ballungsgebieten wird jedoch auch das Mietniveau umliegender Gemeinden durch die direkte Nähe und Stadt-Umland-Beziehungen (z. B. Pendlerverflechtungen oder Stadt-Umland-Wanderungen) zu einer Großstadt beeinflusst. Dieser Effekt lässt sich durch eine Erweiterung der Small Area-Methodik in die Schätzung der durchschnittlichen Brutto­kalt­miete einbeziehen. Dazu wird das Small Area-Schätzmodell in Schritt 2 um eine „Nachbarschaftsinformation“ für alle Gemeinden erweitert. Auch in unserer Veröffentlichung haben wir diese Erweiterung genutzt.
  • Berechnung von Schätzern für Gemeinden ohne Stich­proben­informationen: In Schritt 1 unserer Small Area-Schätzung wurden Stichproben-Schätzwerte berechnet, die die Basis für die weitere Small Area-Schätzung bilden. Aller­dings liegen für eine kleine Anzahl an Gemeinden überhaupt keine Stichprobeninformationen aus der Stichprobe des Mikrozensus vor. Für diese Gemeinden kann somit kein Stich­proben-Schätzwert berechnet werden. In einem solchen Fall können jedoch trotzdem Small Area-Schätzwerte berechnet werden, indem vollständig auf die Informationen aus den externen Kenn­zahlen zurückg­egriffen wird. In Schritt 3 der Small Area-Schätzung erhalten diese für die betreffenden Gemeinden somit die Gewichtung 1. In unserer Veröffent­lichung haben wir dieses Verfahren für insgesamt sechs Gemeinden genutzt.

Literaturhinweise

  • Articus, C.: „Small-Area-Verfahren zur Schätzung regionaler Mietpreise“, Wirtschaft und Statistik. Ausgabe 2/2014, Seite 113 ff.
  • Fay, R. E. und Herriot, R. A.: “Estimates of Income for Small Places: An Application of James-Stein Procedures to Census Data”, Journal of the American Statistical Association, Band 74/1979, Ausgabe 366, Seite 269 ff.  
  • Münnich, R., Burgard, J. P. und Vogt, M.: Small Area-Statistik: Methoden und Anwendungen, AStA Wirtschafts- und Sozialstatistisches Archiv. Jahrgang 6, Seite 149 ff.