Experimentelle Statistik
IT.NRW als das Statistische Landesamt präsentiert in dieser Rubrik neue digitale Daten und Methoden, die unter dem Begriff der experimentellen Statistik zusammengefasst werden.
Die Digitalisierung schreitet in großen Schritten voran und eröffnet uns, dem Statistischen Landesamt Nordrhein-Westfalen, neue Wege bei der Datenerhebung, Analyse und Veröffentlichung. Das Feld der experimentellen Statistik untersucht das Potenzial neuer Daten(quellen) und Methoden, die bislang nicht standardmäßig in der amtlichen Statistik genutzt werden. Diese können perspektivisch dazu beitragen, sowohl die Qualität als auch die Aktualität der Statistiken zu erhöhen und gleichzeitig die Auskunftgebenden bei der Erfüllung ihrer Berichtspflicht zu entlasten. Zudem erproben wir beispiels­weise den Einsatz neuer Methoden zur Auswertung und Veröffentlichung von kleinräumigen Daten unterhalb der Gemeindeebene.
Es wird zwischen der Gewinnung bzw. Nutzung neuer Daten(quellen) – den sogenannten experimentellen Daten – und der Erprobung alternativer bzw. neuer statistischer Methoden – den sogenannten experimentellen Methoden – unterschieden:
Experimentelle Daten stammen nicht aus den klassischen Erhebungswegen der amtlichen Statistik, sondern aus anderen Quellen wie z. B. Satelliten- oder Luftbildern, Web Scraping oder dem Bereich Big Data.
Experimentelle Methoden sind in der amtlichen Statistik bisher nicht verwendete statistische Verfahren, die alternative Auswertungsmöglichkeiten für vorhandene Statistiken bieten können. Hierzu zählen Verfahren des maschinellen Lernens oder künstlicher Intelligenz sowie Methoden, die unter Wahrung der Geheimhaltung die Veröffentlichung von kleinräumigen Daten ermöglichen.
Anhand von anschaulichen Projektbeschreibungen stellen wir Ihnen auf dieser Seite innovative Praxisbeispiele aus beiden Bereichen der experimentellen Statistik vor, an denen das Statistische Landesamt Nordrhein-Westfalen beteiligt ist. Die Ergebnisse der Projekte werden fortlaufend aktualisiert.

Kerndichteschätzung – Kurvendiagramm weiße Kreide auf schwarzem Hintergrund
Kerndichteschätzer zur Veröffentlichung von Karten mit georeferenzierten Daten der amtlichen Statistik
Die Methode der Kerndichteschätzung wird als alternatives Verfahren zur Geheimhaltung von georeferenzierten amtlich-statistischen Daten erprobt.

Deep-Solaris Solaranlage auf einem Hausdach
Deep Solaris – Detektion von Solarenergieanlagen mithilfe von Deep Learning
Eignen sich Deep Learning-Verfahren dazu, anhand von Fernerkundungsdaten Solarenergieanlagen zu identifizieren? Gibt es Algorithmen, die auch grenzübergreifend funktionieren?

Hotspot-Analyse - Nähmaschinen
Hotspot-Analyse zur Identifikation von räumlichen Konzentrationen
Auf Basis der georeferenzierten Daten des statistischen Unternehmensregisters NRWs werden hohe räumliche Konzentrationen von Beschäftigten der Textil- und Bekleidungsindustrie identifiziert.

Erreichbarkeit – Fahradfahrer mit Kindern
Analysepotenziale von Erreichbarkeitsanalysen mit georeferenzierten amtlichen Statistiken
Auf Basis eigens berechneter Erreichbarkeitszonen werden Entfernungen (Distanzen, Fahrzeiten) von Kindertagesstätten für Regionen mit verschiedenem Urbanisierungsgrad in NRW dargestellt.

Baustelle
Automatisiertes Erkennen von Baustellen anhand von Luftbildern und neuronalen Netzen
Mithilfe von künstlichen neuronalen Netzen sollen Baustellen anhand von Luftbildern identifiziert werden.

Modellhaus mit Münzstapel
Small Area-Methode zur Schätzung von durchschnittlichen Bestandsmieten auf Gemeindeebene
Die Small Area-Methode erlaubt auch bei geringen Stichprobenumfängen verlässliche Schätzungen auf kleinräumiger Ebene, indem zusätzlich externe Datenquellen verwendet werden.