record linkage projects in Germany


ALWA SURVEY DATA

‘Working and Learning in a Changing World’, ALWA derived from its German name ‘Arbeiten und Lernen im Wandel’ for short, is a data set which was collected on behalf of the research department ‘Education and Employment over the Life Course’ (FB E1) of the Institute for Employment Research (IAB) in Nuremberg within the project ‘Qualifications, Competencies and Working Lives’. The ALWA-data contain information about more than 10.400 life histories and allows detailed longitudinal analysis in particular about schooling and training decisions, labour market re-entries and labour market behaviour as well as about processes of family formation and regional mobility.
ALWA is additionally available as a version in which the survey data are linked with administrative data: ALWA-ADIAB. This dataset makes it possible to analyze survey and administrative data for the ALWA respondents simultaneously. The linked administrative data set contains both variables with individual characteristics and characteristics of the establishments the respondents work at. The administrative data cover the entire time frame of data available at the FDZ. Thus, episodes which started or ended after the actual interview are included as well.
In addition to that, ALWA-ADIAB contains characteristics about the quality of the data linkage for each respondent, which permits methodological analyses.

Antoni, Manfred (2011): Linking survey data with administrative employment data: The case of the German ALWA survey

Antoni, Manfred; Jacobebbinghaus, Peter; Seth, Stefan (2011): ALWA-Befragungsdaten verknüpft mit administrativen Daten des IAB 1975 – 2009, FDZ-Datenreport 5/2011

Antoni, Manfred; Seth, Stefan (2011): ALWA-ADIAB - Linked individual Survey and Administrative Data for Substantive and Methodological Research. FDZ-Methodenreport 12/2011


REPORTING ON POVERTY AND WEALTH

A perspective study for impact-oriented evaluation as part of reporting on poverty and wealth. Contracting entity is the German Federal Ministry of Health. The implementation and reporting was done by Univation – institute for evaluation in Cologne.
Der Auftraggeber ist das Bundesministerium für Gesundheit und soziale Sicherung (BMGS).
Durchführung und Berichterstattung lag bei Univation – Institut für Evaluation in Köln.

Beywl, Wolfgang; Speer, Sandra; Kehr, Jochen (2003): Wirkungsorientierte Evaluation im Rahmen der Armuts- und Reichstumsberichterstattung, Bonn BMGS(Hrsg)


EDUCATION, TRAINING AND OCCUPATION

Project Education, Training, and Occupation: Life Courses of the 1964 and 1971 Birth Cohorts in West Germany by the Max-Planck-Institute for Human Development.

Beywl, Wolfgang; Speer, Sandra; Kehr, Jochen (2003): Wirkungsorientierte Evaluation im Rahmen der Armuts- und Reichstumsberichterstattung, Bonn BMGS(Hrsg)

Künster, Ralf; Reimer Maike (2004): Linking Job Episodes from Retrospective Surveys and Social Security Data: Specific Challenges, Feasibility and Quality Outcome, Arbeitspapier Nr. 8 des Projekts Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland, Berlin


HISTORICAL-DEMOGRAPHIC RESEARCH

Max-Planck-Institute for Demographic Research.

Gruber, Siegfried; Scholz, Rembrandt D.; Szoltysek, Mikolay (2011): Real and Synthetic Household Populations and Their Analysis. An Example of Early Historical Census Microdata (Rostock in 1819), Historical Methods, April-June 2011, Volume 4, Number 2, Taylor and Francis Group, LLC

Gruber, Siegfried; Scholz, Rembrandt D.; Szoltysek, Mikolay; Zuber-Goldstein, Barbara (2009): Social change and family change in a central European urban context: Rostock 1819-1867, MPIDR Working Paper WP 2009-039

Rekonstruktion der Bevölkerungsbewegung während der demografischen Transition im 19. Jahrhundert am Beispiel der Hansestadt Rostock - histdem.de


IFO AMADEUS

Linkage of Ifo Survey and Balance-Sheet Data.

Hönig, Anja (2009): The New EBDC Dataset: An Innovative Combination of Survey and Financial Statements Data, CESifo Forum 4/2009

Hönig, Anja; Mittelmeier, Heike; Neudecker, Andreas (2010): EBCD Business Expectations Panel & EBDC Business Investment Panel. Linkage of Ifo Survey and Balance-Sheet Data, Economics and Business Data Center, ifo Institut für Wirtschaftsforschung, München

Hönig, Anja; Mittelmeier, Heike; Neudecker, Andreas (2009): EBDC-Datensatz. Verknüpfung IFO Konjunkturtest Verarbeitendes Gewerbe. Amadeus. Hoppenstedt., Economics and Business Data Center, ifo Institut für Wirtschaftsforschung, München

Hönig, Anja (2010): Linkage of Ifo Survey and Balance-Sheet Data: The EBDC Business Expectations Panel & the EBDC Business Investment Panel, Schmollers Jahrbuch 130 2010), 635 – 642, Duncker und Humblot, Berlin


KOMBIFID

In Germany several different data producers offer access to business microdata for scientific purposes. Related to the KombiFiD project these are the Federal Statistical Office, the Statistical Offices of the German Länder, the Federal Employment Agency and the Deutsche Bundesbank. Mostly data access is arranged by the data producers own research data centers (RDC). But until now no institution combined these different single datasets beyond the borders of the data producers. This is what the KombiFiD project aims to do.
The KomibFiD project is set up as a feasibility study. It should evaluate the matching possibility and researches will get controlled access to the new KombiFiD dataset. Their research results should give new insight into various research topics. Beside this they can be used by single employers as an enhanced information background for their own entrepreneurial decision-making.
If the KombiFiD project found the data matching a feasible thing to do, then this would give reason to think about a permanent matching of the data.

Hethey, Tanja; Spengler, Anja (2009): Matching Process generated Business Data and Survey Data. The Case of KombiFiD in Germany, FDZ-Methodenreport, 01/2009

Lorek, Kerstin; Spengler, Anja (2010): Verknüpfung und Abgleiche von Unternehmensregisterdaten des Statistischen Bundesamtes mit Betriebsdaten des Instituts für Arbeitsmarkt- und Berufsforschung, FDZ-Methodenreport 01/2010, aktualisiert 13.08.2010

Gürke, Christopher; Gruhl, Anja; Hethey-Maier, Tanja (2011): Verknüpfung von Unternehmensdaten verschiedener Datenproduzenten. Das Projekt „Kombinierte Firmendaten für Deutschland“, Statistisches Bundesamt, Wirtschaft und Statistik, Februar 2011


PASS

Die Verknüpfung von Befragungs- mit Prozessdaten kann die Vorteile beider Datentypen vereinen und die Analysemöglichkeiten gegenüber der Verwendung der Einzeldatensätze vergrößern. Die exakte Verknüpfung von Informationen desselben Individuums kann jedoch nur mit der Zustimmung der befragten Person erfolgen. Zudem können nicht allen zustimmenden Personen tatsächlich Prozessdaten zugespielt werden. Da es nicht auszuschließen ist, dass bestimmte Merkmale des Befragten einen Einfluss auf das Zustimmungsverhalten haben und dass die Wahrscheinlichkeit einer tatsächlich zu realisierenden Verknüpfung ebenfalls von personenspezifischen Merkmalen abhängt, ist zu untersuchen, ob es zu einer selektiven Stichprobe und letztlich zu verzerrten Ergebnissen bei der Verwendung von verknüpften Daten kommt. In diesem Bericht wird die Selektivität bei der Verknüpfung des Panels „Arbeitsmarkt und Soziale Sicherung“ mit administrativen Daten der Bundesagentur für Arbeit (BA) untersucht. Die Ergebnisse zeigen eine geringe Selektivität der Stichprobe durch das Antwortverhalten auf die Frage nach der Bereitschaft zur Zuspielung der BA-Daten. Die Selektivität durch die tatsächlich zu realisierenden Verknüpfungen beschränkt sich vorrangig auf Personengruppen ohne gespeicherte Informationen in den BA-Daten. Um zu prüfen, ob die Forschungsergebnisse beeinflusst werden, wenn nur Personen die einer Verknüpfung zustimmen und anschließend auch tatsächlich verknüpft werden können in die Analyse eingehen, wird eine Regression mit dem logarithmieren Brutto-Stundenlohn als zu erklärende Variable durchgeführt. Dabei können keine signifikanten Unterschiede zwischen den Regressionskoeffizienten eines vollständigen und eines reduzierten Modells festgestellt werden, die für eine Verzerrung der Daten sprechen würden.

Beste, Jonas (2011): Selektivitätsprozesse bei der Verknüpfung von Befragungs- mit Prozessdaten . Record Linkage mit Daten des panels „Arbeitsmarkt und Soziale Sicherung“ und mit administrativen Daten der Bundesagentur für Arbeit, FDZ-Methodenreport 09/2011

Kreuter, Frauke; Müller, Gerrit; Trappmann, Mark (2010): Nonresponse and measurement error in employment research. Making use of administrative data, Public Opinion Quarterly, Vol. 74, No 5., 880 – 906

Kreuter, Frauke; Sakshaug, Joseph: Assessing the Magnitude of Administrative Non-Consent Biases in the German PASS Study

Bachteler, Tobias (2008): Dokumentation Record Linkage IEB-PASS. Tech. Rep., Institut für Soziologie, Universität Duisburg-Essen, unpublished.


SHARE

In der vergangenen Dekade hat die Debatte um die Bedeutung der Biologie – und hier insbesondere genetischer Einflussfaktoren – für sozialwissenschaftliche Fragestellungen wachsende Aufmerksamkeit erfahren (z.B. Freese et al. 2003; Udry 1995; Vogler & McClearn 2008). Im Zentrum dieser Debatte steht nicht allein der Zusammenhang zwischen Biomarkern und Mortalität bzw. Morbidität im höheren Lebensalter (z.B. Vaupel 1998; Weinstein et al. 2003), sondern es wird auch diskutiert, inwieweit sich etwa genetische Anlagen auf menschliches Verhalten auswirken (z.B. Booth et al. 2006; Guo et al. 2008; Kohler et al. 1999). Mit diesen neuen inhaltlichen Fragestellungen steht die sozialwissenschaftliche Umfrageforschung vor der Herausforderung, ihr traditionelles Fragenprogramm durch die Einbeziehung biometrischer Daten1 zu ergänzen (vgl. National Research Council, 2008, für einen aktuellen Überblick). Der wissenschaftliche Nutzen der Aufnahme solcher Informationen in sozialwissenschaftliche Umfragen ist vielfältig und kann im Rahmen dieses Beitrags nur exemplarisch belegt werden. Der wohl wesentlichste Vorteil, und zwar unabhängig von spezifischen Fragestellungen, besteht in der Möglichkeit zur Verknüpfung von biologischen Merkmalen mit sozio-demographischen und sozio-ökonomischen Charakteristika der Befragten aus repräsentativen (d.h. nicht-klinischen) Bevölkerungsstichproben zum Zwecke interdisziplinärer Forschung (z.B. Finch & Vaupel 2001; Lillard & Wagner 2006).

Hank, Karsten; Jürges, Hendrik; Schaan, Barbara (2009) : Die Erhebung biometrischer Daten im Survey of Health, Ageing and Retirement in Europe: Befunde und Perspektiven, RatSWD research notes, No. 31

Share-RV User Guide

Neue Perspektiven der Alternsforschung: Verknüpfung von SHARE mit administrativen Daten und Biomarker

The Survey of Health, Ageing and Retirement in Europe (SHARE): Record Linkage


POLITICAL CULTURE IN GERMANY 1830 – 1848

Lipp, Carola (1990): Symbolic Dimensions of Serial Sources. Hermeneutical Problems of Reconstructing Political Biographies Based on Computerized Record Linkage.


DEVELOPMENT OF EMPLOYMENT IN NEWLY FOUNDED HIGH-TECH FIRMS: ANALYSIS OF LINKED EMPLOYER-EMPLOYEE DATA

Newly founded firms play an important role for the renewal of the economic basis. They foster economic structural change and play a prominent role for facilitating innovations. But this does not hold for all new firms in equal measure. Most newly founded firms are only innovative on a small scale that often consists merely in filling a market niche that has not yet been exploited or that someone else has vacated. But beside these, there exists a rather small group of high-tech start-ups that are expected to have considerable influence in the economic performance of regions or even nations. These firms are supposed to develop and disseminate new technologies and create high quality jobs. But especially about the latter little is known so far, not least because of the lacking of appropriate data on jobs in newly founded businesses. This project tries to overcome this insufficiency by creating a linked employer-employee dataset on newly founded firms. Interviews conducted by the ZEW on new high-tech firms in Germany ("ZEW High-Tech Panel"). These interviews will be matched with individual data on employees from the IAB, thus providing a linked dataset which comprises data from a comprehensive start-up survey as well as personal data generated in labour administration and social security data. Because a common identifier is lacking, the matching is made via firm addresses (record linkage).
This project also is a pilot study in which it is tested, how successful this record linkage is. If the results are satisfying it is planned to move on to a much broader database, the “ZEW/KfW Panel on Newly Founded Firms”.

Gude, Hardy; Kohn, Karsten; Spengler, Hannes; Gottschalk, Sandra; Kanzen, Sarah; Licht, Georg; Müller, Kathrin; Niefert, Michaela (2008): KfW/ZEW-Gründungspanel für Deutschland: Beschäftigung, Finanzierung und Markteintrittsstrategien junger Unternehmen - Resultate der ersten Befragungswelle.


ZENSUS 2011

Kleber, Birgit; Maldonado, Andrea; Scheuregger, Daniel (2009): Aufbau des Anschriften- und Gebäuderegisters für den Zensus 2011, Statistisches Bundesamt, Wirtschaft und Statistik 07/2009

Maldonado, Andrea; Scheuregger, Daniel , Ziprik, Katja Setting up the Central Register of Addresses and Buildings of the German Census 2011

Münnich, Ralf; Gabler, Siegfried; Ganninger, Matthias, Burgard, Jan Pablo; Kolb, Jan-Philipp (2011): Das Stichprobendesign des resgistergestützten Zensus 2011, Methoden – Daten – Analysen, Jg 5, Heft 1, 37 - 61

Statistisches Bundesamt in Zusammenarbeit mit den Statistischen Ämtern der Länder 2011): Das registergestützte Verfahren beim Zensus 2011


ZENSUSTEST

Bierau, Dieter (2000): Testing a register-based Census, Federal Statistical Office, Germany (2001) Testuntersuchungen zur Vorbereitung eines registergestützten Zensus. Inhalt und Stand, Zeitschrift des bayerischen Landesamts für Statistik und Datenverarbeitung. Bayern in Zahlen, Januar 2001, Heft 1

Scharmer, Marco (2002): Haushaltstypisierung im Rahmen des registergestützten Zensustests, Statistische Analysen und Studien NRW 1/2002

Scharmer, Marco (2004): Die Haushaltsgenerierung im Zensutest 2001. Eine neue Methode der amtilichen Statistik, Statistische Analysen und Studien NRW, Band 4

Braun, Ralph (2004): Zensustest 2001. Ergebnisse der Testerhebungen und Ausblick auf ein zukünftiges Zensusmodell, Statistisches Monatsheft Baden- Württemberg 5/2004

Bihler, Wolf (2002): Das Stichprobenverfahren der Testerhebungen für einen registergestützten Zensus, Statistisches Bundesamt, Methodenberichte, Heft 2, 2002

Statistische Ämter des Bundes und der Länder (2004): Ergebnisse des Zensustest, Statistisches Bundesamt, Wirtschaft und Statistik 8/2004

Vorndran, Ingeborg (2004): Zensustest – Verfahren und Ergebnisse der Haushaltsgenerierung, Wirtschafts und Statistik 11/2004