Blog Zugang zu Plattformdaten für Forschende

Zugang zu Plattformdaten für Forschende

Der Digital Services Act der EU gewährt mit Artikel 40 erstmals Zugang zu Daten von Onlineplattformen für Forschungszwecke. Für Wissenschaftlerinnen und Wissenschaftler, die systemische Risiken von sozialen Medien erforschen und dazu auf Plattformdaten angewiesen sind, ist dies eine wichtige Entwicklung. Nun kommt es auf die konkrete Ausgestaltung des Datenzugangs an.


Der Digital Services Act (DSA) erfasst alle digitalen Dienste, die Verbraucherinnen und Verbrauchern in der EU einen Zugang zu Dienstleistungen, Inhalten und Waren gestatten. Neben Internetzugangsdiensten sind dies Suchmaschinen, Onlinehandelsplattformen und Onlineplattformen wie soziale Netzwerke. Zentrale Ziele des DSA sind, den Austausch von illegalen Onlineinhalten zu verhindern und die Grundrechte der Bürgerinnen und Bürger im Internet umfassender zu schützen. Manipulative Algorithmen und die Verbreitung von Desinformationen sollen wirksam eingedämmt werden.

Daten, die von Onlineplattformen generiert werden, sind nicht nur wesentliche Grundlage für Forschungsprojekte, die sich mit Onlinenutzungsverhalten und Meinungstrends auseinandersetzen. Sie dienen auch der Erforschung der sogenannten systemischen Risiken von Onlineplattformen: Diese betreffen insbesondere den Einfluss von Social Media auf Gesellschaft und Demokratie und damit Problembereiche wie die Verbreitung von Hate Speech und Fake News, den Missbrauch von Meinungsmacht oder Wahlkampfmanipulation in sozialen Netzwerken.

Nachdem sich der Zugang zu Plattformdaten für Wissenschaftlerinnen und Wissenschaftler in der Vergangenheit ausgesprochen schwierig gestaltete, konzentrierte sich die einschlägige Forschung bislang vornehmlich auf Twitter. Zuletzt wurde die bisher für akademische Zwecke kostenfreie Twitter-Datenschnittstelle geschlossen. Kostenpflichtige Datenzugänge sind jedoch im Rahmen von Forschungsprojekten in aller Regel nicht finanzierbar.

Der Ende 2022 in Kraft getretene DSA verspricht, die Bedingungen für die Erforschung von Onlineplattformen zu verbessern: Artikel 40 des DSA räumt Forschenden den Zugang zu Daten der sehr großen Onlineplattformen und Suchmaschinen (VLOPs und VLOSEs) mit mehr als 45 Mio. aktiven Nutzerinnen und Nutzern ein. Für die sogenannten VLOPs und VLOEs gelten bereits jetzt strenge Auflagen hinsichtlich Transparenz in der Onlinewerbung, der Auswahl von Empfehlungssystemen und der Entfernung illegaler Inhalte.

Rechtliche Voraussetzungen für die Einführung des DSA 

Allerdings stellt Artikel 40 momentan nicht mehr als eine Absichtserklärung dar, die im Rahmen eines Delegierten Rechtsakts noch konkret ausformuliert werden muss. Bei Delegierten Rechtsakten ermächtigen das Europäische Parlament und der Rat die Kommission, nichtwesentliche Teile eines Rechtsakts – in diesem Fall des DSA – zu ergänzen.

Die konkrete Ausgestaltung des Datenzugangs liegt nun also bei der Generaldirektion für Kommunikationsnetze (DG Connect) der Europäischen Kommission, die die Delegierte Verordnung derzeit federführend vorbereitet. Im Wesentlichen geht es dabei um die Festlegung der Zwecke, für die die Plattformdaten verwendet werden dürfen und die Bedingungen, Verfahren und technischen Voraussetzungen, unter denen die Datenweitergabe erfolgen wird.

Interessierte und in entsprechende Forschungsprojekte eingebundene Wissenschaftlerinnen und Wissenschaftler haben sich in den vergangenen Wochen aktiv in den Prozess der Ausgestaltung des Delegierten Rechtsakts eingebracht, unter anderem im Rahmen einer EU-Konsultation: Den betroffenen Forschenden geht es zum einen darum, genau festzulegen, welche Arten von Daten zugänglich gemacht werden dürfen, beispielsweise Nutzerverbindungen, „gesehene“ Inhalte pro Nutzerin und Nutzer oder die bestehenden Verbindungen zwischen Nutzenden. Zum anderen geht es um praktikable Verfahren rund um die Zugangsanfragen beim sogenannten Koordinator für digitale Dienste, einer im DSA vorgesehenen zentralen Handlingstelle pro Mitgliedstaat, die auch für den Forschungsdatenzugang verantwortlich zeichnen und als Mittler zwischen den anfragenden Forschungseinrichtungen und den Plattformen auftreten wird. In Deutschland wird die Rolle des Koordinators für digitale Dienste aller Voraussicht nach der Bundesnetzagentur übertragen werden. Vorgeschlagen wird unter anderem eine nach Sensitivität und Zugangsmethode der angefragten Daten gestaffelte Vorgehensweise und die Möglichkeit, Datenzugänge nach einer bestimmten Vorlauffrist auch für Anfragen anderer Wissenschaftlerinnen mit ähnlichen Forschungszielen zu öffnen.

Bedenken hinsichtlich des Schutzes der Privatsphäre der Nutzerinnen und Nutzer müssen gegenüber dem wissenschaftlichen Interesse stets abgewogen werden. Um diese zu adressieren, sprechen sich die Wissenschaftlerinnen und Wissenschaftler für hohe Datenschutzstandards aus: Daten, die zu Forschungszwecken weitergegeben werden, müssen anonymisiert sein und dürfen keine persönlichen Informationen über die Nutzenden enthalten. Daher werden beispielsweise auch keine privaten Chatprotokolle zu den zugänglichen Daten gehören. Darüber hinaus muss sichergestellt werden, dass die Daten nur für Forschungszwecke verwendet und nicht für kommerzielle Zwecke missbraucht werden. Dies kann etwa im Rahmen von institutionellen Datenhandlingplänen realisiert werden.

Die an Plattformdaten interessierte Forschungscommunity plädiert insofern für eine praktikable und gleichzeitig wissenschaftsfreundliche Ausgestaltung des Datenzugangs unter Wahrung hoher Datenschutzstandards. Aktuelles Zeitziel für die Annahme der Delegierten Verordnung durch die EU-Kommission ist das erste Quartal 2024.

Die vom bidt veröffentlichten Blogbeiträge geben die Ansichten der Autorinnen und Autoren wieder; sie spiegeln nicht die Haltung des Instituts als Ganzes wider.