Datenanalyse für den guten Zweck

Data Science for Social Good Berlin unterstützt soziale Organisationen bei ihrer Arbeit mithilfe von "Data Science". Uns fällt dabei immer wieder auf, dass soziale Organisationen zwar Begriffe wie "Künstliche Intelligenz"(KI), "Big Data" und "Data Science" kennen und schon einzelne Beispiele gesehen haben. Es fehlt ihnen aber oft an Orientierung, für welche Arten von Problemen Data-Science-Methoden geeignet sind.

Darum haben wir die Vielzahl an Beispielen, die es bereits gibt, anhand der Problemarten kategorisiert. Im Folgenden sind einige wichtige Kategorien beschrieben und anhand von Beispielen illustriert.

Zielgruppen verstehen

Problem

Sie möchten verstehen, was die Zielgruppen ihrer Programme oder Kampagnen auszeichnet, um diese besser erreichen zu können.

Lösung

Mit Hilfe von Data-Science-Verfahren wie Segmentierung und A/B-Tests ist es möglich, statistisch aggregierte Erkenntnisse über die betroffenen Personengruppen zu gewinnen. Es lassen sich auch anhand relevanter Merkmale unterschiedliche Teilzielgruppen bilden. Das erlaubt eine gezieltere Ansprache und Abstimmung auf die Bedürfnisse unterschiedlicher Teile Ihrer Zielgruppe.

Beispiel

SchulePlus fördert über die Vermittlung von Schülerpraktika die berufliche Orientierung von Jugendlichen. Freiwillige Datenanalyst*innen haben die Ergebnisse des von SchulePlus angebotenen Stärkentests und Google-Suchen nach Praktika analysiert. In Kombination mit der Praktikadatenbank lässt sich daraus erkennen, in welchen Regionen und Berufsfeldern Angebot und Bedarf besser aufeinander abgestimmt werden können.

Automatisierung von manuellen Prozessen

Problem

Ihre Organisation verbringt viel Zeit mit der wiederkehrenden Verarbeitung von Daten, Informationen oder Dokumenten.

Lösung

Wiederkehrende daten- und dokumentenverarbeitende Arbeitsschritte lassen sich teilweise mit für diesen Zweck entwickelten Programmen automatisieren, oft auf Basis von maschinellem Lernen bzw. KI. Das spart Arbeitszeit und ermöglicht die Skalierung von Hilfsangeboten.

Beispiel

Die Deutsche Krebsgesellschaft erfasst und analysiert systematisch wissenschaftliche Artikel aus dem Bereich der Onkologie. Datenanalyst*innen haben ein Modell zur Textklassifizierung entwickelt, welches neu erschienene Artikel automatisch nach Krebsart und Fokus (beispielsweise Diagnose, Behandlung) kategorisieren kann. So konnte die Deutsche Krebsgesellschaft einen aufwendigen Schritt ihrer Recherchearbeiten teilautomatisieren.

Bedarfsanalyse/-vorhersage

Problem

Sie können den Bedarf oder Umfang ihrer Zielgruppe nicht direkt bestimmen.

Lösung

Datenanalyst*innen können aus alternativen Datenquellen Datensätze erstellen , die stark mit den Eigenschaften der Zielgruppe korrelieren. Statistische Modelle können vorhersagen, wie der Bedarf innerhalb einer Personengruppe/Region/etc. rechnerisch sein müsste.

Beispiel

GiveDirectly wollte Informationen über Armutsverhältnisse in Kenia haben. Es gab jedoch keine amtlichen Statistiken. Datenanalyst*innen haben geholfen ein System zu erstellen, das automatisch den Typ des Hausdaches auf Satellitenbildern erkennt, so dass die Armutsverhältnisse automatisch geschätzt werden konnten.

Wirkungsanalyse

Problem

Sie wollen herausfinden, ob Ihr Programm / Ihre Kampagne / etc. die gewünschte Wirkung erzielt.

Lösung

Datenanalyst*innen können statistische Analysen anhand vorhandener Datensätze durchführen, um die Wirkung zu analysieren und zu visualisieren. Sie können auch beraten, welche zusätzlichen Datensätze für die Analyse verwendet werden sollten, falls Daten über die Zielgrößen nicht verfügbar sind.

Beispiel

Jambo Bukoba e.V. engagiert sich für bessere Bildung, Gesundheit und Gleichberechtigung in Tansania. Durch eine Evaluation der Wirkung der Arbeit von Jambo Bukoba durch freiwillige Datenanalyst*innen konnte gezeigt werden, dass sich das sportliche Förderprogramm von Jambo Bukoba auch in verbesserten schulischen Leistungen an den teilnehmenden Schulen niederschlägt, insbesondere bei Mädchen. Die statistische Analyse kombinierte interne Daten über die durchgeführten Workshops und externe Daten zu schulischen Leistungen der Schüler*innen in Tansania.

Frühwarnsysteme

Problem

Sie wollen herausfinden, warum Leistungsempfänger oder Freiwillige ein Programm unerwartet verlassen.

Lösung

Data Science hilft Muster in dem Verhalten der Personen, die das Programm verlassen haben, zu erkennen. Das ermöglicht, auf die betroffenen Personen gezielter einzugehen um diesem Trend frühzeitig entgegen zu wirken.

Beispiel

DC Central Kitchen bietet u.a. Fortbildungen für sozial schwache Bürger an. Durch die Analyse ihrer Daten konnte aufgedeckt werden, dass Teilnehmer oft kurz vor Ende des Trainings aus dem Programm ausscheiden. Weitere Analysen zeigten, dass Teilnehmer mit bestimmten Eigenschaften mit höherer Wahrscheinlichkeit aufgeben. Darauf aufbauend konnte die Organisation gezielte Interventionen entwerfen und ausprobieren.

Fazit

"Data Science" bietet auch für zivilgesellschaftliche Organisationen viel Potenzial  -  das derzeit leider oft ungenutzt bleibt. Die hier gezeigten Anwendungsfälle bringen hoffentlich mehr Klarheit, wie Datenanalyse für das Gemeinwohl eingesetzt werden kann.

Seit 2015 unterstützen wir als Data Science for Social Good Berlin gemeinnützige Organisationen dabei, Daten wirksamer für ihre Arbeit zu nutzen. Dazu organisieren wir Veranstaltungen wie Datensprechstunden und Hackathons, die gemeinnützige Organisationen und Datenanalyst*innen auf pro-bono Basis zusammen bringen.

Sie gehören zu einer gemeinnützigen Organisation und sind neugierig geworden, wie Data Science Sie in ihrer Arbeit unterstützen kann? Setzen Sie sich gerne mit uns in Verbindung! contact@dssg-berlin.org