Was sind synthetische Testdaten?

12.2.2026

Zwischen Begriff und Missverständnis

Synthetische Testdaten begleiten die Testing Community schon seit Jahren. Die teilweise unterschiedliche Verwendung der Begrifflichkeit kann hierbei zu Verwirrung oder Missverständnissen führen. Da sich eine Begriffserläuterung meist empfiehlt, möchten wir hier unterstützen und die wichtigsten Erläuterungen rund um synthetische (Test)daten nachfolgend zusammenfassen.

Was ist der Zweck von synthetischen Daten?

Im Grundsatz handelt es sich bei synthetischen Daten (wie vom Namen abzuleiten) um künstliche Daten. Der Zweck kann sich im Detail unterscheiden, jedoch sollen diese Daten in den meisten Fällen einen gewissen Bezug zu realen Daten aufweisen. Synthetische Daten mimen somit reale Daten nach. Dies bezieht sich auf unterschiedliche Attribute von Daten wie: Struktur, Inhalt, Beziehung, Muster oder statistische Aspekte. Dabei wird sichergestellt, dass die Daten keinen Bezug zu schützenswerten oder sensitiven Daten zulassen.

Zusammenfassend sind die wichtigsten Nutzen von synthetischen Daten:

  • Zweckmässigkeit
    Daten können für einen bestimmten Verwendungszweck zur Verfügung gestellt werden. Z.B. erhöht die Bereitstellung von adäquaten Testdaten die Testeffizienz. Oder KI-Systeme lassen sich mit zielgerichteten Daten für einen gewissen Verwendungszweck trainieren, unter Einhaltung regulatorischer Anforderungen.
  • Datensicherheit
    Sensitive Daten werden während der Bearbeitung geschützt. Dieser Schutz dient zur Einhaltung diverser gesetzlicher und regulatorischer Grundlagen, sowie vor Cyberkriminalität. Im Fokus stehen Personendaten, sowie sensitive Unternehmensdaten.
Was fordert der Datenschutz

Das Schweizer Datenschutzgesetz, sowie die Europäische Datenschutzverordnung (DSGVO) sind im Zusammenhang mit Testdaten eindeutig.

Personendaten dürfen nur im Zusammenhang mit der Erhebungszweck bearbeitet werden. Die Nutzung von Personendaten zu Testzwecken gehört hier nicht automatisch dazu. Betroffene Personen müssen der Nutzung ihrer Daten zu Testzwecken ausdrücklich zustimmen. Erhöhte Anforderungen gelten bei Gesundheitsdaten.

Personendaten zu Testzwecken fallen erst ab dem Zeitpunkt NICHT mehr unter die Datenschutzverordnungen, wenn eine De-Anonymisierung ausgeschlossen werden kann.

Welche Ausprägungen gibt es von synthetischen Daten?

Wie bereits erläutert handelt es sich um künstlich hergestellte Daten mit einem gewissen Bezug zur Realität (in IT-Systemen sprechen wir hier in der Regel von den produktiven Daten). Insbesondere dieser Realitätsbezug kann unterschiedlich ausgeprägt sein, weshalb sich in der Definition die folgenden Ausprägungen herauskristallisiert haben:

Vollsynthetische Daten

Diese Daten haben keinen bis maximal einen zufälligen Bezug zur Realität. Die Daten werden in der Regel nicht aus produktiven Daten abgeleitet. So werden z.B. fiktive Personen erstellt, welche über Produkte verfügen, welche nicht im Angebot sind und in Wirklichkeit nicht existieren.

Teilsynthetische Daten

Diese Daten werden meist aus der Realität abgeleitet. Die Basis bilden hier reale Daten oder Datenmodelle. Personen werden synthetisch gemäss produktivem Muster erstellt, verfügen jedoch über reale Produkte des Unternehmens.

Hybride Ansätze

Die Ansätze werden kombiniert. So werden z.B. komplett fiktiven Personen Produkte einer Firma zugeordnet.

Wie werden synthetische Daten erstellt?

Es gibt unzählige Tools und Vorgehen, um Testdaten zu erstellen. Wir fassen die Vorgehensweisen in die folgenden Kategorien:

  • Modellbasierte Ansätze
    • Automations-Framework
    • GenAI Modelle
    • Data Intelligence Plattformen
    • Data as Code
  • Maskierung und synthetische Datengenerierung

Oft trifft man die Ansätze auch in kombinierter Form an. Die Auswahl einer passenden Lösung hängt stark von den Anforderungen eines Vorhabens oder Unternehmens ab.

Vorteile und Potenziale

Die Fähigkeit, sichere synthetische Testdaten zu erstellen, erhöht nicht nur die Datensicherheit, sondern eröffnet zahlreiche weitere Potenziale. Die wichtigsten sind:

  • Passende Testdaten auf Bedarf erstellen und ggf. an Bedürfnisse angepasst werden
  • Erzeugung von Daten, welche in der Realität (noch) nicht existieren
  • Unbegrenzte und skalierbare Datengenerierung für unterschiedliche Systeme und Testzwecke
  • Daten können mit externen Partnern geteilt werden
  • Trainingsdaten für KI-Systeme oder externe SaaS-Lösungen

Wir unterstützen Sie gerne

Die Infometis ist auf Testdatenmanagement, synthetische Daten und Softwaretesting spezialisiert. Wir unterstützen unsere Kunden von der übergeordneten Daten Governance bis zur Implementierung und Umsetzung geeigneter Testdaten-Lösungen.

Neben unserer methodischen Expertise führen wir eine laufende Marktbeurteilung der führenden Lösungsanbieter durch und ordnen deren Fähigkeiten typischen Kundenanforderungen zu.

Trainings zu diesem Thema

Alle anzeigen
No items found.

Wir sind bereit für Ihren nächsten Schritt!

Sie möchten unsere Expertise nutzen und technologische Innovationen umsetzen?

Diese Webseite
verwendet Cookies

Cookies werden zur Benutzerführung und Webanalyse verwendet und helfen dabei, diese Webseite zu verbessern. Sie können hier unsere Cookie-Erklärung anzeigen oder hier Ihre Cookie-Einstellungen anpassen. Durch die weitere Nutzung dieser Webseite erklären Sie sich mit unserer Cookie-Richtlinie einverstanden.

Alle akzeptieren
Auswahl akzeptieren
Optimal. Funktionale Cookies zur Optimierung der Webseite, Social-Media-Cookies, Cookies für Werbezwecke und die Bereitstellung relevanter Angebote auf dieser Website und Websites Dritter sowie analytische Cookies zur Verfolgung von Website-Zugriffen.
Eingeschränkt. Mehrere funktionale Cookies für die ordnungsgemässe Anzeige der Website, z. B. um Ihre persönlichen Einstellungen zu speichern. Es werden keine personenbezogenen Daten gespeichert.
Zurück zur Übersicht

Sprechen Sie mit einem Experten

Haben Sie eine Frage oder suchen Sie weitere Informationen? Geben Sie Ihre Kontaktinformationen an und wir rufen Sie zurück.