
Synthetische Testdaten begleiten die Testing Community schon seit Jahren. Die teilweise unterschiedliche Verwendung der Begrifflichkeit kann hierbei zu Verwirrung oder Missverständnissen führen. Da sich eine Begriffserläuterung meist empfiehlt, möchten wir hier unterstützen und die wichtigsten Erläuterungen rund um synthetische (Test)daten nachfolgend zusammenfassen.
Im Grundsatz handelt es sich bei synthetischen Daten (wie vom Namen abzuleiten) um künstliche Daten. Der Zweck kann sich im Detail unterscheiden, jedoch sollen diese Daten in den meisten Fällen einen gewissen Bezug zu realen Daten aufweisen. Synthetische Daten mimen somit reale Daten nach. Dies bezieht sich auf unterschiedliche Attribute von Daten wie: Struktur, Inhalt, Beziehung, Muster oder statistische Aspekte. Dabei wird sichergestellt, dass die Daten keinen Bezug zu schützenswerten oder sensitiven Daten zulassen.
Zusammenfassend sind die wichtigsten Nutzen von synthetischen Daten:
Wie bereits erläutert handelt es sich um künstlich hergestellte Daten mit einem gewissen Bezug zur Realität (in IT-Systemen sprechen wir hier in der Regel von den produktiven Daten). Insbesondere dieser Realitätsbezug kann unterschiedlich ausgeprägt sein, weshalb sich in der Definition die folgenden Ausprägungen herauskristallisiert haben:
Diese Daten haben keinen bis maximal einen zufälligen Bezug zur Realität. Die Daten werden in der Regel nicht aus produktiven Daten abgeleitet. So werden z.B. fiktive Personen erstellt, welche über Produkte verfügen, welche nicht im Angebot sind und in Wirklichkeit nicht existieren.
Diese Daten werden meist aus der Realität abgeleitet. Die Basis bilden hier reale Daten oder Datenmodelle. Personen werden synthetisch gemäss produktivem Muster erstellt, verfügen jedoch über reale Produkte des Unternehmens.
Die Ansätze werden kombiniert. So werden z.B. komplett fiktiven Personen Produkte einer Firma zugeordnet.
Es gibt unzählige Tools und Vorgehen, um Testdaten zu erstellen. Wir fassen die Vorgehensweisen in die folgenden Kategorien:
Oft trifft man die Ansätze auch in kombinierter Form an. Die Auswahl einer passenden Lösung hängt stark von den Anforderungen eines Vorhabens oder Unternehmens ab.
Die Fähigkeit, sichere synthetische Testdaten zu erstellen, erhöht nicht nur die Datensicherheit, sondern eröffnet zahlreiche weitere Potenziale. Die wichtigsten sind:
Die Infometis ist auf Testdatenmanagement, synthetische Daten und Softwaretesting spezialisiert. Wir unterstützen unsere Kunden von der übergeordneten Daten Governance bis zur Implementierung und Umsetzung geeigneter Testdaten-Lösungen.
Neben unserer methodischen Expertise führen wir eine laufende Marktbeurteilung der führenden Lösungsanbieter durch und ordnen deren Fähigkeiten typischen Kundenanforderungen zu.
Sie möchten unsere Expertise nutzen und technologische Innovationen umsetzen?


Haben Sie eine Frage oder suchen Sie weitere Informationen? Geben Sie Ihre Kontaktinformationen an und wir rufen Sie zurück.