Redundanz


Photo by Andrew Seaman on Unsplash

Bisher haben wir nur Datenbanken mit einer Tabelle betrachtet. Die Stärke von relationalen Datenbanksystem liegt darin, Informationen in verschiedenen Tabellen zu speichern. Darum geht es in diesem Kapitel.

Die folgende Datenbank enthält die Tabelle musik mit 102 Datensätzen.


Photo by Lucía Garó on Unsplash

Beschreibe, welche Informationen ein Datensatz der Tabelle enthält.

Beantworte mit Hilfe geeigneter SQL-Abfragen folgende Fragen:

  1. Welche Musiker (Vorname, Name) haben am Lied 'The tide is high' mitgewirkt?
  2. Welche Personen sind Mitglieder der Band 'Katzen'?
  3. Wie viele und welche Lieder befinden sich auf der CD 'Sounds Bad'?
  4. In welchem Jahr wurde Nadja Kuntze geboren?
                -- Aufgabe 1
                SELECT vorname, nachname FROM musik WHERE liedtitel='The tide is high';
                -- Aufgabe 2
                SELECT DISTINCT nachname, vorname FROM musik WHERE bandname='Katzen';
                -- Aufgabe 3
                SELECT DISTINCT LiedTitel FROM musik WHERE cdtitel='Sounds Bad';
                -- Aufgabe 4
                SELECT DISTINCT Geburtsjahr FROM musik WHERE Vorname='Nadja' AND Nachname='Kuntze';
                
Bei der Beantwortung der Fragen 2 bis 4 erhält man unter Umständen Duplikate der Ergebnisdatensätze. Mit dem Schlüsselwort DISTINCT lassen sich diese vermeiden.

Erkläre, welche Besonderheit bei der Beantwortung der Fragen 3 und 4 auftritt.

Offensichtlich wurde das Lied 'Baby don't you hurt me' bei einem Datensatz falsch geschrieben.
Bei Nadja Kuntze wurde beim Geburtsdatum in einem Datensatz zwei Ziffern vertauscht.

In der Tabelle musik sind sehr viele Informationen wie z. B. die Namen der Künstler mehrfach gespeichert. Diese wiederholte Speicherung nennt man Redundanz. In der Folge können Unstimmigkeiten Anomalitäten entstehen. Daraus ergeben sich nicht korrekte gespeicherte Information, sogenannte Inkonstenzen. Auch bei der Bearbeitung von Datensätzen führt Redundanz unter Umständen zu Problemen.

Beschreibe, welche Probleme sich bei folgenden Datensatzoperationen ergeben können:

Die wiederholte Speicherung von Informationen in einer Datenbank nennt man Redundanz. Redundante Daten können zu fehlerhaften und unstimmigen Daten (Inkonsistenzen) führen.

Datensatzoperationen, die Inkonsistenzen bewirken, heißen Anomalien, die man häufig folgendermaßen unterscheidet: