Lesen Sie die angegebenen Abschnitte aus [Kudraß 2015], Seiten 80 bis 92 durch und berücksichtigen die Kommentierungen.

3.4 Optimierung von Relationen

Es gibt noch weitere Formen der Optimierung in DBMS, z.B. die Optimierung von Anfragen zur besseren Performance (s. DBS2) und die Optimierung der physischen Ebene (s. 1., Physischer Entwurf)

3.4.1 Problemstellung

Allgemein wird mit NF2 als Kurzform von "Non First Normal Form" die Zulassung von mehrwertigen Attributen - multi-valued attribute type - bezeichnet. Als Vorstufe der Objektorientierung werden die Aufnahme von mehrwertigen und zusammengesetzten Datentypen - composite attribute type - als statische Objektorientierung bezeichnet. Vgl. [Lemahieu 2018, S. 42, 43]

Redundanzen sind nicht allein dadurch zu erkennen, dass derselbe Datenwert mehrfach in Tupeln vorhanden ist. Bei 1:N- und N:M-Beziehungen muss das sogar so sein.

3.4.2 Anomalien bei DML-Operationen auf Relationen

Wir sprechen auch von Einfüge-, Änderungs- und Lösch-Anomalie. Die Folge von Anomalien können Inkonsistenzen - Widersprüche unter den Datensätzen der Datenbank - sein.

In Bild 3.7 haben wir das aufgrund der Verwendung von Strings das nur schwer zu erkennende, aber tatsächlich so verwendete mehrwertige Attribut "Lieferant". Die Relation "Artikellieferung" ist unnormalisiert, da sie mit dieser Eigenschaft gegen die 1NF verstößt.

3.4.3 Abhängigkeiten

Gleichbedeutend sind folgende Aussagen:

  • Die Attribute Y und Z sind funktional abhängig vom Attribut X.
  • Attribut X bestimmt die Attribute Y und Z.
  • Attribut X ist Determinante der Attribute Y, Z.
  • XY, Z.

Mehrwertige Abhängigkeiten werden bei 4NF und 5NF berücksichtigt.

3.4.4 Verbundtreue und Abhängigkeitstreue

Zur Einhaltung der Verlustlosigkeit werden SFS-Beziehungen realisiert, so dass der Schlüssel der aufgeteilten Relation weiterhin mit den zugehörigen Fremdschlüssel in Beziehung gebracht werden kann und keine „neuen“ Tupel entstehen können. Wenn die Funktionalen Abhängigkeiten in den zerlegten Relationen erhalten sind, ist die Zerlegung abhängigkeitstreu.

Zur Einhaltung der Informationen der ursprünglichen Relation müssen alle Tupel der ursprünglichen Relation durch Verbundoperationen wieder hergestellt werden können UND es dürfen keine weiteren Tupel erzeugt werden können.

3.4.5 Normalformenlehre

In praktischen Aufgaben werden wir nur die ersten drei Normalformen anwenden.

3.4.5.1 Erste Normalform
Die 1NF bezieht sich auf atomare oder einfache Datentypen, zusammengesetzte Datentypen (record) sind nicht gemeint, sie können jedoch auf mehrere Attribute aufgeteilt werden (z.B. Vorwahl und Anschluss).
Bei der 1NF können bei wenigen Werten je Attribut auch mehrere beispielsweise mit Nummern bezeichnete Attribute zur Normalisierung verwendet werden.

3.4.5.2 Zweite Normalform
Es sind immer alle Schlüssel einer Relation gemeint, Primär- und Kandidatschlüssel.
Bei abgeleiteten Attributen werden wir überlegen, sie zusammen mit den Determinanten zu speichern.

3.4.5.3 Dritte Normalform
Auch hier sind immer alle Schlüssel einer Relation gemeint, Primär- und Kandidatschlüssel. Zu abgeleiteten Attributen siehe die Anmerkung bei 2NF.
Mit der dritten Normalform haben wir die praktisch durchgeführte Normalisierung erreicht.

"Every non-key attribute must provide a fact about the key, the whole key, and nothing but the key, so help me Codd. William Kent, CACM 1983/ George Diehr, in en.wikipedia 15.03.2019.

3.4.5.4 Boyce-Codd-Normalform

3.4.5.5 Vierte Normalform

3.4.5.6 Fünfte Normalform

3.4.5.7 Denormalisierung
Die Anomalien spielen keine oder eine geringe Rolle für Attribute, an denen wenige oder keine Änderungen erfolgen. Beispielsweise werden Postleitzahlen nur in besonderen Fällen geändert. Um Joins zu sparen, werden hier nicht-normalisierte Schemata zugelassen.

Referenzen

  • [Lemahieu 2018] Lemahieu, W., Vanden Broucke, S., & Baesens, B. (2018). Principles of Database Management: The Practical Guide to Storing, Managing and Analyzing Big and Small Data. Cambridge: Cambridge University Press.
  • [Sauer 2015] Sauer, Petra: Informationsmodellierung. In Kudraß, Thomas: Taschenbuch Datenbanken, 2. Auflage, S.80-92. Hanser 2015.
  • [Kent 1983] William Kent, "A Simple Guide to Five Normal Forms in Relational Database Theory", Communications of the ACM 26(2), Feb. 1983, 120-125.

Zuletzt geändert: Samstag, 10. Juni 2023, 20:21