W jaki sposób powiązane są nadmiarowości danych i anomalii danych?

Nadmiarowość danych może powodować anomalie danych w bazie danych - najczęściej błędy wstawiania, kasowania i aktualizacji. Proces normalizacji danych pomaga wyeliminować nadmiarowość danych i wynikające z nich anomalie.

Redundancja danych ma miejsce, gdy konkretna część danych znajduje się w więcej niż jednym obszarze bazy danych. Typowym przykładem może być baza danych uniwersytetów lub szkół wyższych dotycząca bieżącej rejestracji na kursach. Jeden uczeń może być zapisany na kilka różnych kursów, więc ich indywidualny zapis studencki może być powtórzony kilka razy. W scenariuszu produkcyjnym pojedynczy dostawca może być używany do różnych projektów i produktów.

Ważne jest wyeliminowanie nadmiarowości danych przy jednoczesnym zachowaniu integralności danych dzięki wieloetapowemu procesowi normalizacji. Redundancja zazwyczaj powoduje trzy powszechne anomalie danych - lub przypadki, w których dane są niespójne.

Anomalie wstawiania - gdy dane nie mogą być przechowywane lub aktualizowane, chyba że inne dane są przechowywane w tym samym czasie. W przykładach na studiach może się to zdarzyć, jeśli nie można wprowadzić rekordu ucznia, dopóki nie zapisał się na kurs.
Aktualizacja anomalii - w przypadku gdy jedna z kopii rekordu jest aktualizowana, podczas gdy druga nie jest aktualizowana; wszystkie kopie powinny być aktualizowane jednocześnie.
Usunięcie anomalii - dzieje się tak, gdy usunięcie jednej części danych oznacza utratę innych informacji. W przykładach studentów może się to zdarzyć, jeśli usunięcie kursu oznacza również usunięcie pokrewnych rekordów ucznia.