Data Domain System Management Service (SMS) funktioniert nicht mehr

Bei älteren DDOS Versionen (z.B. 5.5 – 5.7) kann es vorkommen, dass sich der SM Service aufhängt. Zum Glück hat dies im Normalfall wenig Auswirkungen auf Backups. Aber die Benutzbarkeit der Data Domain an sich ist beeinträchtigt und auch SNMP funktioniert ggf. nicht mehr. Z.B. kann auch die Web-Gui nicht mehr funktionieren oder alle Befehle auf der Kommandozeile werfen Fehlermeldungen.Eine Beispielfehlermeldung wäre:

sysadmin@DDVE_57_JF# filesys show space

**** Error retrieving information (**** Error communicating with management service.).

Das Problem tritt allerdings eigentlich nur in besonderen Konstellationen auf:
1 ) SNMP ist aktiviert
2) Man hat eine Replikationslizenz
3) Man hat auf der Data Domain selber keine Replikation konfiguriert. Replikation durch eine Backup Software zählt nicht.

Eine genauere Beschreibung mit tiefergehenden Informationen gibt es hier und hier.

Im Idealfall sollte man allerdings darüber nachdenken, seine Data Domain zu patchen, um das Problem dauerhaft aus der Welt zu schaffen. Möchte oder kann man dies nicht, gibt es einige Workarounds:

1) Manueller Restart des SMS:
Dazu logged man sich mit einem Administrator-Account auf der Data Domain ein.
Mittels des Befehls „sy sh se“ kann man sich die Seriennummer der Data Domain anzeigen lassen.
Danach wechselt man mit „priv set se“ in den System Engineer Modus. Das Passwort ist die Seriennummer aus dem vorherigen Befehl.
Mit „se sms restart“ kann man dann den SMS restarten.
Alternativ kann man die Data Domain auch rebooten, um das Problem zu beheben.
Der Restart des SMS (oder der Reboot) helfen aber nicht dauerhaft.

2) Eine dauerhafte Lösung ist die Einrichtung einer Replikation. Wenn man eine Replikations-Lizenz hat, hat man im Normalfall auch mindestens zwei Data Domains. Falls nicht, sollte man seinen Dell EMC Sales einmal fragen, ob man die Lizenz zurückgeben kann, da man sie nicht braucht. Gehen wir also davon aus, das man noch eine zweite Data Domain hat.
Auf der Quell-Data Domain legt man einen neuen Mtree an oder benutzt einen bestehenden Mtree, wenn man einen ohne großartig viele Daten hat. Es geht nicht darum, Daten zu übertragen, sondern nur darum, dass eine Replikation eingerichtet ist.
Danach wechselt man in der GUI in den Replication-Reiter und legt eine neue Replikation an.
Als Ziel gibt man einen (noch) nicht existierenden Mtree auf der Ziel-Data Domain an. Dieser wird bei der Konfiguration erstellt.
Als Quelle wählt man dann den oben erstellten (oder einen bereits existierenden) Mtree.

replication

Nach einem Klick auf OK sollte das Problem aus der Welt sein. Aber wie bereits geschrieben: Ein DDOS Update ist sehr empfehlenswert an dieser Stelle.