Vlog #7 Ein Rechenzentrum erfolgreich umziehen

  

OSI Insights im Video-Blog

Ein RZ-Umzug ist äußerst komplex und umfasst einen massiven Planungs- und Koordinationsaufwand. Im Vorfeld müssen viele wichtige Entscheidungen getroffen werden. Eine Grundsatzfrage ist dabei: Wage ich einen „Big Bang“ oder gehe ich doch die zeitintensive aber Risiko ärmere Variante mit einzelnen Move-Wellen?

Im Gespräch: Slavko Mucic aus dem Sales und Stephan Riechmann, verantwortlich für die Projektsteuerung von RZ-Umzügen bei Rosenberger OSI.

  

Stephan, Du bist mein „Go-to-Guy“ wenn es darum geht Rechenzentren umzuziehen. Worauf muss man insbesondere achten, wenn man sein Rechenzentrum von A nach B bewegen muss.

Stephan Riechmann: RZ-Umzüge ist ein sehr, sehr spannendes Thema. Und wenn man versucht, das grob zu planen, würde ich es sagen, kann man es in drei Schritte unterteilen. Der erste Schritt wäre die Dokumentation. Bedeutet – ich gehe erst einmal hin und nehme den IST-Zustand des Kunden auf mit der umzuziehenden Hardware. Hintergrund ist der: Die Erfahrungen zeigen, dass der Kunde meistens mit völlig veralteten Listen arbeitet und oft gar nicht weiß, was er überhaupt an Hardware vor Ort hat. Und wir bieten dann an, erstmal die IST-Aufnahme zu machen. Je nach Wunsch sogar die Verkabelung. Also die komplette Landschaft einmal abbilden. Hat auch für den Kunden den Vorteil, dass er seine Asset-Listen auf Vordermann bringt, die Lizenzen prüfen kann, die Wartungsverträge prüfen kann, damit er dann hinterher, wenn er umgezogen ist, diese Systeme aus den eigenen internen Asset-Systemen löschen kann.
Der zweite Punkt, ist natürlich der spannendste. Ist die Planung. Die Planung macht natürlich am meisten Probleme, wie bei jedem anderen auch.

Was insbesondere macht diese Schwierigkeiten bei der Planung aus?

Stephan Riechmann: Auch die Planung kann man sehr grob in zwei Alternativen unterscheiden. Einmal der Komplettumzug 1-zu-1. Der sogenannte „Big Bang“. Ich nehme einen Termin und versuche die gesamte Landschaft von A nach B zu bringen. Da muss aber dann auch alles stimmen. Die Aufnahme muss stimmen, die Ziellandschaft muss stimmen. Da kommen wir aber gleich dazu. Und die zweite Alternative ist der Umzug in Wellen. D.h. Move-Wellen.

Das heißt das Rechenzentrum über einen längeren Zeitraum in verschiedenen kleinen Steps umziehen?

Stephan Riechmann: Man kann es aufteilen, dass man sagt, man nimmt erst einmal die Testumgebung, die Produktionsumgebung, oder erst den Storage, oder diesen als letztes. Dies hängt sehr stark von der Größe der umzuziehenden Systeme ab. Und, wie man es schon erkennen kann, ein „Big Bang“ ist natürlich wenig zeitintensiv, aber sehr risikobehaftet.

Man braucht natürlich viel Personal.

Stephan Riechmann: Ja – viel Personal natürlich. Weil der Umzug muss ja eins zu eins klappen. Und sobald ich irgendetwas bei einer neuen Landschaft hochfahre, nicht funktioniert. Und ich habe keine Zeit mehr, muss ich den „fall back“ alles wieder in die alte Landschaft zurück. So habe nichts geschafft, weil ich mach ja einen eins zu eins Umzug. Und der klappt oder er klappt nicht. Move-Wellen: Ich kann das schön aufteilen in Bausteine so zu sagen. Und jetzt Baustein für Baustein hochfahren. Mit jedem Move lerne ich auch dazu. Und wenn es klappt – wunderbar. Und plane ich den nächsten. Aber wie man daran schon erkenn kann, ist das sehr zeitintensiv und vor allem personalintensiv.

Aber wie trifft man dann die Entscheidung, ob man das in einem „Big Bang“ oder in diesen aufgefächerten Wellen macht?

Stephan Riechmann: Das ist eine schwierige Entscheidung. Das machen wir natürlich in einer sehr engen Absprache mit unseren Kunden. Hängt natürlich zum größten Teil von der von der Größe der umzuziehenden Landschaft ab. Wenn ich jetzt nur drei Racks habe, brauche ich nicht groß nachdenken. Wenn ich natürlich mehr Hardware habe oder ich habe mehrere Subunternehmen, die daran hängen oder ich lasse beispielsweise das Monitoring über das Ausland machen oder was auch immer, wird es schwieriger. Also die Abhängigkeiten untereinander. Also wer macht was. Weil an den Move-Tagen müssen alle zur Verfügung stehen. Ich muss alle zusammenbringen, es muss alles getestet werden. Ich ziehe etwas um, ich fahre es an der neuen Ziellandschaft hoch und dann muss es funktionieren. Und wenn dann Probleme auftauchen, müssen sie gelöst werden.

Das heißt schon rein koordinativ müssen die Personen, die im Rechenzentrum sind, mit den Personen getaktet werden, die virtuelle teilweise überall auf der Welt herumsitzen und dann die Maschinen umziehen?

Stephan Riechmann: Genau – und dann halt testen. Und das ist immer die Frage. Das hängt auch damit zusammen, mache ich einen „Big Bang“ oder „Move-Wellen“, wie alt ist die Landschaft, die ich umziehe. Wenn ich die Hardware-Aufnahme mache, da kann ich schon erkennen, die Geräte sind schon etwas älter, sind vielleicht out of life-time oder sind nicht mehr leistungsstark genug. D.h. der Kunde muss entscheiden, mache ich einen so genannten Lift and Shift. Das heißt ich nehme das Rack an sich 1 zu 1, die Hardware sowie sie ist und stelle sie am neuen Ort auf. Oder aber ich verbinde das mit einem Tech-Refresh. Das heißt ich schaue mir an. Was habe ich? Kann ich das zusammendampfen? Modernere Geräte, schnellere Geräte, Geräte die weniger Hitze verursachen, wie auch immer. Wo dann auch die Wartungsverträgen neu abgeschlossen werden. Wo ich vielleicht weniger Lizenzen brauche.

Baue quasi meine IT neu auf und benutze den Move, um einen Tech-Refresh durchzuführen?

Stephan Riechmann: Zum Beispiel - genau. Und in einer neuen Landschaft ist das Risiko wesentlich kleiner. Wo die Racks schon stehen und ich habe die Verkabelung und alles schon vorbereitet. Ich brauche nachher nur noch die Hardware, wo wir 1zu1 umziehen bzw. die neue, die schon da steht, anschließen. Das muss man auch bedenken: Bei einem Lift and Shift ist es ja so, dass ich Systeme, die schon fünf Jahre am Strom hängen und nie runter gefahren worden sind, fahre ich jetzt einmal runter, ohne zu wissen, wenn ich sie hochfahre, kommen diese überhaupt wieder hoch? Also steigen Festplatten aus? Wie auch immer. Wir empfehlen dann auch, falls ein Lift and Shift gemacht wird – jetzt wird es aber teuer. Vorher immer einen Test zu machen. Einfach die Systeme herunterfahren und dann wieder hochzuziehen. Klappt das? Und die Erfahrung zeigt eben – nein, es klappt nicht immer. Und wenn man jetzt so einen Lift and Shift macht, dann muss man auch organisieren, dass man Ersatzteile vor Ort hat. Also Festplatten. Das wenn etwas aussteigt, dies eben auch funktioniert.

Das bringt uns ja zum dritten Punkt. Das heißt an dem eigentlichen Move-Tag muss wirklich alles parat stehen?

Stephan Riechmann: Alles.

Es muss alles da sein. Die Leute müssen da sein. Die Hände, die im Rechenzentrum wirklich die Geräte ausbauen und dann verbringen in das neue Rechenzentrum. Das muss alles koordiniert werden. Was ich ganz spannend fand. Ich durfte Dich ja bei dem ein oder anderen RZ-Move begleiten. Dass du im Vorfeld tatsächlich die Wege abgehst und schaust, gibt es da Schwellen, kommt man mit dem Hubwagen durch, können in den Gängen vom Rechenzentrum zwei Leute aneinander vorbei laufen.

Stephan Riechmann: Komme ich mit dem LKW da überhaupt da ran. Das sind ja luftgefederte LKWs, die ja wertvolle Hardware fahren. Gesicherter Transport. Da hängt unglaublich viel mit zusammen. Und wenn ich jetzt zum Beispiel keine Schleuse habe oder keine Rampe habe. Denn ein Komplett-Rack kann ich ja schlecht mit dem Hubwagen. Wenn es geht ist es natürlich super. Aber jede Schwelle tut weh. Und der Boden muss das Gewicht vertragen. Meistens haben die Rechenzentren ja einen Doppelboden, der nur gewisse Kilo pro Quadratmeter aushält. Auch das muss man vorher checken. Das man sagt, ich nehme zwar das Rack mit, aber ich baue nur die Hälfte auf, weil einfach das Gewicht zu stark ist. Alles zu bedenken. Man fährt auch den Weg ab, den der LWK fährt. Komme ich da durch, habe ich Staus, wie auch immer. Weil ich habe einen engen Zeitplan. Weil in der Regel ist es so. Dann ist es abgebaut und in der Zeit muss es aufgebaut sein, damit die Mannschaft, die das nachher testet auch genug Zeit hat. Weil in der Regel ist das so. Freitags fängt man an, Montags soll alles funktionieren. Und wie gesagt, je nach Größe der umzuziehenden Landschaft, wird es schwierig. Wie gesagt, das mach man in sehr enger Absprache mit dem Kunden, wo wir dann natürlich beratend zur Seite stehen.

Worauf es beim RZ-Umzug ankommt. Zur Checkliste: Ein Rechenzentrum erfolgreich umziehen in 10 Phasen