Ziel dieses Projektes waren die Umstrukturierung und der Relaunch der mit Coremedia aufgebauten Website. Dabei sollten möglichst viele der insgesamt ca. 9.000 existierenden Dokumente automatisiert ins neue System (ebenfalls Coremedia) übernommen werden. Diese Dokumente lagen in Form eines XMLExports des Altsystems sowie zahlreicher Binärdaten (Bilder, Videos, Audiodaten etc.) vor.
Ich war in diesem Projekt allein verantwortlich für die Datenmigration. Darüber hinaus war ich an der Entwicklung des neuen Dokumenttyp-Modells beteiligt.
Zuerst bestand meine Aufgabe in der Datenanalyse, insbesondere hinsichtlich der referenziellen Integrität und Vollständigkeit der angelieferten Daten. Hierzu habe ich mit Hilfe von XSL-Transformationen ausgewählte Attribute nach Excel konvertiert (CSV-Dateien). Die Excel-Tabellen erlaubten anschließend die flexible und einfach zu handhabende Auswertung.
Da unserem Team weder eine Dokumentation des Altsystems noch das alte Dokumenttyp-Modell zur Verfügung gestellt wurden, bestand meine nächste Aufgabe im Re-Engineering des Altsystems. Ebenfalls per XSLT generierte ich aus den XML-Daten eine „flache“ Dokumenttyp-Definition (ohne abstrakte Dokumenttypen) . Diese wurde auf einem Test-System installiert, in welches anschließend der XML-Export importiert wurde. Das neue Redaktionsteam erhielt einen Zugang zu diesem System, um sich vorab einen Überblick über den Datenbestand verschaffen zu können.
In Absprache mit dem Redaktionsteam habe ich dann alle relevanten Inhaltsobjekte identifiziert und von den reinen Navigationsobjekten sowie weiteren nicht länger benötigten Inhalten getrennt. Auf dieser Basis entwickelte ich eine XSL-Transformation, welche den XML-Export in einen Import für das neue System überführte. Mit Hilfe der umfangreich konfigurierbaren XML-Import-Schnittstelle von Coremedia habe ich die transformierten Daten anschließend in das neue System importiert.