Beginn dieses Jahrzehnts hat sich Big Data als eine vielversprechende Möglichkeit erwiesen um datenintensive Projekte und Anwendung zu entwickeln, die noch vor wenigen Jahren unmöglich erschienen. Unter Verwendung neuartiger Technologien und Techniken können große Mengen an verschiedenartig beschaffene Daten aus unterschiedlichen Quellen unproblematisch gespeichert, verarbeitet und visualisiert werden. Insbesondere Unternehmen haben die massiven Potentiale erkannt, die sich beispielsweise in der Verbesserung der Wissensschaffung, der Unternehmensagilität, der Geschäftsprozesse und der Erreichung von Wettbewerbsvorteilen, wiederfinden lassen.
Die Durchführung solcher Projekte stellt für Unternehmen, allerdings, häufig eine große Aufwendung dar, die grundlegende Änderungen in vielen Bereiche mit sich ziehen kann, vor allem hinsichtlich der bestehenden Infrastruktur. Daher stellt die Umsetzung solcher Vorhaben eine strategische Entscheidung dar, die auf Basis eines tiefgreifenden Verständnisses getätigt werden muss.
Im Zuge dieser Entwicklung haben sich verschiedene Architekturkonzepte gebildet, die unterstützend bei der Realisierung dieser Projekte wirken sollen. Oftmals, orientiert aus einer Menge von erfolgreichen Implementierungen, fungieren diese so genannten Referenzarchitekturen als eine Art generalisierter Lösung und können als Vorlage verwendet werden. Die komponentenbasierte Anordnung bietet dabei genug Freiraum für genaue Implementierungsentscheidung hinsichtlich der verwendeten Technologien, Techniken und Tools. Oftmals existieren jedoch horrende Unterschiedene bezüglich einzelner Kompatibilitätseigenschaften. Während für einzelne Tools ganze Plattformen existieren, bei denen die einzelnen Elemente ohne große Umwege verknüpft und integriert werden können müssen in anderen Bereichen spezielle Adapter, APIs oder anderweitige Ansätze genutzt werden.
Das Ziel dieser Arbeit soll es sein ein Überblick zu Kompatibilitätseigenschaften von Big Data Technologien und deren Ausprägungen zu liefern. Im Vordergrund stehen dabei die einzelnen Tools von Big Data Systemlandschaften, die es miteinander zu verknüpfen gilt. Inwiefern diese Verbindung besteht oder gewährleistet werden kann soll dabei genauer untersucht werden.
Arbeitsplan: