Add Thesis

Big Data und ihre Technologien

Hadoop und NoSQL-DBMS

Written by S. Coskun

Paper category

Bachelor Thesis

Subject

Computer Science

Year

2014

Abstract

Bachelorarbeit: Big Data Zunächst ist hervorzuheben, dass es keine einheitliche Definition von Big Data gibt. Jeder definiert Big Data nach eigenen Prioritäten und unternehmensbezogenen Aspekten. Da hier nicht alle Aspekte gelöst werden können, wird an dieser Stelle eine Kombination von Definitionen zusammengefasst, die grundsätzlich mit dem Thema dieser Bachelorarbeit vereinbar sind. Big Data beschreibt das rasante Wachstum von Daten, ob beispielsweise in strukturierter Form von Zahlen oder Tabellen, sie können auch in Form von unstrukturiertem Text, Webseiten und Videos bereitgestellt werden. Der große Vorteil dieser Art von Daten ist, dass sie sich schnell ändern. 5 Big Data bezeichnet aber auch die Nutzung großer Datenmengen aus unterschiedlichen Quellen, um wirtschaftlichen Nutzen zu erzielen. Daher umfasst es alle Arten von Daten, die sich auf das Geschäftsmodell des Unternehmens beziehen, und die Möglichkeit, dieses zu analysieren. Man erkennt, dass Big Data alle Daten umfasst und nicht zwischen strukturierten und unstrukturierten Daten unterscheidet. 6 Bei unstrukturierten Daten kann diese Situation auch aus einer anderen Perspektive betrachtet werden. Einige Leute glauben, dass Unternehmen Daten als unstrukturierte Daten definieren, weil die neuen Daten keinem vordefinierten Format, Modell oder Muster entsprechen. Beispielsweise kann der Text einer E-Mail als unstrukturiert angesehen werden, ist jedoch Teil einer bestimmten Struktur, die der Spezifikation RFC-2822 (Internet Message Format) entspricht und viele Felder enthält, die Absender, Empfänger und Betreff angeben Datum. 2001 schrieb Doug Laney von der Meta Group (einem IT-Forschungsunternehmen, das 2005 von Gartner übernommen wurde) eine Forschungsarbeit, in der er feststellte, dass der E-Commerce im Datenmanagement in drei Dimensionen explodiert ist: 7. Volumen. Da Big Data große Datenmengen beinhaltet, stoßen Unternehmen in der Regel auf Probleme, wenn sie alle Daten im Unternehmen nutzen wollen:  Geschwindigkeit (Geschwindigkeit oder Verfügbarkeit). Daten aus Big Data müssen oft sofort oder zumindest so verarbeitet werden, wie sie in das Unternehmen fließen, um sie optimal für das Unternehmen zu nutzen.  Vielfalt. Big Data umfasst nicht nur strukturierte Daten, sondern auch unstrukturierte Daten: Text, Protokolldaten, Video, Audio, Clickstream... Mittlerweile sind über 80% der Daten unstrukturiert. Aber wenn wir auf Vielfalt klicken, können wir auch sehen, dass die Quellen für Big Data sehr vielfältig sind Neben der Schwierigkeit, diese Daten zu verwalten und zu speichern, ist auch das Abfragen, Analysieren und Visualisieren dieser Daten eine Herausforderung. 10 Diese Standards werden die drei V- oder V3-Standards von Big Data genannt. Es gibt aber auch Quellen, die einen vierten V-Standard haben: Veracity (Authentizität), was in der Regel Authentizität bzw. Einhaltung und Einhaltung der Authentizität bedeutet. Big Data ist anspruchsvoller als Immobilien. Massendaten sind schnell und es ist schwierig, die Authentizität zu beurteilen. Es besteht immer die Möglichkeit ungenauer und unsicherer Daten. Daher ist die Bereinigung solcher Daten vor der ersten Analyse eine anspruchsvolle Aufgabe. 11,12 Aber Volumen ist die erste Idee von Big Data. Manche Leute denken, dass PB der Ausgangspunkt von Big Data ist. In manchen Fällen kann der Nutzen von Daten aber auch in der begrenzten Datenmenge liegen, wenn diese einen hohen Wert für das Unternehmen hat und eine große Menge an Transaktionsdaten über längere Zeit ungenutzt verarbeitet wurde, solange diese V-Standards werden nicht eingehalten, einige können nicht von Big Data sprechen. Schauen Sie genau hin, das Wort Big Data bedeutet eine Menge Daten. Daten allein können jedoch nirgendwo hinkommen. Denn was nützen so viele Daten, wenn es keine geeignete Analysemethode gibt. Bei Big Data geht es nicht um:  einzelne Technologie  Hardware- oder Softwareprodukte  IT-Strategie oder -Architektur  Marketing-Buzzwords  oder kurzfristige Trends. Big Data stellt eine Erweiterung bestehender Datenanalysemethoden, -prozesse und -verfahren (siehe Kapitel 3) dar. 132.2 Vorteile und Potenziale von Big Data Laut einer Studie des BARC (Business Application Research Center) erwarten die meisten Unternehmen die Vorteile von Big Data die strategische Ebene. 14 Um den größtmöglichen Nutzen zu erzielen, ist es jedoch sehr wichtig, dass Experten aus unterschiedlichen Bereichen zusammenarbeiten. Dazu gehören IT-Experten, Business Manager und Experten, die große Datenmengen sammeln und auswerten. Zu den wichtigsten Vorteilen von Big Data zählen folgende Aspekte:  Bessere strategische Entscheidungsfindung  Bessere Kontrolle der Betriebsabläufe  Schnellere und detailliertere Datenanalyse  Verbesserter Kundenservice und bessere Kundenbindung. Read Less