Add Thesis

Analyse des Datensatzes „Marathon“

Written by Anonymous

Paper category

Term Paper

Subject

Business Administration>General

Year

2019

Abstract

Hausarbeit: Datensatz 1.1 Kurzbeschreibung und Quelle Der zur Analyse verwendete Datensatz „Marathon“ ist eine Aufzeichnung eines Marathonläufers über einen Zeitraum von 5 Jahren, genauer gesagt von 2002 bis 2006. Es enthält 1.128 Trainingsmessungen und Umfragen. "9 Variables Marathon" stammt aus dem Stat2Data-Paket von R-Studio, das von den folgenden Quellen angezeigt und heruntergeladen werden kann: 1.3 Datenimport und -paketierung in R-Studio Lassen Sie uns R-Studio für die Datenanalyse verwenden. Laden Sie zuerst die erforderlichen Pakete. Diese Pakete werden vor der Verarbeitung installiert Verwenden Sie Marathon <-read.csv ("Marathon.csv") zum Einlesen von Datensätzen 1.4 Vorbereiten von Datensätzen Um Annahmen zu überprüfen, sind nicht alle Variablen notwendig. Dies ist der Grund für die Bearbeitung und Reduzierung der Daten Wir haben nur die beiden Variablen ShoeBrand und Pace / Min geführt. Es ist zu beachten, dass die Daten für Schuhmarken nur vom 14.02.2005 bis 30.12.2006 vorliegen, der verbleibende Zeitraum ist also von der weiteren Analyse ausgeschlossen , Einschließlich Schuhmarken. Erstellen und speichern Sie eine neue Tabelle unter "Marathon_new". 3. Übersicht der verwandten Variablen Der Summary-Befehl gibt einen kurzen Überblick über die verfügbaren Daten. Da der Fokus der Analyse nur auf den beiden benötigten Variablen liegt, die Daher ist es sinnvoll, diese Variablen sorgfältig zu studieren. Der Erfolg des Pace/Minute-Marathons hängt von der Laufgeschwindigkeit ab (Meilen/Stunde, Meile/Stunde). Wenn wir diese Variable grob verstehen, erhalten wir folgende Ergebnisse: zu diesem Zeitpunkt Der Median, da er weniger anfällig für Ausreißer ist. In diesem Fall beträgt er 8,008 mph - obwohl er auch nahe am Durchschnitt liegt, der 8.080 mph. Die Spanne um den Durchschnitt reicht von den niedrigsten 7.047 mph bis The die höchste ist 10.301 mph. Wenn Sie die Geschwindigkeit in einem vertrauteren Kilometer pro Stunde (km/h) anzeigen möchten, können Sie 1,61 durch die Conversion-Rate erreichen. Wir möchten auch die Variablen der Schuhmarke kurz skizzieren. Wie bereits erwähnt, dieser Datensatz Es werden nur Datensätze vom 14.02.2005 bis zum 30.12.2006 bereitgestellt. Dies ist die nominale Variable, die wir als Faktor verwenden möchten. Jetzt können wir einen Überblick über die Eigenschaften der Schuhmarke zeigen. Modalwerte, die meisten gemeinsamer Merkmalsausdruck Die Formel lässt sich aus der Übersicht leicht ablesen. Dies ist Mizuno 108, und die meisten Läufe werden mit Schuhen dieser Marke gefahren. 756 NA wird in nachfolgenden Kursen nicht berücksichtigt, da dies eine fehlende Aufzeichnung des Schuhs ist Marke. 4. Deduktive Analyse 4.1 Forschungsfrage und Hypothese Forschungsfrage: Wird die erfolgreiche Laufgeschwindigkeit beim Marathontraining durch die getragene Schuhmarke beeinflusst Hypothese A: Es besteht kein signifikanter Zusammenhang zwischen der getragenen Schuhmarke und der Laufgeschwindigkeit pro Minute. Die Mittelwerte sind gleich Nullhypothese H0: Es besteht kein Zusammenhang zwischen Schuhmarke (ShoeBrand) und Laufgeschwindigkeit pro Minute (PaceMin) Alternativhypothese H1: Es besteht ein Zusammenhang zwischen Schuhmarke (ShoeBrand) und Laufgeschwindigkeit pro Minute (PaceMin). Die Hypothese wird unter der Prämisse getestet, dass das Signifikanzniveau α = 0,05 ist. 4.2 Hypothesenanalyse Prüfen Sie beim Testen von Hypothesen, ob die Laufgeschwindigkeit durch die gewählte Schuhmarke wirklich nicht beeinflusst wird. Der Einfluss der unabhängigen Variablen In diesem Fall wird der Einfluss der Schuhmarke (ShoeBrand) auf die Laufgeschwindigkeit der abhängigen Variablen (PaceMin) betrachtet und festgestellt, ob der Durchschnittswert wirklich nicht abweicht. Zur Varianzanalyse verwenden wir statistische Methoden (Analysis of Variance, ANOVA). Zunächst stellen wir die beiden Variablen grafisch in einem Boxplot dar. Der Boxplot hat gezeigt, dass es viele Ausreißer gibt, vor allem die Schuhmarke "Asics" ist zu finden. Der Median der Schuhmarke Adidas Izumi liegt offensichtlich fast auf dem gleichen Niveau. Alle Durchschnittswerte liegen jedoch bei 8 bis 9 Meilen pro Stunde Im weiteren Prozess sollte ermittelt werden, wie groß die individuellen Unterschiede zwischen den Anbietern sind. Betrachten wir zunächst den genauen Durchschnitt basierend auf der Betriebsgeschwindigkeit jeder Marke. Es zeigt sich, dass der Durchschnitt tatsächlich in einem sehr ähnlichen Bereich liegt. Lediglich "New Balance" ist mit 8,04 km/h leicht negativ. Erfüllen die Daten wirklich die Anforderungen der Varianzanalyse? Dies muss im Vorfeld geprüft werden. Einerseits muss die Varianz homogen sein, die Varianz verschiedener Gruppen sollte (ungefähr) gleich Wenn die Unterschiede zu weit auseinander liegen, steigt die Wahrscheinlichkeit, den ersten Fehlertyp zu machen. Für unsere Daten sieht die Varianz sehr gut aus, der Unterschied ist nicht zu groß, der Bereich liegt zwischen 0,07 und 0,18 , die fast eine gerade Linie aus der Abbildung ist Die Situation ist auch zu sehen. Außerdem sollten die Residuen normalverteilt sein. Wir können es mit Hilfe von zwei grafischen Darstellungen wieder visualisieren. Alle Punkte der Residuen liegen ungefähr auf dieser Linie , was uns erlaubt, daraus zu schließen, dass es eine vernünftige Normalverteilung gibt. Read Less