Autoren: Antonia Kresse, Benjamin Eckstein, Christian Kühl, Markus Bischoff
Freie Universität Berlin
Berlin, 16. September 2011
Die Ausarbeitung bezieht sich auf folgende Umfrage.
Unsere Forschungsgruppe besteht aus vier Informatikstudenten, die gerade ihren Bachelor in Informatik beendet haben. Währen des Studiums haben wir festgestellt, dass eine Menge unserer Kommilitonen mehr als die sechs Semester Regelstudienzeit benötigen.
Dabei kam uns die Frage in den Sinn, ob die Studienzeit durch äußere Faktoren verlängert oder verkürzt werden kann. Wir stellten daher die Research question: „Welche Faktoren beeinflussen den Studienverlauf eines Bachelorstudenten?“ Die drei großen Säulen, die wir untersuchen wollten, sind Nebenjob, Hobby (Verein) und Familie (zum Beispiel eigene Kinder). Um unsere Research Question beantworten zu können, entwickelten wir einen Fragebogen mit 23 Fragen zu den drei Säulen, sowie allgemeine Fragen zur Person. Diesen Fragebogen haben wir auf einer Internetseite gepostet und versucht durch ein Anschreiben Studenten eingeladen unseren Fragebogen auszufüllen.
Die folgenden Hypothesen sollten uns bei der Analyse helfen. Studenten die mehr als 20 Stunden pro Woche arbeiten studieren länger als sechs Semester. Diese Hypothese beruht auf dem hohen Zeitaufwand den ein Nebenjob mit sich bringt, folglich hat der Student weniger Zeit sich auf das Studium zu konzentrieren. Studenten mit einem Nebenjob, der thematisch mit dem Studium zu tun hat, haben eine kurze Studienlaufzeit und eine gute Bachelornote. Die Hypothese beruht auf der Annahme, dass diese Studenten im Nebenjob Wissen erlangen, welches ihnen im Studium hilft und somit auch weniger Probleme und weniger Zeit für die Übungszettel benötigt wird.
Des Weiteren nehmen wir an, dass Studenten deren Nebenjob nichts mit dem Studium zu tun hat eine längere Studienlaufzeit und eine schlechtere Bachelornote haben. Studenten mit Kindern studieren länger als die Regelstudienzeit vorsieht. Diese Hypothese basiert darauf, dass Kinder viel Zeit in Anspruch nehmen, die den Studenten für das Studium verloren gehen.
Studenten die einen eigenen Haushalt haben oder sehr viel im Haushalt helfen, haben eine längere Studienlaufzeit. Investiert ein Student mehr als fünf Stunden pro Woche in sein Hobby, hat er eine signifikant kürzere Studiumszeit. Der Gedanke bei dieser Hypothese ist, dass diese Studenten eventuell ausgeglichener sind. Studenten die sich neben der Uni mehr als fünf Stunden pro Woche mit Informatik beschäftigen schaffen ihren Bachelor in sechs oder weniger Semestern.
Studenten deren Studienfach die erste Wahl ist, tendieren dazu eine kürzere Studiumszeit zu haben. Bei dieser Hypothese ist der Gedanke die Motivation der Studenten. Hoch motivierte Studenten studieren haben mehr Freude am Studium und sind deshalb schneller. Studenten mit einer schlechten Bachelornote (schlechter als 2,5) studieren länger als die Regelstudienzeit.
Der Entwurf des Umfragebogens war in Phasen aufgeteilt. In der Planphase wurden verschiedene Vermutungen aufgestellt, welche Korrelationen und Abhängigkeiten überhaupt untersucht werden sollen. In der zweiten Pase, der Datenphase, wurde erörtert, welche Daten notwendig sind um diese Abhängigkeiten zu bestätigen oder zu wiederlegen. In diesen zwei Phasen entstand auch die grobe Themenaufteilung „Allgemines, Nebenjob, Freizeit, Familie, Teilnehmer“. Schwierigkeiten entstanden dadurch, dass fehlendes Basiswissen dazu führt, dass alle behaupteten Abhängikeiten und Korrelation reine Spekulationen waren und wir somit auf keinem fundierten Vorkenntnissen aufbauen konnten.
Im Nachhinein machte sich das Bemerkbar, da wir z.B. eine Wohngemeinschaft nicht als Auswahl für eine Wohnsituation betrachteten. Insgesamt schmälert unser fehlendes Vorwissen somit die interne Validität unserer Studie. In der nächsten Phase, der Fragendesignphase, wussten wir, welche Thesen es mit welchen Daten zu prüfen galt. Die Schwierigkeit in dieser Phase war es die Fragen kurz, deutlich und verständlich zu formulieren.
Diese drei Eigenschaften zu vereinen ist besonders kniffig, da wir als Autoren der Studie bereits wissen, was die Frage bezwecken soll. Dieses Wissen haben unsere Teilnehmer jedoch nicht und deswegen die Frage präziser formulieren müssen. Eine endgültige Formulierung der Fragen erhielten wir erst, als nach einem Grobentwurf unsere Betatester uns wertvolles Feedback über Ihr Verständnis der gestellten Fragen mitteilten.
Die letzte Phase war die Antwortdesignphase, in der definierte Fragen geeignet beantwortet werden sollten. Dabei war es wichtig zwischen Freiheit (bzw. Antwortmöglichkeiten), Übersichtlichkeit und Auswertbarkeit abzuwägen. So wurde z.B. das Alter nicht mit einer Auswahl (z.b. 16 bis 20, 21 bis 25 und 26 bis 30), sondern mit einem Freitextfeld abgefragt. Dieses Freitextfeld wurde aber zusätzlich eingeschränkt, indem nur positive ganze Zahlen eingeben werden durften. Damit war eine quantitative Auswertung zur Verteilung des Alters möglich ohne mehrere Jahrgänge zu einer Klasse zusammenfassen zu müssen. Eine Alternative, eine positive Auswahlliste der Zahlen von 15 bis 35 als Antwortmöglichkeiten vorzugeben, hätte das Kriterium Freiheit und Auswertbarkeit zur genüge erfüllt, jedoch im Kriterium Überischtlichkeit versagt.
Eine weitere wichtige Entscheidung war Frage nach der Abschlussnote im Bachelore in nur 3 Antwortmöglichkeiten aufzusplitten (Besser als 2.5, schlechter als 2.5 oder keine Angabe). Hierbei waren die Antwortmöglichkeiten stark eingeschränkt, jedoch erschien uns das als richtig, da diese Information sehr persönlich ist und eine genau Antwort entweder mit hoher Wahrscheinlichkeit verzerrt (man verbessert die Note um z.b. 0,6) oder zum Abbruch der Teilnahme führen kann (Teilnehmer ist skeptisch und entscheidet sich gegen ein Versenden einer Umfragedaten).
Die letzten beiden Phasen wurden zur Gesamtoptimierung mehrfach wiederholt und durch Feedback und Denkpausen immer weiter verfeinert.
Unsere Zielgruppe sind Studenten der Naturwissenschaften im Bachelorstudiengang oder mit einem abgeschlossenen Bachelore. Die Teilnahme wurde motiviert durch ein Rundschreiben (siehe unten) an den Verteiler i-studi-replies@math.fu-berlin.de des Fachbereichs, der eine Kopie an alle Studenten weiterleitet. Durch diese Maßnahme erreichten wir ca. 180 Teilnahmen. Eine weitere Email an einen Verteiler der Universität Lübeck brachte weitere ca. 90 Teilnahmen.
Liebe Kommilitonin, Lieber Kommilitone,
wir sind Studenten der Freien Universität Berlin, die im Kurs „Empirische Bewertungen in der Informatik“ eine kurze Studie durchführen.
Mit unserer Umfrage möchten wir untersuchen, inwiefern sich äußere Faktoren auf den Studienverlauf von Bachelorstudenten auswirken. Am Ende der Studie werden wir das Resultat unserer Studie präsentieren und über die Auswirkungen der betrachteten Faktoren berichten.
Wir bitten dich daher an dieser 5-minütigen Umfrage teilzunehmen, die bis zum 20.06.2011 erreichbar ist.
Die Umfrage ist unter folgender Adresse erreichbar: http://www.umingo.de/doku.php?id=misc:umfrage
Wir freuen uns über jede Teilnahme. Vielen Dank im Voraus.
Die Ergebnisse unserer Studie veröffentlichen wir am 20. Juli unter folgender URL: http://www.umingo.de/doku.php?id=misc:umfrage_ergebnis
Mit freundlichen Grüßen, Antonia, Ben, Christian und Markus
Bei dem Verfassen des Rundschreibens wurde auf eine motivierende, aber neutrale Formulierung geachtet. Mit der Anrede „Liebe Kommilitonin, Lieber Kommilitone“ versuchen wir eine identifizierende Beziehung zu etablieren, da wir damit ausdrücken ebenfalls Studenten zu sein. Der potentielle Teilnehmer ist somit auf einer gleichberechtigten hierarchischen Ebene zu uns.
In dem nächsten Absatz verstärken wir die Beziehung indem wir erstens bestätigen Studenten zu sein und zweitens unsere Situation schildern, die in ähnlicher Situation jedem Studenten schon einmal begegnet sein wird.
Danach folgt das Thema der Umfrage und eine weitere Motivation zur Teilnahme. Das besondere an der Formulierung ist, das es zum einen den Anreiz gibt, Faktoren ausfindig zu machen, das eigene Studium zu verkürzen und zum anderen die Ergebnisse nach einer Auswertung präsentiert zu bekommen.
Insgesamt sehen wir die Motivation zur Teilnahme als Erfolg an, da wir sowohl eine hohe prozentuale Teilnahme erreicht haben, als auch in den Freitextfeldern positives Feedback über den Sinn und Design der Umfrage erhalten haben.
Die Datenerhebung geschah mittels eines elektronischen Umfragebogens (siehe Anhang). Anfangs wurde darüber nachgedacht, die Daten zusätzlich mit einem Ausgedruckten Umfragebogen zu erheben, um mehr Teilnehmer zu erreichen. Anhand des daraus resultierenden Mehraufwands und der erschwerten Datendigitalisierung wurde dieser Gedanke verworfen.
Die Auswahl eines dazu geeigneten Umfragesystems war schiwerig, da wir keine technischen Einschränkungen in Kauf nehmen wollten und die Dienstleistung kostenlos sein sollte. Nach dem Eruieren der betrachteten Systeme, entschieden wir uns ein eigenes System zu implementieren. Dazu wurde die Website www.umingo.de als Ankerpunkt benutzt und die darauf existierende Contenmanagement-Software Dokuwiki benutzt und die Umfrage in HTML kombiniert mit JavaScript zu designen. Das Speichern der Daten übernahm ein serverseitig ausgeführtes PHP-Skript.
Bevor wir unsere gesammelten Daten anhand der aufgestellten Hypothesen analysieren konnten, mussten wir die Rohdaten in R einlesen, validieren und dort formatieren. Zum Einlesen der Daten implementierten wir eine eigene Funktion. Mittels der read-Funktion wurden die Rohdaten eingelesen. Während des Einlesens fanden wir ein paar wenige fehlerhafte Daten, die wir entfernen mussten. In Listing 1 ist ein Ausschnitt dieses Codes dargestellt.
Weiterhin mussten die Rohdaten mit Labeln versorgt werden, da in den Daten nur eine Zahl für die entsprechende Antwort vorhanden war. Zum Beispiel entspricht die Zahl 1 bei der Frage nach dem Studienfach der Informatik. Aus diesem Grund haben wir die für uns wichtigen Daten in Faktoren umgewandelt und diese mit entsprechenden Labels benannt.
Listing 1: Teil des Codes zum Einlesen der Daten
readData = function ( path ){
data = read . table ( f i l e = path , header = TRUE, sep=" , " ) ;
data$ fach = factor ( data$fach ,
labels=c ( " Informatik " , "Mathematik" , " Physik " , " anderes " ) ) ;
data$ erstwahl = factor ( data$ erstwahl , labels=c ( " Ja " , " Nein " ) ) ;
. . .
}
Anschließend untersuchten wir die allgemeine Antwortverteilung und erstellten ein demographisches Profil der Teilnehmer unserer Studie. Für beides nutzten wir zum einen die Funktionen summary und table um quantitative Ergebisse zu erhalten. Außerdem nutzten wir die plot-Funktionen zur grafischen Darstellung. In Abbildung 3 sind die Studienfächer und Unitversitäten der Propanden dargestellt. Zusätzlich ermittelten wir beispielsweise, dass ca. 30% der Teilnehmer weiblich und fast alle Probanden im Alter von 20-26 waren.
Da wir auch mehrere Fragen hatten, die eine Freitextantwort verlangten, haben wir diese Antworten in verschiedenen Text Dateien zusammengefasst. Beispielsweise lieferte die Frage nach den individuellen Gründen der Differenz zur Regelstudienzeit sehr interessante Ergebnisse. Beispielsweise nannten viele finanzielle Probleme, Überschneidungen von Kursen, Platzbeschränkungen der Kurse und die damit verbundene 1-jährige Wartezeit, falls man es nicht in den Kurs geschafft hat, und ein insgesamt zu überladenes Studium als Gründe.
Schließlich untersuchten wir die Daten nach den von uns aufgestellten Hypothesen. Dazu gingen wir meistens folgendermaßen vor: Zuerst bildeten wir Gruppen der Teilnehmer für die jeweilige Hypothese. Dies geschah, indem wir mittels der subset-Funktion die Gesamtdaten aufteilten. In Listing 2 ist ein Beispielskript dargestellt.
Listing 2: Skript zur Gruppierung der Gesamtdaten
baf = subset ( data , baFertig == "BSC a b g e s c h l o s s e n " ) ban = subset ( data , baFertig == "BSC n i c h t a b g e s c h l o s s e n " )
Dies unterteilt die Daten nach Studenten, die den Bachelor schon abgeschlossen haben und die sich noch im Bachelor Studium befinden. Diese Teilung ist für uns sehr wichtig um zu unterscheiden, ob die Angaben der Personen wirklich oder nur geschätzt sind.
Diese Art von Code verwenden wir mehrmals, um die Teilnehmer in verschiedene Gruppen zu unterteilen, wie beispielsweise Infomatikstudenten, die den Bachelor abgeschlossen haben und einen Nebenjob besitzen“. Diese Gruppen haben wir anschließend unter anderem nach deren benötigte Semesteranzahl untersucht und in verschiedenen Plots dargestellt. In Listing 3 ist ein Beispielskript zur grafischen Darstellung der Daten abgebildet.
Listing 3: Skript zum Plot für die grafischen Analyse der Daten
par ( mfrow=c ( 1 , 2 ) , mar=c ( 3 , 3 , 3 , 3 ) ) #Abstand s e t z e n plot ( hasNJFert$anzSemester , main=" mit Nebenjob " , col=" Darkred " , xlab=" Zensur " , ylab=" Anzahl " , ylim=c ( 0 , 2 0 ) ) plot ( hasNoNJFert$anzSemester , main=" ohne Nebenjob " , col=" Darkred " , xlab=" Zensur " , ylab=" Anzahl " , ylim=c ( 0 , 2 0 ) )
Das entsprechende Diagramm zum Skript ist in Abbildung 3 dargestellt. Wie man erkennen kann, gibt es nur recht wenig Studenten ohne Nebenjob und ein allein Nebenjob scheint sich nicht auf die benötigte Semesteranzahl auszuwirken.
Mit der eben beschriebenen Methode haben wir unter verschiedenen Gesichtspunkten unsere Daten analysiert. Beispielsweise erwarteten wir eine Korrelation zwischen der Wochenarbeitszeit im Nebenjob und der Anzahl an benötigten Semestern. Diese fanden wir, auch wenn wir zu wenig Daten haben um eine signifikante Aussage treffen zu können.
Aus unerfindlichen Gründen hat R keine Achsenbeschriftung zum Diagramm eingefügt. Die y-Achse ist die Anzahl der Studenten, die x-Achse entspricht der Anzahl der Semester, die die Studenten für den Bachelor benötigten.
Generell kann man sagen, wenn man mehr als 10 Stunden pro Woche im Nebenjob arbeitet, man dazu tendiert die Regelstudienzeit zu überschreiten (vgl. Abbildung 3). Im Allgemeinen können wir nur sehr wenig signifikante Aussagen treffen, da wir in vielen Gruppen zu wenig Daten haben.
Eine interessante Korrelation fanden wir bei der Untersuchung des Nebenjobs und dessen Themenbezug zum Studiengebiet von Studenten, die noch im Bachelor sind. In Abbildung 3 ist dies dargestellt. Wie man sehen kann, glaubt die größte Gruppe der Studenten, die einen Nebenjob mit Themenbezug haben, dass sie es in Regelstudienzeit schaffen und eine gute Note bekommen, wohingegen die Studenten ohne Themenbezug im Nebenjob eher erwarten länger zu brauchen und auch eine schlechtere Zensur zu bekommen. Dies konnte aber in unserer Untersuchung der Studenten, die den Bachelor schon abgeschlossen haben, nicht belegt werden.
Möglicherweise handelt es sich um ein psychologisches Phänomen.
Betrachten wir nun einmal die Ergebnisse der Analyse und bringen sie in Bezug mit der gestellten Forschungsfrage und den daraus resultierenden Hypothesen.
Mit dieser Umfrage sollte überprüft werden, welche Faktoren sich wie auf die Studiendauer auswirken. Dabei sind einige Hypothesen bestätigt worden, andere widerlegt worden und die Restlichen konnten nicht eindeutig beantwortet werden, da es keinen signifikanten Unterschied zwischen den Gruppen gab. Es folgt eine Betrachtung der wichtigsten Ergebnisse.
Dabei wurde festgestellt, dass viele unserer Hypothesen nicht bestätigt sind. Dazu zählen zum Beispiel die Hypothesen das Studenten mit themenbezogenen Nebenjob weniger Zeit benötigen, Studenten mit einer Note schlechter als 2,5 benötigen länger und Studenten, die viel im Haushalt zu erledigen haben benötigen länger.
Außerdem gab es Hypothesen, wo durch eine größere Teilnehmerzahl eindeutige Aussagen entstanden wären. Denn man sieht zwischen den unterschiedlichen Gruppen immer nur kleine, aber nicht signifikante Veränderungen in der Antwortenverteilung. Dadurch ist es nicht möglich eine eindeutige Aussage zu treffen. Dazu zählt zum Beispiel die Hypothese, dass Studenten, die länger als 20h die Woche arbeiten länger benötigen (vgl. Abbildung 3). Betrachtet man zusätzlich noch die Studenten, die Zeit in ein Hobby investieren lässt sich diese Aussage bestätigen (vgl. Abbildung:4).
Resultierend kann man sagen, dass Studenten die neben dem Studium viel Zeit in anderen Sachen investieren, sei es Nebenjob, Hobby, Verein, wahrscheinlich länger für ihr Studium benötigen.
Eine Hypothese, die sich bestätigt hat, ist das Studenten, die ihr Studienfach nicht als Erstwahl studieren im Durchschnitt länger für ihr Studium benötigen (vgl. Abbildung:4). Betrachtet man nun einmal die Validität der Ergebnisse, so stellt man fest, dass wir hauptsächlich Informatikstudenten und unter diesen Studenten der Freien Universität Berlin als Teilnehmer haben. Somit ist es schwer die getroffenen Aussagen für alle anderen Universitäten zu verallgemeinern. Wodurch die Umfrage nur eine große externe Gültigkeit besitzt, wenn man Informatikstudenten an anderen Universitäten betrachten will. Jedoch sinkt die externe Gültigkeit, wenn man versucht mit Hilfe dieser Umfrage eine Aussage über weitere Studiengänge zu treffen.
Weiterhin besitzt die Umfrage und ihre Auswertung eine hohe interne Gültigkeit, denn auch bei mehrmaliger Wiederholung der Umfrage werden ähnliche Ergebnisse resultie- ren. Lediglich wenn es möglich ist mehr Teilnehmer zu rekrutieren besteht die Chance, dass einige weitere Hypothesen bestätigt werden, da wir jedoch keine Aussage darüber treffen, verletzt auch dieser Fall unsere interne Gültigkeit nicht.
Die Studie besitzt gerade für Studienanfänger mit Studienfach Informatik eine hohe Relevanz. Sie bekommen mit Hilfe der Studie einen kleinen Leitfaden, wie sie ihre Studienzeit optimieren können.
Dieses Projekt hat uns einiges offenbart und wir haben viel gelernt. Allein der Zeitaufwand, der in ein solches Projekt fließt, wurde von uns nicht so hoch eingeschätzt.
Das Thema für unser Projekt haben wir relativ schnell gefunden, jedoch die Analyse was zur Verlängerung der Studiendauer führt und welche Fragen dazu gestellt werden müssen, um unsere Hypothesen zu bestätigen oder zu widerlegen, nahm wesentlich mehr Zeit in Anspruch. Wir entwickelten einige Hypothesen und überlegten uns dazu passenden Fragen, die wir in unseren Fragebogen aufnehmen wollten. Schon allein beim Entwickeln der Fragen mussten wir ziemlich genau aufpassen, dass wichtige Fragen nicht vergessen oder falsch verstanden werden. Wir haben häufig darüber nachgedacht und diskutiert wie wir Fragen so einfach formulieren können, dass jeder Proband die Frage richtig versteht.
Dabei kamen wir die auf die Idee einen dynamischen Fragenbogen zu entwickeln, also einen Fragebogen der die Fragen anpasst Der dynamische Fragebogen stellte uns bei der Implementierung vor eine Herausforderung, die wir jedoch gut gemeistert haben.
Trotz allem gab es von einigen Probanden Antworten, die falsch waren, beispielsweise gaben einige an für ihren Bachelor 0 oder 1 Semester zu brauchen. Trotz mehrerer Pilottests haben wir auch bei einigen Fragen Antwortmöglichkeiten vergessen, wie zum Beispiel die WG als Wohnsituation. Keine der vergessenen Antwortmöglichkeiten stellte ein Problem dar. Teilnehmer die in einer WG wohnten, haben zum Beispiel das in den Freitext geschrieben und als Wohnsituation ßonstigeängegeben, da wir jedoch alle anderen Wohnsituationen abgedeckt haben, konnten nur Menschen die in einer WG wohnen „sonstige“ ankreuzen.
Bei unserer Umfrage haben 227 Studenten teilgenommen, wobei wir uns mehr erhofft haben. Dies lag unter anderem daran, dass einige Universitäten unsere Rundmail nicht über den Univerteiler schicken wollten. Auf Grund der geringen Teilnehmerzahl haben wir bei einigen Hypothesen zu wenig Teilnehmer um diese zu bestätigen/widerlegen. Die Auswertung war ebenfalls aufwendiger als wir dachten, vor allem die Analyse mit R stellte einen hohen Zeitaufwand dar. Insgesamt haben wir sehr viele Plots um unsere Hypothesen zu stützen oder zu widerlegen. Die vielen Antworten in unseren Freitextfeldern halfen uns auch sehr bei der Auswertung. Sehr gefreut haben wir uns auch über die vielen positiven Rückmeldungen, dass die Umfrage spannend, schön und kurz war, gefreut.
Leider konnten wir keine so klare Aussage treffen wie wir es uns am Anfang der Studie gewünscht hatten, was nicht zu letzt an der relativ geringen Teilnehmerzahl liegt. Das Projekt hat uns sehr viel Zeit gekostet. Schon allein für die Auswertung, die zahlreichen Diskussionen und die Vorbereitung diverser Präsentationen haben wir eine Menge an Stunden pro Woche in das Projekt investiert. Gerne hätten wir mehr Zeit und mehr Teilnehmer dafür gehabt um eventuell signifikantere Aussagen treffen zu können.
Wir haben gelernt, dass eine Studie gut durchdacht sein muss, denn ist der Fragebogen einmal fertig und freigegeben, können keine Änderungen mehr vorgenommen werden. Gibt ein Student an, dass er den Bachelor schon fertig hat, so fragen wir ihn wie lange er gebraucht hat, andernfalls wie lange er ungefähr brauchen wird.
Anhang A: Arbeitsverteilung Geschriebene Kapitel der Gruppenmitglieder: Antonia Kresse: Thema und Reflektion Benjamin Eckstein: Entwurf und Implementierung Christian Kühl: Evaluation Markus Bischoff: Analyse Anhang B: Umfrage