Analyse von logfiles: IDEE

Fragen, die sich auf kein spezielles Verfahren beziehen.

Analyse von logfiles: IDEE

Beitragvon mila » Di 6. Dez 2011, 18:36

Hallo,

unzwar möchte ich logfiles analysieren die wie im folgenden Format vorliegen:

183.121.143.32 - - [18/Mar/2003:08:05:03 +0200] "GET /images/bild.png HTTP/1.1" 200 805 "http://www.google.org/"

Ich habe also Information über die IP, Uhrzeit, was aufgerufen wurde, woher der Nutzer kommt und noch ein paar weitere Parameter. Darüber hinaus wird jedem Nutzer eine Session-ID vergeben, sodass eine eindeutige Identifikation des Nutzers möglich ist.

Nun habe ich den Datensatz erst einmal aufbereitet und nun soll es an die eigentliche Analyse gehen. Ich habe zwar konkrete Fragestellungen vorliegen:

Wie lauten IP-Adresse und Hostname des Nutzers?
Welchen Browser hat er genutzt?
Auf welcher Seite stand der Link, mit dem der Nutzer auf die Seite gekommen ist?
Welche Suchmaschine und welche Suchwörter hat er genutzt?
Wie lange blieb er auf der Website?
Wie viele Seiten ruft er dabei auf?
Auf welcher Seite hat er die Website verlassen?
Welche Ergänzungsmodule hat er installiert?
Welches Betriebssystem nutzt er?
Welche Internetseiten hat Mitarbeiter Mustermann während der Arbeitszeit besucht? (hier muss in der Regel der Betriebsrat einbezogen werden)
Woher kommt der Nutzer?

Problem ist, dass mir bei diesen Fragestellungen (kopiert aus dem Wikipedia-Artikel: http://de.wikipedia.org/wiki/Logdateianalyse) nur die reine Häufigkeitsauszählung in den Sinn kommt und ich mir sicher bin, dass es noch weitere deutlich interessante Aspekte zu untersuchen gibt die so hoffe ich über eine reine Häufigkeitsauszählung hinaus gehen.

Grüße
Mila
mila
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 23. Nov 2011, 00:49
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse von logfiles: IDEE

Beitragvon daniel » Di 6. Dez 2011, 22:23

Die Forschungsfrage/n wird/werden i.d.R. nicht aus den Daten abgeleitet, sondern stellt/stellen den Beginn einer (wissenschaftlichen) Untersuchung dar. Erwartest Du ernsthaft, dass Dir jemand anderes sagt, was Dich interessiert hat? Du musst doch einen Grund haben, warum Du logfiles analysieren willst.

Zudem klingt das hier
[...] sodass eine eindeutige Identifikation des Nutzers möglich ist [...]
Welche Internetseiten hat Mitarbeiter Mustermann während der Arbeitszeit besucht?
Woher kommt der Nutzer? [...]


Datenschutzrechtlich alles schwer bedenklich.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Analyse von logfiles: IDEE

Beitragvon mila » Di 6. Dez 2011, 23:22

hallo,

danke für deine antwort. ein freundlicherer umgangston hätt es aber auch getan.

was ich mit meiner frage hier bezwecke?
->vlt hat sich jemand schon einmal mit logfiles beschäftigt und weiß ad hoc eine mögliche herangehensweise, da sich die fragestellungen sehr ähneln (deshalb auch der wikipedia auzug der _möglichen_ fragestellungen).

grüße
mila
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mi 23. Nov 2011, 00:49
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse von logfiles: IDEE

Beitragvon daniel » Di 6. Dez 2011, 23:54

Der Ton sollte nicht unfreundlich sein. Ich meine die Fragen ernst. Um Ratschläge bezüglich Auswertunngsstartegien/Methoden geben zu können müssen wir doch wissen, was Du eigentlich vorhast. Dazu solltest Du mindestens einige der folgenden (zusammenhängenden, sich teilweise überschneidenden) Fragen beantworten.

In welchem inhaltlichen Gebiet forschst Du?
Wie lautet Deine (übergreifende) Forschungfrage?
Wieso willst Du (diese) logfiles analysieren?
Was ist Sinn und Zweck der Untersuchung?
Wer ist der Auftraggeber?
In welchem Kontext findet die Untersuchung statt?
Woher kommen die Daten?
Wie sind die Daten zustande gekommen?
Wie hoch ist die Fallzahl?

Nun habe ich den Datensatz erst einmal aufbereitet

Was heißt das genau?
In welchem Format liegen die Daten vor?

Du wirst sicher zustimmen, dass diese Fragen wohl niemand außer Dir selbst sinnvoll beantworten kann.

Übrigens sind einige meiner Bedenken ebenfalls bei WiKi verlinkt http://de.wikipedia.org/wiki/Webcontrol ... eutschland
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron