Welcome to the LimeSurvey Community Forum

Ask the community, share ideas, and connect with other LimeSurvey users!

Hilfe! Ungewöhnliche Zeitstempel

  • baz6927
  • baz6927's Avatar Topic Author
  • Offline
  • New Member
  • New Member
More
4 months 4 weeks ago #265884 by baz6927
Hilfe! Ungewöhnliche Zeitstempel was created by baz6927
Bitte helfen Sie uns, Ihnen zu helfen und füllen Sie alle relevanten Felder aus:
Ihre LimeSurvey Version: 5.6.26
Eigener Server oder LimeSurvey Hosting: I do not know where to find that information.
Umfrage-Thema/-Vorlage: Suspicious time stamps 
==================
Ich habe viele Antworten auf meine Studentenumfrage erhalten. Ich habe sie zunächst an Freunde, Familie und Geschäftspartner weitergegeben und sie später auf Facebook in öffentlichen Gruppen geteilt. Ich habe beschlossen, einen Zeitstempel zu verwenden, damit ich sehen kann, wann die Umfrage begonnen und beendet wurde. Ich habe weder einen Zugangscode noch ein Captcha, weil ich es nicht für wichtig hielt, da es sich nur um eine kleine Schülerumfrage handelt.

Ich brauche Ihre Hilfe, um herauszufinden, ob ich ein Problem habe und was ich tun muss:

Nachdem ich die Umfrage auf Facebook geteilt hatte, erhielt ich eine sehr große Anzahl von Beantwortungen. Allerdings habe ich vor allem nachts Beantwortungen erhalten, die mit genau demselben oder einem sehr ähnlichen Zeitstempel gruppiert sind, manchmal bis zu zehn Beantwortungen mit demselben Zeitstempel mitten in der Nacht und mehrfach über mehrere Nächte. Sie sind vollständig beantwortet und haben unterschiedliche Antworten, sind also nicht einfach gleich oder haben nur stereotype Antwortmuster/extreme Cross-User.
Ich finde es verdächtig und unrealistisch, dass so viele echte Menschen den Fragebogen zur gleichen Zeit und noch dazu mitten in der Nacht begonnen und beendet haben sollen. Ist es offensichtlich, dass ein Bot oder eine KI den Fragebogen ausgefüllt hat? Kommt das vielleicht häufiger vor?
Wenn ich davon ausgehen muss, dass meine Umfrage nicht von Menschen ausgefüllt wurde, wie sollte ich dann mit der Datenbereinigung umgehen, um wissenschaftlichen Standards zu genügen?

Gibt es einen möglichen technischen Grund, z.B. dass es einige Serveraktualisierungen/Verbindungsunterbrechungen gibt, so dass die Stempel nicht korrekt sind und deshalb später in mein System eingegeben werden, wenn sich der Server wieder eingeloggt hat?

Ich bin gespannt, was Sie beitragen können und hoffe sehr, dass ich meine Umfrage noch nutzen kann.
Grüße

Please Log in to join the conversation.

  • Joffm
  • Joffm's Avatar
  • Away
  • LimeSurvey Community Team
  • LimeSurvey Community Team
More
4 months 4 weeks ago - 4 months 4 weeks ago #265886 by Joffm
Replied by Joffm on topic Hilfe! Ungewöhnliche Zeitstempel
Bitte, nicht dieselbe Frage zur gleichen Zeit in verschiedenen Teilen des Forums.

Gut, später werde ich mich  dazu äußern.

Joffm 

Volunteers are not paid.
Not because they are worthless, but because they are priceless
Last edit: 4 months 4 weeks ago by Joffm.
The following user(s) said Thank You: baz6927

Please Log in to join the conversation.

  • Joffm
  • Joffm's Avatar
  • Away
  • LimeSurvey Community Team
  • LimeSurvey Community Team
More
4 months 4 weeks ago #265887 by Joffm
Replied by Joffm on topic Hilfe! Ungewöhnliche Zeitstempel
So, jetzt ein paar Worte von mir.

Ich würde sagen:
Wenn Du die Umfrage via Facebook so in die Welt hinaus trötest, ist die Gefahr der Beantwortung durch Bots recht groß.
Kann sein, muss natürlich nicht.

Es wäre vielleicht besser gewesen, diese - von mir so genannten - Bettelplattformen zu nutzen ("Füllst Du meinen Fragebogen aus, fülle ich Deinen aus"). Da gibt es wohl registrierte Nutzer.

Gut, was kannst Du machen?
Zunächst sagst Du, Du habest zwei Zeitstempel eingebaut. Ich verstehe das so, dass Du am Anfang und am Ende eine Gleichungsfrage mit {time()} oder Abwandlungen {gmdate("d.m.Y H:i:s",time())} oder  {date("d.m.Y H:i:s",time())} (einfach um einen lesbaren Wert zu erhalten) eingebaut hast.

Dann gibt es aber auch die sowieso vorhandenen Werte "startdate" (Datum gestartet) und "datestamp" (Datum letzte Aktivität).
Wenn man dies so macht und die Antworten anschaut, stellt man fest, dass die Funktion {gmdate("d.m.Y H:i:s",time())} um zwei Stunden nachgehen; es ist eben GMT, während {date("d.m.Y H:i:s",time())} die lokale Zeit liefert.
Ist kein Beinbruch; mir kommt es mehr auf den Vergleich der Minuten an. Gibt es hier eine große Diskrepanz?
In einem kleinen Test sieht es so aus. Stimmt also überein.
 

Das nächste ist die für die Beantwortung verbrauchte Zeit. Sind die Werte realistisch? Ist ja leicht zu sehen, wenn Du die Timings gespeichert hast.
Wenn nicht, Du hast ja die timestamps und kannst die Differenz bilden.

Jetzt etwas zum Inhaltlichen.
Gute Hinweise auf automatisierte Beantwortung liefern immer offene Fragen. 
Wenn hier nach speziellen Dingen gefragt wurde, wie Automarken, Fluggesellschaften, in Deutschland heimische Vogelarten und last but not least irgendwelche Fachinterna (wenn Du Studenten befragst, wird es sicher solche Dinge geben), kommen bots ziemlich ins Schwitzen.
Oder bei "mehrfachen kurzen Texten".
Wenn hier zum Beispiel 10 Felder angeboten wurden (meinetwegen für die Fluggesellschaften), aber nicht alle ausgefüllt werden mussten (ich kenne eben nur vier), füllen bots gerne alle Felder aus.

Gibt es spezielle Matrixfragen (also z.B. Ratings), bei denen man erwartet, dass sie mehr oder weniger sozial erwünscht beantwortet werden?
Wenn hier die Verteilung über die Antwortoptionen ziemlich gleich ist, ist es natürlich verdächtig.
Ähnlich wäre es mit Begründungen für (negative) Ratings.

Also: Texte kritisch anschauen.
Steht nur Blödsinn darin ("asd fgtrzu ghzu")?
Kann man es als sinnvoll ansehen? Dabei daran denken, dass z.B. ChatGPT eine kleine Plaudertasche ist; d.h. sie redet sich um Kopf und Kragen, was ein menschlicher Teilnehmer eher nicht machen würde.

In dieselbe Richtung gehen Mehrfachnennungen. bots füllen gerne viel (bis alles) aus.
Kann man hier Plausibilitäten prüfen.
Wenn alle männlichen Teilnehmer "rhythmische Sportgymnastik" als Lieblingssport bezeichnen, würde ich stutzig werden.

Übrigens: War es eine mehrsprachige Umfrage?

Diese ganzen Beispiele sind nicht aus der Luftgegriffen. Während meines Berufslebens hatten wir auch einmal eine sehr große Umfrage, in welcher sehr interessante kreative Fluggesellschaften auftauchten und sich alle Norweger als ausgesprochene Kricketfans outeten (klar, Mehrfachnennung, wo der bot locker fast alles ankreuzte.)

Mehr kann ich dazu  im Moment nicht sagen.
So, wie Du es schilderst, würde ich auch zu der bot-Theorie tendieren, zumindest zu einer Theorie, dass die Teilnehmer eher nicht zu Deiner Zielgruppe gehören (zu viele Teilnehmer um 3 Uhr morgens sind schon verdächtig).
Ich hatte einmal bei einer größeren Befragung in Deutschland die Antwortrate über die Tage im 3-Stunden-Takt graphisch angezeigt (kleine Fingerübung). 
Plusquamperfekt bedeutet. ich habe das Ergebnis nicht mehr.

Joffm

P.S.

I do not know where to find that information.

Naja, wenn Du LimeSurvey selbst installiert (z.B. auf einem angemieteten Webspace bei Strato, IONOS, Hetzner, und wie sie alle heißen) oder eine Installation bei der LimeSurvey GmbH bezahlt hättest, würdest Du dies wissen.
Dann gibt es nur noch die Option:
Du benutzt eine von einem Dritten irgendwo gehostete Version (Uni, Arbeitgeber);.




 

Volunteers are not paid.
Not because they are worthless, but because they are priceless

Please Log in to join the conversation.

  • Joffm
  • Joffm's Avatar
  • Away
  • LimeSurvey Community Team
  • LimeSurvey Community Team
More
4 months 4 weeks ago #265893 by Joffm
Replied by Joffm on topic Hilfe! Ungewöhnliche Zeitstempel
Noch zwei kleine Zusätze:
1. Ist Eure Serverzeit in den "Globalen Einstellungen richtig eingestellt?
Es wäre blöd, wenn hier eine Korrekturgröße eingestellt wäre, die das Ergebnis dann verfälscht.

2. Ich bezweifle zwar, dass Du die IP-Adresse gespeichert hast.
Wenn Ja, hättest Du natürlich eine gute Kontrolle, von wo (aus welchem Land) die Antworten kommen.
In meinem "Tutorial 3: Gimmicks" ist ja ein Kapitel darüber, wie man die ungefähre Position des Beantworters mittels der IP-Adresse bestimmen kann.

Joffm

 

Volunteers are not paid.
Not because they are worthless, but because they are priceless

Please Log in to join the conversation.

Moderators: holchJoffmtpartner

Lime-years ahead

Online-surveys for every purse and purpose