Uitleg Twittervoorspeller PS2011
Vragen en antwoorden over de Twittervoorspeller voor de Provinciale Staten 2011 gemaakt door Erik Tjong Kim Sang en Johan Bos van Informatiekunde, Rijksuniversiteit Groningen.
- Waarom hebben jullie dit programma gemaakt?
We willen laten zien wat mogelijk is met de technieken die we bij Informatiekunde dagelijks gebruiken. Daarnaast zijn we ook gewoon nieuwsgierig naar hoe goed je met behulp van Twitter de uitslag van de verkiezingen kan voorspellen! - Welke technieken gebruikt dit programma?
Het programma gebruikt:- dataselectie: berichten verzamelen van Twitter
- taalrader: selectie van Nederlandstalige berichten
- naamherkenning: selectie van berichten met partijnamen
- normalisatie: herken de verschillende versie van dezelfde naam
- sentimentanalyse: onderscheid positieve van negatieve berichten
- spamfiltering: verwijder dubbele berichten van dezelfde gebruiker
- analyse: samenvatten data in statistieken
- visualisatie: laat de statistieken op een mooie manier zien
- Op hoeveel Twitterberichten zijn deze voorspellingen gebaseerd?
De dagelijkse voorspellingen zijn gebaseerd op 1,75 miljoen Nederlandstalige Twitterberichten. Daarvan worden ongeveer 5000 gebruikt voor de schatting van het aantal zetels. Dit aantal zal oplopen naarmate de verkiezingen dichterbij komen als mensen vaker gaan schrijven over de verkiezingen.dag vd week totaal gebruikt maa 20110221 1809469 4024 din 20110222 1681364 3667 woe 20110223 1793126 4440 don 20110224 1717417 5179 vri 20110225 1922835 5157 zat 20110226 1638176 5126 zon 20110227 1859276 4578 - Hoe betrouwbaar zijn deze voorspellingen?
Het voorspelde aantal zetels per partij kan per dag nogal verschillen. De dagvoorspellingen zijn waarschijnlijk niet erg betrouwbaar. De voorspellingen die een week van Twitterberichten zijn constanter en komen dicht in de buurt van de Politieke Barometer. Wij willen de weekvoorspellingen van dinsdagnacht gaan vergelijken met de verkiezingsuitslag. - Dit zijn landelijke voorspellingen. Waarom geen voorspellingen voor Groningen?
Er is te weinig data beschikbaar op Twitter om een betrouwbare voorspelling te doen voor de uitslag van de provincie Groningen. We zijn wel aan het kijken of we de bercihten van Groningse Twitteraars apart kunnen verzamelen. Hiervoor is het nodig om te bepalen wat de locatie is van de Twittergebruiker. - Gaan de coalitiepartners een meerderheid halen in de Eerste Kamer?
Volgens onze weekvoorspelling van zondag 27 februari halen de drie coalitiepartijen net een meerderheid, 38 zetels. Het wordt dus spannend! - Wat kan er nog worden verbeterd aan de Twittervoorspeller?
Er zijn diverse onderdelen van het systeem die we nog kunnen verbeteren. Maar onze grote wens zou zijn om meer te weten te komen over de mensen achter de berichten, bijvoorbeeld geslacht en leeftijd. Daarmee zouden we de effecten van de demografie van Twittergebruikers kunnen meenemen in de voorspellingen. Maar dit soort gegevens kunnen we van Twitter niet krijgen, waarschijnlijk wel van Facebook. (In Nijmegen is er net een project gestart waarin demografische gegevens van Nederlandse Twittergebruikers worden verzameld). - Kan ik de voorspellingen ook op Internet bekijken?
Jazeker, het adres is http://ifarm.nl/ps2011 - Help! Ik kan de grafieken niet zien!
De grafieken van de Twittervoorspeller zijn getekend in het formaat svg (scalable vector graphics). Het kan voorkomen dat je een extra plugin moet downloaden om de plaatjes te kunnen bekijken (zie Adobewebsite voor meer informatie). - Waarom past de webpagina niet op mijn scherm?
De webpagina is ontworpen voor een groot scherm (1920x1080) in de kantine van het Letterengebouw in Groningen. De meeste browsers hebben wel knoppen waarmee je kunt uitzoomen totdat de pagina op het scherm past, bijvoorbeeld Alt-min en Alt-plus in Internet Explorer. - Kunnen de grafieken ook groter worden gemaakt?
Door in te zoomen op de grafieken kan je ze zo groot krijgen als je wilt. Je kan ook op de titel van een grafiek klikken om een grotere versie te bekijken. - Hoe goed werkten de voorspellingen via Twitter?
De weekvoorspelling voor de periode woensdag 23 februari - dinsdag 1 maart 2011 worden gebruikt om te meten hoe goed de voorspellingen via Twitter waren:Partij Uitslag Pol.Bar De Hond Twitter VVD 16 14 16 14 PvdA 14 12 11 10 CDA 11 9 9 10 PVV 10 11 12 14 SP 8 9 9 7 D66 5 7 5 8 GroenLinks 5 4 4 6 ChristenUnie 2 3 3 2 SGP 1 2 2 1 PvdD 1 1 2 2 50Plus 1 2 2 0 overige 1 1 0 1 coalitie 37 34 37 38 afwijking - 14 14 18 Kleuren: groen: correcte voorspelling; zwart: 1 zetel afwijking; rood: 2 of meer zetels afwijking
Volgens de cijfers verzameld via Twitter zou de coalitie nipt een meerderheid van 38 zetels in de Eerste Kamer halen.
Bronnen: peilingen Politieke Barometer (Synovate), Maurice de Hond (PDF) en Informatiekunde, RUG (met Twitter)
Last update: 25 May 2011, erikt(at)xs4all.nl http://ifarm.nl/ps2011