iFarm.nl

Main menu:

filler
facebook

Quizzen
  Films
  Acteurs
  Actrices
  Albums
  Asterix
  Kuifje
  Nederlanders
  Belgen

Stripverhalen
  Asterix
  Guust Flater
  Kleine Robbe
  Lucky Luke
  Paling en Ko
  Smurfentaal
  en meer...

Overige
  Grappige nummerplaten
  Molbeurs
  Tour-de-France-spel
  Wie is de Mol?

Recent gelezen

het geheugenpaleis

basisboek social media

the third screen

Op de boekenplank

Gelezen in 2011

Gelezen in 2010

Gelezen in 2009

Gelezen in 2007

Gelezen in 2005/2006

Doorzoek blog

Feeds

Categorieën

Archieven

november 2014
Z M D W D V Z
« jan    
 1
2345678
9101112131415
16171819202122
23242526272829
30  

Archief voor 'verkiezingen'

Paper: Verkiezingen voorspellen met Twitter

twitter In 2011 heb ik samen met mijn collega Johan Bos een methode ontwikkeld om de resultaten van de Provinciale Statenverkiezingen van maart te voorspellen. We hebben deze methode gebaseerd op een onderzoek uit 2010 waarbij het tellen van tweets voldoende was om de resultaten van Duitse verkiezingen te voorspellen. Zo gemakkelijk ging het niet bij ons. We hebben nog van alles extra moeten doen (sentimentanalyse en demografienormalisatie) om een beetje in de buurt te komen van de verkiezingsuitslagen. En zelfs daarmee waren onze voorspellingen nog iets slechter dan die van Maurice de Hond.

Nu hebben we alles netjes opgeschreven en ons paper is geaccepteerd voor de EACL-workshop Semantic Analysis in Social Networks (april 2012, Avignon, Frankrijk). Bij het literatuuronderzoek voor het paper vonden we nog een ander paper waarin het eerste Duitse onderzoek was overgedaan. Daarin zat stevige kritiek op het eerste onderzoek. Zo bleken de onderzochte partijen zo te zijn geselecteerd dat de voorspellingen goed uitkwamen. En toen ze bij de tweets de missende week van vlak voor de verkiezingen toevoegden werden de voorspellingen ook een stuk slechter dan vermeld in het eerste onderzoek. Daarom lukte het dus bij hen een stuk beter dan bij onze experimenten!

De huidige literatuur is pessimistisch over de mogelijkheid om met Twitter verkiezingen te kunnen voorspellen, wat blijkt uit papertitels als How (Not) To Predict Elections. Met deze kennis en met de wetenschap dat we ons systeem flink hadden afgestemd op oude verkiezingsvoorspellingen, hebben we een extra experiment uitgevoerd. We hebben de tweets verwijderd, ons systeem opnieuw getraind op de verkiezingsvoorspellingen en vervolgens zonder invoer(!) de verkiezingen opnieuw voorspeld. De foutmarge van het systeem nam af met meer dan de helft! Zonder tweets deed het systeem het plotseling wel een stuk beter dan de Politieke Barometer en Maurice de Hond. Wat moeten we hiervan denken? Hebben tweets dan juist een negatieve invloed op verkiezingsvoorspellingen? Of hebben we bij dit extra experiment gewoon geluk gehad? We weten niet goed hoe we dit resultaat moeten interpreteren. De discussiesectie van het paper eindigt dan ook met heel veel vraagtekens.

Bij deze een link naar een pdf van het paper en de bijbehorende datasets voor de geïnteresseerden:

Predicting the 2011 Dutch Senate Election Results with Twitter, by Erik Tjong Kim Sang and Johan Bos. In: Proceedings of SASN 2012, the EACL 2012 Workshop on Semantic Analysis in Social Networks, Avignon, France, 2012 (data.zip)

Verkiezingen voorspellen met Twitter

20110303 Bij Informatiekunde aan de RUG hebben we deze week geprobeerd de uitslagen van de Provinciale Statenverkiezingen te voorspellen via Twitter. Het is erg eenvoudig: je verzamelt alle Nederlandstalige Twitterberichten met een partijnaam erin, gooit de dubbele en de negatieve weg, telt wat overblijft en zet de resultaten om in aantallen zetels in de Eerste Kamer. Vervolgens hebben we daar een webdemo omheen gebouwd en die op een groot scherm in de kantine van Letteren geplaatst. We hebben hier veel enthousiaste reacties op gekregen.

De verkiezingen zijn nu voorbij en iedereen wil natuurlijk weten hoe goed onze voorspellingen waren. Er zijn nog geen officiële uitslagen maar volgens de prognoses hebben we van 2 partijen het correcte aantal zetels voorspeld (CU en SGP) en zaten we er in totaal 18 zetels naast. De twee grote peilingen Politieke Barometer en Maurice de Hond hadden voor respectievelijk 1 en 2 partijen het aantal zetels goed en zaten er in totaal 14 zetels naast.

Voor de korte tijd die we hier in hebben gestoken (2 weken) is dit een aardig resultaat. We willen nu de webdemo gaan aanpassen aan aantallen zetels in de Tweede Kamer. Als dat werkt, dan hebben we gratis en voor niets een dagelijkse voorspelling van de zetelverdeling in het parlement, handig voor de volgende verkiezing.

Welke peiling had het goed in 2010?

De peilingen voor de Tweede-Kamerverkiezingen zaten er ook in 2010 weer flink naast:

             PB DH PA BS FI
      VVD 31 33 34 35 36 33  0x goed
     PvdA 30 30 30 28 30 31  3x goed
      PVV 24 17 18 18 15 17  0x goed
      CDA 21 24 24 24 23 27  0x goed
       SP 15 14 13 13 14 12  0x goed
       GL 10 11 11 11 10  9  1x goed
      D66 10 10 11 11 11 11  1x goed
       CU  5  6  6     7  6  0x goed
      SGP  2  3  2     2  2  3x goed
     PvDD  2  2  1     2  2  3x goed
   overig          10
afwijking  - 16 18 20 20 22
 

Vijf peilingen voorspelden de zetelaantallen van 10 partijen en hadden het daarbij slechts 11 keer goed. Van vijf partijen werd door niemand het zetelaantal goed voorspeld: VVD, CDA, PVV, SP en CU. Net als vier jaar geleden kwam de Politieke Barometer weer het dichtstbij, deze keer met 16 zetels afwijking en 3 zetelaantallen goed voorspeld. De Hond, de Politieke Aandelenmarkt, de Binnenhof Stock Exchange en Fispr deden het allemaal slechter. De gebruikte aantallen zijn de laatste beschikbare aantallen van de verkiezingsochtend.

Struikelblokken voor de voorspellers waren de VVD (afwijking in totaal 16 zetels), het CDA (17) en de PVV (35!). Na de ervaringen met de peilingen van 2006 had ik zelf 30-30-25-25-10-10-10-6-2-2 ingeschat, met extra zetels voor de PVV die waren weggehaald bij VVD en de SP. Ik zat er uiteindelijk 12 zetels naast met 5 correct voorspelde aantallen. Op Fok zat iemand met een afwijking van 11 zetels.

Het is nog altijd een uitdaging voor de voorspellers om de zetelaantallen van de partijen met extreme ideeën goed te voorspellen.

Stemwijzer

20100508 Vandaag las ik in het nieuws dat de Stemwijzer online was gekomen. Dit is een website waar je je eigen mening kunt vergelijken met de programma’s van de partijen die meedoen aan de TweedeKamerverkiezingen van 9 juni 2010. Nadat ik de 30 vragen op de website had ingevuld, kreeg ik het advies om op de Partij van de Dieren te stemmen. Een merkwaardige suggestie waar ik zeker geen gebruik van ga maken.

Naast een vergelijking met partijprogramma’s geeft de website ook de mogelijkheid om jouw mening te vergelijken met het stemgedrag van de partijen in de Tweede Kamer: de Stemmentracker. Dit geeft een eerlijker beeld want het komt nogal eens voor dat partijen zich niet aan hun verkiezingsprogramma houden. Ik heb dus opnieuw 30 ja-nee-vragen ingevuld. Nu kwam ik op D66 of de VVD uit, tenminste 1 redelijk alternatief, maar de uitslagpagina was verder erg onduidelijk. Je kon niet zien hoe vaak jouw antwoorden overeenkwamen met die van de partijen en als je wilde weten of een partij voor 1 vraag hetzelfde had gestemd als jij dan moest je in twee kolommen kijken, erg onhandig.

Omdat ik geinteresseerd was in deze getallen, heb ik zelf maar een Perlscript geschreven om ze boven water te halen. Dat was schrikken! De meest overeenkomende partijen stemden maar 18 van de 30 keren hetzelfde als ik. Nog erger was het met de keuze van de meerderheid: slechts 15 keer kwam die overeen met wat ik zou hebben gestemd. En we hebben het over stemsituaties met alleen de keuzes voor of tegen. Iemand die 30 keer een muntje had opgegooid, had evenveel overeenkomsten gehad met de meerderheidskeuzes. Zijn mijn meningen zo extreem? Moet ik misschien een eigen partij oprichten?

Interessant is het ook om te kijken hoe vaak de stemmen van elke partij overeenkwamen met de beslissing van de meerderheid. Daarvoor krijg je dit lijstje: 1. 26x CDA; 2. 25x PvdA; 3. 23x CU; 4. 20x GL; 5. 19x VVD en SGP; 7. 18x D66; 8. 16x PVV;
9. 14x PvdD en SP; en 11. 13x Verdonk. De coaltiepartijen CDA, PvdA en CU staan bovenaan. Niet zo vreemd want ze vormen samen het grootste machtsblok. Partij Verdonk staat onderaan maar dat komt doordat de partij bij 5 stemmingen niet aanwezig was (genormaliseerde score: 15,6). De PvdD en de SP zijn interessant voor hun kiezers maar de partijen krijgen in de Kamer niet vaak hun zin.

Het wordt nog lastig om straks een goede keuze te maken in het stemhokje.

Ferry Haan (PAM) legt uit

20061124

In een uitzending van RTL Z (video) heeft Ferry Haan van de Volkskrant aangegeven waarom hun Politieke Aandelenmarkt het bij de Tweede-Kamerverkiezingen slechter heeft gedaan dan verwacht:

  • De waarde van het aandeel SP was kunstmatig begrensd op maximaal 15%. Daardoor kon het nooit het correcte waarde halen (16,6%).
  • Er werd gehandeld in hele procenten. Daardoor was de minimumwaarde van een aandeel 1%. Hierdoor was het voor de PAM onmogelijk om te voorspellen dat een partij 0 zetels zou halen.

Hieruit volgen meteen twee verbeterpunten voor de volgende keer. Het begrenzen van de prijs van aandelen is eenvoudig op te lossen en dat je ook in kleinere waarden kan handelen, bewees de Binnenhof Stock Exchange, waar de prijs van de partijen per honderdste zetelpunt kon worden vastgesteld. Als de PAM daarnaast ook overschakelt van percentages op zetelaantallen dan kan bij de volgende verkiezingen een nauwkeurigere voorspelling worden verwacht.

Verwante artikelen op deze blog: Welke peiling had het goed? en Voorspellingsbeurzen.

Welke peiling had het goed?

20061103

De verkiezingen zijn voorbij. De kiezers hebben gesproken. De afgelopen weken hebben we diverse peilingen langs zien komen. Regelmatig voorspelden ze andere uitslagen. Maar welke peiling had het nu bij het rechte eind?

           TK BSX INT HON NIP PAM FIS cor
     CDA   41  41  41  42  41  42  45   3
    PvdA   33  38  37  38  31  37  41   0
      SP   25  23  23  23  32  21  19   0
     VVD   22  22  23  22  21  24  24   2
     PVV    9   4   4   5   6   4   3   0
      GL    7   7   7   8   5   9   6   2
      CU    6   6   6   6   8   4   5   3
     D66    3   3   3   2   1   4   2   2
     SGP    2   2   2   2   3   1   2   4
    PvdD    2   2   2   1   2   1   2   4
     1NL    0   2   1   1   0   1   1   1
     LPF    0   0   1   0   0   3   0   4
     PvN    0   0   0   0   0   1   0   5
    afwi    -  14  14  16  18  30  30   -
 

Bovenstaande tabel laat voor zes verschillende peilmethoden zien hoeveel zetels ze voorspelden voor de 13 belangrijkste politieke partijen. De linkerkolom cijfers (TK) geeft de correcte zetelverdeling aan. De laatste kolom (cor) geeft aan hoeveel peilers het correcte zetelaantal voor die partij voorspelden. De onderste regel (afwi) laat zien hoeveel zetels ze er in totaal naast zaten (+2 voor PAM vanwege een incorrect totaal).

Alle zes onderzochte voorspellers blijken er behoorlijk naast te hebben gezeten. Als we kijken naar het voorspelde aantal zetels per partij, dan blijken er drie partijen zetelaantallen te hebben behaald die door niemand werden voorspeld. Alle peilingen en aandelenmarkten onderschatten het aantal zetels van de PVV van Geert Wilders. Ook het aantal zetels van de SP werd meestal onderschat terwijl het aantal zetels van de PvdA juist meestal te hoog werd ingeschat.

Als we kijken naar de totale afwijkingen in aantal zetels, dan zijn de Binnenhof Stock Exchange (BSX) en Interview/NSS de beste met een afwijking van 14 zetels. Interview/NSS was ook bij de Tweede-Kamerverkiezingen van 2003 al de beste, toen met een totale afwijking van slechts 6 zetels. Het bureau was drie jaar geleden een stuk beter dan de rest: TNS NIPO (12), Maurice de Hond (14) en de PAM (16). Als we die totalen vergelijken met de huidige aantallen dan is de conclusie dat de uitslag van de verkiezingen van 2006 meer verrassende resultaten heeft opgeleverd dan in 2003.

De eerder in deze blog besproken voorspellingsbeurzen laten een wisselend beeld zien. De BSX doet het goed maar de Politieke Aandelenmarkt (PAM) is nu voor de tweede opeenvolgende keer de slechtste (in 2006 samen met FISPR). Hoe zou dit komen? Misschien is het inschatten van de verschillende percentages op de PAM te lastig voor deelnemers maar de BSX laat zien dat het met zetelaantallen wel kan. Anders kan het komen doordat er op de Tweede-Kamermarkt van de PAM weinig geld is te verdienen, in ieder geval voor aandelen van de grotere partijen (kleinere winstmarges). Kleinere winsten kunnen hebben geleid tot een kleiner aantal deelnemers en slechtere voorspellingen.

Update (24/11): de verwachte aanpassing van het aantal zetels van de PvdA (33) en de SP (25) zijn in de tabel verwerkt. Daardoor is behalve TNS NIPO iedere voorspelling er twee zetels op vooruit gegaan.

Voorspellingsbeurzen

20061116 Een voorspellingsbeurs is een beurs waar wordt gehandeld wordt in virtuele aandelen die betrekking hebben op een toekomstige gebeurtenis. De waarde van de aandelen blijkt, bij voldoende diverse deelnemers aan de beurs, de mogelijke uitkomsten van de gebeurtenis goed te kunnen voorspellen. Een beroemd voorbeeld uit Amerika is de Hollywood Stock Exchange die vier jaar geleden 35 van de 40 Oscarwinnaars wist aan te wijzen. Voorspellingsbeurzen (Engels: prediction markets) worden onder andere besproken in James Surowiecki’s boek over massaintelligentie: The Wisdom of Crowds. Why the Many Are Smarter Than the Few.

Ook voor de aanstaande Nederlandse verkiezingen bestaat er een voorspellingsbeurs: de Politieke Aandelenmarkt van de Volkskrant. Deelnemers kunnen daar maximaal 100 euro inzetten op de uitslag van de verkiezingen, de te vormen coalitie en de nieuwe premier. RTL Z heeft een nieuwsitem over het principe achter de site (video). Als de beurs het even goed doet als die in Amerika dan is er een grote kans dat er straks een kabinet CDA-PvdA aan de macht komt met Balkenende als premier.

Update (20/11): op Sargasso loopt een vergelijkbaar verkiezingsexperiment.

Update (21/11): ook relevant: de Binnenhof Stock Exchange.

Stemmentracker

20061114 Eindelijk een redelijke stemwijzer: Stemmentracker. Anders dan bij de officiële Stemwijzer krijg je bij elke vraag een korte uitleg over het onderwerp van de vraag. Handig! Maar het beste is dat Stemmentracker is gebaseerd op wat partijen hebben gestemd in de Tweede Kamer. Niks van programma’s met beloftes: je kan de partijen op hun daden vergelijken.

Bij de resultaten krijg je van elke partij te zien hoe zij stemde over de thema’s van de 30 vragen. Dit maakt interessante analyses mogelijk. Bijvoorbeeld: wie stemden het vaakst op dezelfde manier?

20061114b

Bovenstaande grafiek geeft met verbindingslijntjes aan welke partijen 19 keer of vaker hetzelfde stemden voor de 30 stellingen. De uitkomst is geen grote verrassing. De drie regeringspartijen, CDA, VVD en D66, stemden vaak gelijk. De twee kleine christelijke partijen ChristenUnie en SGP steunden het CDA. En de LPF, nog in het vorige kabinet samen met CDA en VVD, stemde nog steeds met deze twee mee. PvdA, SP en GroenLinks vormden een apart links blok.

Het wordt nog interessanter als je de partijstemmen vergelijkt met wat een meerderheid van de deelnemers aan Stemmentracker wil. Welke partijstemmen kwamen het meest overeen met wat het Nederlandse volk wil?

  • SP (21)
  • LPF (20)
  • PvdA (19)
  • GroenLinks (19)
  • D66 (15)
  • CDA (15)
  • ChristenUnie (14)
  • VVD (13)
  • SGP (10)

Het linkse blok aangevuld met de LPF voert de lijst aan, op ruime afstand gevolgd door de coalitiepartners en de kleine christelijke partijen. Opvallend. Natuurlijk moet de regering niet altijd doen wat het volk wil maar een gemiddelde score van onder de 50% voor de coalitiepartners is lager dan verwacht.

Smurfentaal

smurf

Vorige week kregen we op het werk (Universiteit van Amsterdam) een samenvatting van een lezing binnen. De tekst bevatte zoveel moeilijke woorden dat één van de collega’s zuchtte dat je ze net zo goed door “smurf” zou kunnen vervangen. Een programma dat dat deed, was beschikbaar op het web maar alleen voor het Engels. Sinds vandaag kan je via deze site teksten vertalen van het Nederlands naar Smurfentaal.

De reacties op het vertaalprogramma zijn erg positief. Een andere collega heeft de software nu ingezet op zijn site over de verkiezingen. Hij heeft een fun-versie gemaakt waarin je kan zoeken in versmurfte verkiezingsprogramma’s. Enkele resultaten: Smurfrenteaftrek: niet aan smurfen (VVD); Veel mensen die een eigen huis willen, hebben weinig te smurfen (GroenLinks); Smurfenmishandeling wordt strenger besmurft (PvdA). Aanbevolen!

Amsterdam stemt met potlood

20061103

In Amsterdam zal tijdens de landelijke verkiezingen van 22 november met potlood en papieren biljetten worden gestemd. Minister Nicolaï heeft de stemmachines van het bedrijf SDU afgekeurd omdat ze afluisterbaar zijn. De stemcomputers zouden in 35 gemeenten worden gebruikt en er zijn maar voor 11 gemeenten reserves beschikbaar. De andere 24 gemeenten, waaronder Amsterdam, gaan over op het stempotlood.

Dit bericht is een overwinning voor de groep “Wij vertrouwen stemcomputers niet“. De leden van de groep wijzen van stemmachines om twee redenen af. Ten eerste maakt het gebruik van de computers het mogelijk dat een paar technici de verkiezingen in heel het land verstoord. De stemcomputers zijn eenvoudig te manipuleren, zoals de groep heeft aangetoond. Ten tweede kunnen de stemmen uitgebracht via de stemmachines bij een eventueel dispuut niet achteraf worden gecontroleerd omdat er geen betrouwbaar archiefmateriaal is. “Wij vertrouwen stemcomputers niet” wil daarom van de stemcomputers af maar heeft voor de komende weken geen nieuwe acties gepland omdat ze de verkiezingen niet wil verstoren.