iFarm.nl

Main menu:

filler
facebook

Quizzen
  Films
  Acteurs
  Actrices
  Albums
  Asterix
  Kuifje
  Nederlanders
  Belgen

Stripverhalen
  Asterix
  Guust Flater
  Kleine Robbe
  Lucky Luke
  Paling en Ko
  Smurfentaal
  en meer...

Overige
  Grappige nummerplaten
  Molbeurs
  Tour-de-France-spel
  Wie is de Mol?

Recent gelezen

het geheugenpaleis

basisboek social media

the third screen

Op de boekenplank

Gelezen in 2011

Gelezen in 2010

Gelezen in 2009

Gelezen in 2007

Gelezen in 2005/2006

Doorzoek blog

Feeds

Categorieën

Archieven

mei 2013
Z M D W D V Z
« mrt    
 1234
567891011
12131415161718
19202122232425
262728293031  

Grodil proefschrift 100

20120416 Vandaag kreeg ik hem dan: het honderdste Grodilproefschift: Neural Correlates of Prosody and Information Structure, op donderdag 10 mei 2012 te verdedigen door Diana Dimitrova. 100 proefschriften in de Grodilreeks in 21 jaar, wat begon met de eerste van Henriette de Swart in 1991. Dit is een mijlpaal!

Paper: Verkiezingen voorspellen met Twitter

twitter In 2011 heb ik samen met mijn collega Johan Bos een methode ontwikkeld om de resultaten van de Provinciale Statenverkiezingen van maart te voorspellen. We hebben deze methode gebaseerd op een onderzoek uit 2010 waarbij het tellen van tweets voldoende was om de resultaten van Duitse verkiezingen te voorspellen. Zo gemakkelijk ging het niet bij ons. We hebben nog van alles extra moeten doen (sentimentanalyse en demografienormalisatie) om een beetje in de buurt te komen van de verkiezingsuitslagen. En zelfs daarmee waren onze voorspellingen nog iets slechter dan die van Maurice de Hond.

Nu hebben we alles netjes opgeschreven en ons paper is geaccepteerd voor de EACL-workshop Semantic Analysis in Social Networks (april 2012, Avignon, Frankrijk). Bij het literatuuronderzoek voor het paper vonden we nog een ander paper waarin het eerste Duitse onderzoek was overgedaan. Daarin zat stevige kritiek op het eerste onderzoek. Zo bleken de onderzochte partijen zo te zijn geselecteerd dat de voorspellingen goed uitkwamen. En toen ze bij de tweets de missende week van vlak voor de verkiezingen toevoegden werden de voorspellingen ook een stuk slechter dan vermeld in het eerste onderzoek. Daarom lukte het dus bij hen een stuk beter dan bij onze experimenten!

De huidige literatuur is pessimistisch over de mogelijkheid om met Twitter verkiezingen te kunnen voorspellen, wat blijkt uit papertitels als How (Not) To Predict Elections. Met deze kennis en met de wetenschap dat we ons systeem flink hadden afgestemd op oude verkiezingsvoorspellingen, hebben we een extra experiment uitgevoerd. We hebben de tweets verwijderd, ons systeem opnieuw getraind op de verkiezingsvoorspellingen en vervolgens zonder invoer(!) de verkiezingen opnieuw voorspeld. De foutmarge van het systeem nam af met meer dan de helft! Zonder tweets deed het systeem het plotseling wel een stuk beter dan de Politieke Barometer en Maurice de Hond. Wat moeten we hiervan denken? Hebben tweets dan juist een negatieve invloed op verkiezingsvoorspellingen? Of hebben we bij dit extra experiment gewoon geluk gehad? We weten niet goed hoe we dit resultaat moeten interpreteren. De discussiesectie van het paper eindigt dan ook met heel veel vraagtekens.

Bij deze een link naar een pdf van het paper en de bijbehorende datasets voor de geïnteresseerden:

Predicting the 2011 Dutch Senate Election Results with Twitter, by Erik Tjong Kim Sang and Johan Bos. In: Proceedings of SASN 2012, the EACL 2012 Workshop on Semantic Analysis in Social Networks, Avignon, France, 2012 (data.zip)

Film: The Girl with the Dragon Tattoo

20120114 Vanavond ben ik naar de film The Girl with the Dragon Tattoo geweest. Het is een Amerikaanse verfilming van David Fincher (van Se7en) van het eerste boek van de Milleniumtrilogie van Stig Larsson. Ik heb het boek niet gelezen en heb de Zweedse verfilming niet gezien dus voor mij was het een geheel nieuw verhaal. Daniel Craig (van James Bond) probeert samen met zijn assistente Rooney Mara een 40-jarige moord in de familie van Christopher Plummer (van The Sound of Music) op te lossen. Een spannende film maar ook vreemd omdat hij in Zweden is opgenomen met mensen die Engels spreken. Een sterke rol van Rooney Mara als autistische punker die erg goed is in juridisch onderzoek. Cijfer: 9 uit 10 (trailer)

Top 2000 herschikt

20111225 Vandaag zijn de radiouitzendingen van de Top 2000 begonnen: de lijst van favoriete muziek gebaseerd op stemmen van meer dan drie miljoen Nederlanders. In de twaalf jaar dat de lijst wordt samengesteld zijn er twee standaardklachten over: in de lijst zijn bepaalde muziekgenres ondervertegenwoordigd en de recente nummers staan door hun actualiteitswaarde te hoog in de lijst.

Aan de eerste klacht kan je als buitenstaander weinig doen. Oplossing hiervan vereist een grotere lijst van muzieknummers waarop de deelnemers kunnen stemmen. De tweede klacht kan op verschillende manieren worden opgelost. Een veelgehoord voorstel is om geen nummers van de laatste x jaar in de lijst toe te laten. Dat lost niet alle problemen op zoals we zagen in 2009. Ramses Shaffy overleed vlak voor de deadline van het inzenden van de deelnemerslijstjes. Vijf van zijn liedjes, bijna allemaal van voor 1980, kwamen toen in de Top 100 van de lijst terecht.

Er is niks mis met recente nummers in de lijst maar het is wel vreemd als ze meteen in de Top van de lijst terecht komen. De meeste van dat soort nummers handhaven zich daar niet en zakken daarna langzaam weg. Je kunt zeggen dat hun eerste positie een overschatting is van hun eeuwigheidswaarde. We kunnen deze kennis in de lijst verwerken door de top voor te behouden aan nummers die al meerdere jaren voor de lijst zijn genomineerd. Het aantal jaren dat je hiervoor gebruikt is arbitrair maar ik heb daarvoor 5 gekozen. We kunnen dan de positie van een nummer corrigeren met de volgende formule:

   score = positie * jaren/5 + 2000-(jaren*400)
 

De score bepaalt dan de nieuwe positie van een nummer in de lijst: hoe lager de score, hoe beter de plaats van het nummer.

Als een nummer de afgelopen 5 jaar in de lijst stond dan is jaren gelijk aan 5 en dan is de score gelijk aan de huidige positie van het nummer in de lijst. Als het nummer nieuw is in de lijst dan is jaren gelijk aan 1 en dan wordt score ongeveer 2000-(1*400) = 1600 hoger dan de huidige positie. Hoe hoger de score, hoe lager de nieuwe positie op de lijst. Nieuwe nummers komen dus een stuk lager te staan door deze positiecorrectie.

Eens kijken wat het effect is op de lijst van 2011:

pnie poud j  score
   1    1 5    1.0      Queen   Bohemian rhapsody
   2    2 5    2.0      Eagles  Hotel California
   3    3 5    3.0      Deep Purple     Child in time
   4    4 5    4.0      Boudewijn de Groot      Avond
   5    5 5    5.0      Led Zeppelin    Stairway to heaven
   6    7 5    7.0      Pink Floyd      Wish you were here
   7    8 5    8.0      Coldplay        Clocks
   8   10 5   10.0      Bruce Springsteen       The river
   9   11 5   11.0      Meat Loaf       Paradise by the dashboard light
  10   12 5   12.0      Pink Floyd      Comfortably numb
....
 381   73 4  458.4      Jeff Buckley    Hallelujah
 674    9 3  805.4      Coldplay        Viva la vida
1090   48 2 1219.2      Caro Emerald    A night like this
1470    6 1 1601.2      Adele   Someone Like You
2000 2000 2 2000.0      Nathalie Imbruglia      Torn
 

De regels in bovenstaande lijst bevatten: 1. de nieuwe positie; 2. de oude positie (2011); 3. het aantal jaren in de lijst gemeten over de laatste vijf edities; 4. de score; 5. de artiest; 6. de titel van het nummer.

In de top 10 verandert weinig. Meat Loaf en Pink Floyd schuiven de top 10 binnen omdat zij al vijf jaar op rij in de lijst staan, net als de andere acht. Het nieuwe nummer van Adele valt terug van plaats 6 naar 1470 door de jarencorrectie in de score (+1600). Viva la vida staat er pas drie jaar in en zakt van 9 naar plaats 674. Jeff Buckley heeft het hoogst genoteerde nummer dat vier jaar in de lijst staat en Caro Emerald heeft het hoogste nummer dat er 2 jaar instaat. De score kan nooit hoger worden dan 2000 dus Natalie Imbruglia blijft onveranderd op plaats 2000 staan.

De Top2000-lijst ziet er zo een stuk beter uit!

Volledige herschikte lijst: tekstbestand | Excelbestand

Film: The Adventures of Tintin

20111223 Vanavond is het er eindelijk van gekomen om de nieuwe Kuifjefilm van Spielberg in de bioscoop te bekijken. Het is een vreemde film: een mix van een animatiefilm met een film met acteurs maar wel erg knap gemaakt. Het centrale plot komt uit het album Het geheim van de Eenhoorn maar in de film zit ook een flinke stuk uit De krab met de gulden scharen, het album waarin Kuifje voor het eerst kapitein Haddock ontmoet. Kapitein Haddock wordt sterk neergezet door Andy Serkis, de man die eerder Gollem speelde in The Lord of the Rings. Ik kijk al uit naar het beloofde vervolg, De schat van Scharlaken Rackham, waarin Kuifje voor het eerst professor Zonnebloem tegenkomt. Cijfer voor deze film: 7 uit 10 (trailer)

Film: In Time

20111124 In Time speelt zich af in een toekomst waarin iedereen 26 levenjaren heeft die kunnen worden verlengd door extra tijd te verdienen. Justin Timberlake speelt Will Salas, een inwoner van een ghetto die continu uren moet sprokkelen om de volgende dag te halen. Hij ontdekt dat er mensen zijn met duizenden jaren op hun levensklok en probeert aan deze ongelijkheid een einde te maken. Interessant en origineel thema maar het plot van de film rammelt hier en daar. Cijfer: 7 uit 10 (trailer)

Stemmen voor de TOP2000

20111120 Voor het eerst heb ik dit jaar gestemd voor de TOP2000, een jaarlijks radioprogramma dat de 2000 favoriete nummers van de luisteraars uitzendt. In 2009 was ik het al van plan maar toen liet ik mij afschrikken door het feit dat enkele van mijn favoriete nummers niet op “De Radio2lijst” stonden, de lijst van bijna 4000 nummers waaruit de stemmers mogen kiezen. Dit jaar ontdekte ik dat je zelf ook andere nummers kan toevoegen, dus heb ik weer een top10lijst gemaakt en die opgestuurd. Hieronder staat de lijst. Links verwijzen naar YouTubefilmpjes van het desbetreffende nummer:

  1. Mike Oldfield – To France (1984)
  2. Tears for Fears – Sowing the Seeds of Love (1989)
  3. The Hollies – The Air That I Breathe (1974)
  4. ABBA – One Of Us (1981)
  5. Billy Joel – Leningrad (1989)
  6. Eminem & Dido – Stan (2000)
  7. Alanis Morisette – Ironic (1996)
  8. Melanie C & Lisa Lopes – Never Be the Same Again (2000)
  9. Gloria Gaynor – I Will Survive (1979)
  10. Ricky Martin – Livin La Vida Loca (1999)

Vier nummers van mijn muzieklijst van 2009 keren terug in deze lijst. Hoogste nieuwe binnenkomer is The Air That I Breathe van The Hollies op plaats drie, een nummer dat ik de afgelopen jaren herontdekte. De jaren 80 zijn verrassend sterk vertegenwoordigd met vier nummers in de top 5.

Stemmen voor de TOP2000 van 2011 kan nog tot en met 25 november. Je kan maximaal 15 liedjes van de Radio2lijst aanmelden plus 5 nummers die niet op de lijst staan. Ik ben benieuwd wat jullie favorieten zijn. Veel succes met kiezen!

In de krant

20111119 Vanmorgen kreeg ik van verschillende collega’s te horen dat ik in de krant stond. Het ging om berichten op de nieuwssite Nu.nl, een column in de Volkskrant (vrijdag 18 november 2011, blz. V28 onderaan) en een stukje bij de lokale Groningse OogTV. Alle berichten gaan over de Twittercijfers die ik eerder deze week doorstuurde aan de blog Twittermania.nl. Die wijde er op donderdag een blogpost (Twitterreacties) en schreef op vrijdag over de landkaart die ik met Twitterdata heb gemaakt (Twitterreacties). Leuk dat hier zoveel interesse voor is.

Film: Margin Call

20111118 Bij toeval kwam ik erachter dat in Forum Images een film draait over de kredietcrisis. Het kostte wat moeite om het theater te vinden omdat ze vanwege een verbouwing waren verhuisd naar het Herenplein. Zo zat ik vanavond voor het eerst in een bioscoop in een kelder. De film was Margin Call met onder andere Kevin Spacey, Jeremy Irons en Demi Moore. Na een dag met ontslagen ondekt een jonge medewerker van een investeringsmaatschappij dat een groot deel van hun bezit niks waard is. In een spannende nachtelijke sessie worden steeds hogere bazen opgetrommeld en moeten ze beslissen over de toekomst van het bedrijf. Cijfer: 8 uit 10 (trailer)

Film: Drive

20111110 Donderdagavond ben ik weer naar een PAC-film geweest: Drive met opnieuw Ryan Gosling in de hoofdrol. Hij speelt een garagemedewerker die bijklust als stuntman en chauffeur bij overvallen. De man, wiens naam in de film nooit wordt genoemd, komt in de problemen als hij het gezin van zijn buurvrouw probeert te helpen. Het verhaal is mooi in beeld gebracht met veel stille momenten maar de 15+-keuring is niet voor niets: de film is extreem gewelddadig. Verrassend was nog de acteur die Nino speelde, en die ik ergens van herkende: dat bleek van de hoofdrol in de film Hellboy te zijn. Cijfer voor Drive: 7 uit 10 (trailer)