iFarm.nl

Main menu:

filler
facebook

Quizzen
  Films
  Acteurs
  Actrices
  Albums
  Asterix
  Kuifje
  Nederlanders
  Belgen

Stripverhalen
  Asterix
  Guust Flater
  Kleine Robbe
  Lucky Luke
  Paling en Ko
  Smurfentaal
  en meer...

Overige
  Grappige nummerplaten
  Molbeurs
  Tour-de-France-spel
  Wie is de Mol?

Recent gelezen

het geheugenpaleis

basisboek social media

the third screen

Op de boekenplank

Gelezen in 2011

Gelezen in 2010

Gelezen in 2009

Gelezen in 2007

Gelezen in 2005/2006

Doorzoek blog

Feeds

Categorieën

Archieven

september 2014
Z M D W D V Z
« jan    
 123456
78910111213
14151617181920
21222324252627
282930  

Film: The Dark Knight Rises

20120720 Vanavond ben ik naar de nieuwe Batmanfilm geweest The Dark Knight Rises. Eindelijk weer een grote film die niet in 3D wordt vertoond. Het verhaal: Batman is met pensioen maar besluit weer terug te keren als een oudleerling van zijn leraar Ra’s Al Gul zijn stad Gotham gaat terroriseren. Waarom deze figuur, een zekere Bane, besloten heeft om dat te doen, is mij niet duidelijk, en evenmin waarom Batman per se zijn stad wil redden. Maar verder is het een mooie actiefilm met veel bekende acteurs: Christian Slater. Anne Hathaway, Morgan Freeman, Gary Oldman, Joseph Gordon-Levitt, Tom Hardy, Marion Cotillard en heel even Liam Neeson. Cijfer: 8 uit 10 (trailer)

Film: The Dictator

20120524 Vanavond ben ik naar de film The Dictator geweest. Het verhaal: Sacha Baron Cohen speelt Aladeen, de maffe dictator van het landje Wadiya. Op bezoek in de VS verliest hij de macht en probeert die terug te winnen met de hulp van zijn tegenpool Zoey, eigenaresse van een fairtradewinkel. Grappige film met bekende muziek, onder andere geïnspireerd op Snoop Dogg en REM. Cijfer: 8 uit 10 (trailer)

Film: Dark Shadows

20120510 Vanavond ben ik naar de film Dark Shadows van Tim Burton geweest. Een vampier (Johnny Depp) uit het jaar 1776 komt terecht in 1972 bij zijn bijna even vreemde familie (o.a. Michelle Pfeiffer en Helena Bonham Carter). Vanaf dan gebeurt er van alles maar een duidelijke verhaallijn kon ik niet ontdekken. De film bevat wel een paar grappige scène’s en mooie muziek maar verder is het geen aanrader. Cijfer: 6 uit 10 (trailer)

Leeftijden op Twitter

Al een tijd vraag ik mij af of het mogelijk is om te zien hoe oud de verschillende deelnemers van de socialnetwerksite Twitter zijn. Uit hun profielen is die informatie niet te halen want als je je registreert op Twitter hoef je geen leeftijd of geboortejaar op te geven. Maar hoe kan je er dan anders achter komen welke leeftijden vaak voorkomen op Twitter?

Twee weken geleden bedacht ik een oplossing: sommige gebruikers plaatsen hun geboortejaar in hun Twitternaam, bijvoorbeeld @alex67 of @alex1967. Dat doet zeker niet iedereen maar in mijn Twittercorpus vond ik toch al 17 duizend namen die eindigen op 19XX of 200X. Met deze namen kan je een bevolkingspiramide maken die kan worden vergeleken met de leeftijdsopbouw van Nederland (volgens het CBS):

20120501

Links staat de leeftijdsopbouw in Nederland en rechts die van de Twittergebruikers met berichten in het Nederlands. Opvallend is dat op Twitter gemiddeld veel meer jonge mensen zitten: bijna 83% is jonger dan 40 jaar terwijl 51% van Nederland ouder is dan 40 jaar. Het is geen verrassend resultaat maar het is mooi om dit eens bevestigd te zien met cijfers.

Het plaatje komt uit een presentatie die ik vorige week gaf op een socialmediaworkshop in Avignon (pdf). De cijfers zijn gebaseerd op tweets van februari 2011.

Grodil proefschrift 100

20120416 Vandaag kreeg ik hem dan: het honderdste Grodilproefschift: Neural Correlates of Prosody and Information Structure, op donderdag 10 mei 2012 te verdedigen door Diana Dimitrova. 100 proefschriften in de Grodilreeks in 21 jaar, wat begon met de eerste van Henriette de Swart in 1991. Dit is een mijlpaal!

Paper: Verkiezingen voorspellen met Twitter

twitter In 2011 heb ik samen met mijn collega Johan Bos een methode ontwikkeld om de resultaten van de Provinciale Statenverkiezingen van maart te voorspellen. We hebben deze methode gebaseerd op een onderzoek uit 2010 waarbij het tellen van tweets voldoende was om de resultaten van Duitse verkiezingen te voorspellen. Zo gemakkelijk ging het niet bij ons. We hebben nog van alles extra moeten doen (sentimentanalyse en demografienormalisatie) om een beetje in de buurt te komen van de verkiezingsuitslagen. En zelfs daarmee waren onze voorspellingen nog iets slechter dan die van Maurice de Hond.

Nu hebben we alles netjes opgeschreven en ons paper is geaccepteerd voor de EACL-workshop Semantic Analysis in Social Networks (april 2012, Avignon, Frankrijk). Bij het literatuuronderzoek voor het paper vonden we nog een ander paper waarin het eerste Duitse onderzoek was overgedaan. Daarin zat stevige kritiek op het eerste onderzoek. Zo bleken de onderzochte partijen zo te zijn geselecteerd dat de voorspellingen goed uitkwamen. En toen ze bij de tweets de missende week van vlak voor de verkiezingen toevoegden werden de voorspellingen ook een stuk slechter dan vermeld in het eerste onderzoek. Daarom lukte het dus bij hen een stuk beter dan bij onze experimenten!

De huidige literatuur is pessimistisch over de mogelijkheid om met Twitter verkiezingen te kunnen voorspellen, wat blijkt uit papertitels als How (Not) To Predict Elections. Met deze kennis en met de wetenschap dat we ons systeem flink hadden afgestemd op oude verkiezingsvoorspellingen, hebben we een extra experiment uitgevoerd. We hebben de tweets verwijderd, ons systeem opnieuw getraind op de verkiezingsvoorspellingen en vervolgens zonder invoer(!) de verkiezingen opnieuw voorspeld. De foutmarge van het systeem nam af met meer dan de helft! Zonder tweets deed het systeem het plotseling wel een stuk beter dan de Politieke Barometer en Maurice de Hond. Wat moeten we hiervan denken? Hebben tweets dan juist een negatieve invloed op verkiezingsvoorspellingen? Of hebben we bij dit extra experiment gewoon geluk gehad? We weten niet goed hoe we dit resultaat moeten interpreteren. De discussiesectie van het paper eindigt dan ook met heel veel vraagtekens.

Bij deze een link naar een pdf van het paper en de bijbehorende datasets voor de geïnteresseerden:

Predicting the 2011 Dutch Senate Election Results with Twitter, by Erik Tjong Kim Sang and Johan Bos. In: Proceedings of SASN 2012, the EACL 2012 Workshop on Semantic Analysis in Social Networks, Avignon, France, 2012 (data.zip)

Film: The Girl with the Dragon Tattoo

20120114 Vanavond ben ik naar de film The Girl with the Dragon Tattoo geweest. Het is een Amerikaanse verfilming van David Fincher (van Se7en) van het eerste boek van de Milleniumtrilogie van Stig Larsson. Ik heb het boek niet gelezen en heb de Zweedse verfilming niet gezien dus voor mij was het een geheel nieuw verhaal. Daniel Craig (van James Bond) probeert samen met zijn assistente Rooney Mara een 40-jarige moord in de familie van Christopher Plummer (van The Sound of Music) op te lossen. Een spannende film maar ook vreemd omdat hij in Zweden is opgenomen met mensen die Engels spreken. Een sterke rol van Rooney Mara als autistische punker die erg goed is in juridisch onderzoek. Cijfer: 9 uit 10 (trailer)

Top 2000 herschikt

20111225 Vandaag zijn de radiouitzendingen van de Top 2000 begonnen: de lijst van favoriete muziek gebaseerd op stemmen van meer dan drie miljoen Nederlanders. In de twaalf jaar dat de lijst wordt samengesteld zijn er twee standaardklachten over: in de lijst zijn bepaalde muziekgenres ondervertegenwoordigd en de recente nummers staan door hun actualiteitswaarde te hoog in de lijst.

Aan de eerste klacht kan je als buitenstaander weinig doen. Oplossing hiervan vereist een grotere lijst van muzieknummers waarop de deelnemers kunnen stemmen. De tweede klacht kan op verschillende manieren worden opgelost. Een veelgehoord voorstel is om geen nummers van de laatste x jaar in de lijst toe te laten. Dat lost niet alle problemen op zoals we zagen in 2009. Ramses Shaffy overleed vlak voor de deadline van het inzenden van de deelnemerslijstjes. Vijf van zijn liedjes, bijna allemaal van voor 1980, kwamen toen in de Top 100 van de lijst terecht.

Er is niks mis met recente nummers in de lijst maar het is wel vreemd als ze meteen in de Top van de lijst terecht komen. De meeste van dat soort nummers handhaven zich daar niet en zakken daarna langzaam weg. Je kunt zeggen dat hun eerste positie een overschatting is van hun eeuwigheidswaarde. We kunnen deze kennis in de lijst verwerken door de top voor te behouden aan nummers die al meerdere jaren voor de lijst zijn genomineerd. Het aantal jaren dat je hiervoor gebruikt is arbitrair maar ik heb daarvoor 5 gekozen. We kunnen dan de positie van een nummer corrigeren met de volgende formule:

   score = positie * jaren/5 + 2000-(jaren*400)
 

De score bepaalt dan de nieuwe positie van een nummer in de lijst: hoe lager de score, hoe beter de plaats van het nummer.

Als een nummer de afgelopen 5 jaar in de lijst stond dan is jaren gelijk aan 5 en dan is de score gelijk aan de huidige positie van het nummer in de lijst. Als het nummer nieuw is in de lijst dan is jaren gelijk aan 1 en dan wordt score ongeveer 2000-(1*400) = 1600 hoger dan de huidige positie. Hoe hoger de score, hoe lager de nieuwe positie op de lijst. Nieuwe nummers komen dus een stuk lager te staan door deze positiecorrectie.

Eens kijken wat het effect is op de lijst van 2011:

pnie poud j  score
   1    1 5    1.0      Queen   Bohemian rhapsody
   2    2 5    2.0      Eagles  Hotel California
   3    3 5    3.0      Deep Purple     Child in time
   4    4 5    4.0      Boudewijn de Groot      Avond
   5    5 5    5.0      Led Zeppelin    Stairway to heaven
   6    7 5    7.0      Pink Floyd      Wish you were here
   7    8 5    8.0      Coldplay        Clocks
   8   10 5   10.0      Bruce Springsteen       The river
   9   11 5   11.0      Meat Loaf       Paradise by the dashboard light
  10   12 5   12.0      Pink Floyd      Comfortably numb
....
 381   73 4  458.4      Jeff Buckley    Hallelujah
 674    9 3  805.4      Coldplay        Viva la vida
1090   48 2 1219.2      Caro Emerald    A night like this
1470    6 1 1601.2      Adele   Someone Like You
2000 2000 2 2000.0      Nathalie Imbruglia      Torn
 

De regels in bovenstaande lijst bevatten: 1. de nieuwe positie; 2. de oude positie (2011); 3. het aantal jaren in de lijst gemeten over de laatste vijf edities; 4. de score; 5. de artiest; 6. de titel van het nummer.

In de top 10 verandert weinig. Meat Loaf en Pink Floyd schuiven de top 10 binnen omdat zij al vijf jaar op rij in de lijst staan, net als de andere acht. Het nieuwe nummer van Adele valt terug van plaats 6 naar 1470 door de jarencorrectie in de score (+1600). Viva la vida staat er pas drie jaar in en zakt van 9 naar plaats 674. Jeff Buckley heeft het hoogst genoteerde nummer dat vier jaar in de lijst staat en Caro Emerald heeft het hoogste nummer dat er 2 jaar instaat. De score kan nooit hoger worden dan 2000 dus Natalie Imbruglia blijft onveranderd op plaats 2000 staan.

De Top2000-lijst ziet er zo een stuk beter uit!

Volledige herschikte lijst: tekstbestand | Excelbestand

Film: The Adventures of Tintin

20111223 Vanavond is het er eindelijk van gekomen om de nieuwe Kuifjefilm van Spielberg in de bioscoop te bekijken. Het is een vreemde film: een mix van een animatiefilm met een film met acteurs maar wel erg knap gemaakt. Het centrale plot komt uit het album Het geheim van de Eenhoorn maar in de film zit ook een flinke stuk uit De krab met de gulden scharen, het album waarin Kuifje voor het eerst kapitein Haddock ontmoet. Kapitein Haddock wordt sterk neergezet door Andy Serkis, de man die eerder Gollem speelde in The Lord of the Rings. Ik kijk al uit naar het beloofde vervolg, De schat van Scharlaken Rackham, waarin Kuifje voor het eerst professor Zonnebloem tegenkomt. Cijfer voor deze film: 7 uit 10 (trailer)

Film: In Time

20111124 In Time speelt zich af in een toekomst waarin iedereen 26 levenjaren heeft die kunnen worden verlengd door extra tijd te verdienen. Justin Timberlake speelt Will Salas, een inwoner van een ghetto die continu uren moet sprokkelen om de volgende dag te halen. Hij ontdekt dat er mensen zijn met duizenden jaren op hun levensklok en probeert aan deze ongelijkheid een einde te maken. Interessant en origineel thema maar het plot van de film rammelt hier en daar. Cijfer: 7 uit 10 (trailer)