Social Media 2011: Weekopdracht 2
Verzamel een reeks van Twitterberichten over een bepaald onderwerp of van een bepaalde gebruiker voor een bepaalde tijdperiode, bijvoorbeeld:
- een uur met tweets met daarin het woord "bier"
- twee maanden tweets van de gebruiker "ladygaga"
Zorg dat je minstens 100 tweets hebt. Sla de verzameling op in een bestand (bijvoorbeeld met knippen en plakken). Lees jouw verzameling door en kijk of je er opvallende zaken in kunt vinden, bijvoorbeeld gebruik van specifieke woorden. Verander eventueel het onderwerp of de tijdsduur van de verzameling. Je kan ook twee vergelijkbare onderwerpen kiezen en deze vergelijken.
Maak vervolgens een woordenwolk van jouw Twitterverzameling met de website http://wordle.net/ . Gebruik alleen de tweetberichten, dus geen regels met data of gebruikersnaam. Pas het font en de kleuren van de woordenwolk aan naar jouw smaak. Zorg er wel voor dat de woorden wat kleur betreft leesbaar blijven.
Schrijf een blogpost van ten minste 400 woorden waarin je jouw onderwerpkeuze en gekozen tijdsduur beschrijft. Geef aan welke opvallende zaken je in jouw Twitterverzameling hebt gevonden. Neem ook de woordenwolk op als plaatje bij jouw blogpost. Je kan deze kopiëren van Wordle door een screenshot te maken. Beschrijf ook de eventuele bijzonderheden van de woordenwolk.
Wees karig met het quoten van de tweets in jouw blogpost. Plaats alleen maar een tweet in jouw blogpost als het echt niet anders kan. Plaats niet meer dan 3 tweets in jouw blogartikel.
Lever het adres van jouw blogpost in op Nestor bij "Social Media 2011 - Inleveren" voor de deadline: maandag 19 september 2011, 09:00 's morgens.
Veelgestelde vraag
Moeten we de hashtags (#abc), gebruikersnamen (@abc) en webadressen (http://abc) uit de Twitterberichten halen? Nee, de Twitterberichten (tweets) moeten bij voorkeur compleet blijven: inclusief gebruikersnamen, hashtags en urls. Deze geven ook een indruk over het taalgebruik van de betreffende gebruiker op Twitter. Bij het maken van de woordenwolk met Wordle worden de tekens @ en # verwijderd uit de gebruikersnamen en hashtags. De urls blijven compleet.
Tips
- Zoeken naar informatie op Twitter
- Maken van een bestand voor Wordle
- Bewerken van woordenwolken in Wordle
- Maken van een screenshot
- Bekijk eventueel de tips bij opdracht 1
Zoeken naar informatie op Twitter
Twitter heeft een zoekinterface voor woorden: http://twitter.com/search. Voorbeelden van zoekopdrachten voor tweets met bepaalde woorden staan op de collegeslides van week 2: pdf (slide 19).
Deze zoekinterface kan je ook inzetten voor het zoeken naar gebruikers. Deze verschijnen in de rechterhelft van de zoekresultaten. Als je de gewenste gebruikersnaam al kent, dan kan je deze ook invullen in de locatiebalk van de webbrowser, bijvoorbeeld: http://twitter.com/barackobama
Als je eerder hebt gewerkt met Linux dan kan je ook naar tweets zoeken in de historische verzameling Nederlandstalige tweets (mensen zonder Linuxervaring mogen het volgende overslaan). Hier is een voorbeeld van commando's die je kan intikken in een terminal window:
$ cd /net/corpora/twitter/201102 $ gunzip -c 20110222*z | grep -i christchurch | wc -l 1157 $ gunzip -c 20110222*z | grep -i christchurch | head -1 gronical Tweede sterke aardbeving in Christchurch (Nieuw Zeeland) in een half jaar, zegt @reuters. En nu ben ik twexit $ gunzip -c 20110222*z | grep -i christchurch | cut -d' ' -f2- Tweede sterke aardbeving in Christchurch (Nieuw Zeeland) in een half jaar, zegt @reuters. En nu ben ik twexit $ gunzip -c 20110222*z | grep -i christchurch | head -200 > ~/mijndata.txt
De databestanden zijn gecomprimeerd met gzip en bevatten 1 tweet per regel voorafgegaan door de gebruikersnaam van de verzender. Verwijder deze regelinitiele zendersnamen voordat je het bestand aanbiedt aan Wordle, zij horen niet bij de tweets. Het bestand /net/corpora/twitter/000README bevat extra informatie over dit Twittercorpus.
Maken van een bestand voor Wordle
Als je Twitterdata verzamelt via de zoekinterface van Twitter dan kan je deze met de muis met kopiëren en plakken in een bestand plaatsen. Het bestand bevat dan meer informatie dan alleen de tweets. De regels met gebruikersnaam en data (zoals "12 Sep") worden dan ook meegenomen. Deze moeten worden verwijderd voordat je het bestand aanbiedt aan Wordle want anders komen ze ook in de woordenwolk te staan.
Gebruik een editor als Word (of Linuxcommando's) en vervang de gebruikersnamen uit het bestand door een lege strings met zoek en vervang. De data ("12 Sep") zijn waarschijnlijk lastiger om zo te verwijderen omdat het bestand verschillende data kan bevatten. Het kan zijn dat je een een deel van deze regels zelf 1-voor-1 zal moeten verwijderen.
Bewerken van woordenwolken in Wordle
De website Wordle biedt verschillende mogelijkheden om het formaat van de gemaakte woordenwolken aan te passen, via het menu linksboven de aangemaakte wolk:
- Language: met deze menu-optie kan worden
aangegeven van welke taal de stopwoordenlijst moet worden
gebruikt. Controleer dat deze op de juiste taal staat en pas
hem eventueel aan.
Via de menu-optie "Language" kan je ook aangeven dat de woorden allemaal moeten worden omgezet in hoofd- of kleine letters. Verder biedt het uitklapbare menu de mogelijkheid om het aantal van elk woord te inspecteren (onderste optie).
- Font: hiermee kan je het font van de woorden in de wolk bepalen. Probeer eeen paar verschillende en kies een font dat je bevalt.
- Layout: handig om in te stellen of de woorden in de wolk horizontaal of verticaal moeten worden opgeschreven. Je kan er ook voor kiezen om de woorden op alfabet te sorteren, de wolk in een rechthoek te veranderen of het aantal woorden in de wolk aan te passen.
- Color: hiermee kan je het kleurenpalet van de woorden in de wolk bepalen. Probeer een paar verschillende en kies een kleurenpalet dat je bevalt.
Je kan een woord uit de wolk verwijderen door op het woord te klikken met de rechtermuisknop. Het laatst-verwijderd woord kan weer terug worden geplaatst via de menu-optie "Edit".
Maken van een screenshot
De woordenwolken van Wordle laten zich niet zonder meer opslaan als plaatje. Om toch zo'n afbeelding te maken voor jouw blogpost, moet je een screenshot maken van de browser met de woordenwolk. Hier zijn instructies voor Microsoft Windows en Linux:
Microsoft Windows
- Start het programma Paint: Start > Programs > Accessoires > Paint
- Maak een screenshot: druk tegelijk op de knoppen "Alt" en "Print Scrn"
- Kies in Paint: Edit > Paste
- Het screenshot verschijnt nu in Paint
- Klik op het plaatje, hou de linkermuisknop ingedrukt en selecteer een rechthoekig deel van het plaatje dat je wil gebruiken
- Kies in Paint: Edit > Copy To (dus niet Copy!)
- Kies een folder en een bestandsnaam met extensie .jpg (bijvoorbeeld "plaatje.jpg" om het geselecteerde plaatje op te slaan
Linux
- Start het programma gimp in een terminal window
- Kies in het menu: File > Create > Screenshot
- Kies in het nieuwe window: Select a region to grab, en klik op Snap
- Selecteer met de muis het gebied wat je wil opslaan
- Kies in het nieuwe window: Save As, en sla het bestand op
Mac
- Druk tegelijk op de toetsen "cmd", "shift" en "4"
- Selecteer het gedeelte van het scherm dat je wil opslaan
- Het screenshot wordt automatisch opgeslagen in een png-bestand met de naam "Picture N" (N is een getal) op de Desktop
- Klik 2x op de naam van het bestand op de Desktop en verander het in een geschikte naam met extensie ".png"
Als je het gewenste plaatje hebt opgeslagen op je computer dan kan je hem gebruiken in je blogpost (verdere instructies).
Last update: September 18, 2011. erikt(at)xs4all.nl