Inschrijven cursusdag Topic Modeling

Op vrijdag 31 mei 2013 organiseert de VWM een cursusdag over Topic Modeling – de geautomatiseerde analyse van de onderwerpen in een ongestructureerde groep documenten. De cursusdag zal plaatsvinden aan de Universiteit Antwerpen en is gratis voor leden van de Vlaamse Werkgroep Mediëvistiek.

Inschrijvingen graag voor 1 mei bij het secretariaat van de VWM (Tjamke.Snijders@UGent.be of Mike.Kestemont@ua.ac.be).

Verdere informatie over het programma volgt!

Met vriendelijke groet,

Tjamke Snijders & Mike Kestemont

Topic modeling” is een toepassing in de Digital Humanities waarbij men zich richt op de automatische analyse van de onderwerpen in een ongestructureerde groep documenten — te denken valt literaire corpora, verzamelingen oorkonden of wetenschappelijke artikels. Hoewel de onderliggende statistiek erg ingewikkeld is, is het resultaat van topic modeling bijzonder eenvoudig. Een algoritme bepaalt eerst volledig automatisch de interessante “topics” in het corpus, oftewel groepjes van woorden die geregeld in dezelfde context opduiken. (Een groep woorden als kerk, priester, altaar, … kan bv. het topic “Religie” in het corpus voorstellen.) Vervolgens kan het programma automatisch bepalen in welke mate een bepaald onderwerp wordt behandeld in een document. (Een krantenartikel over een voetbaltransfer kan bv. voor 80% over sport gaan, maar ook 20% over economie.) Vervolgens kan men de samenstelling van interessante topics in het corpus bestuderen of de ontwikkeling ervan diachroon uittekenen, hetgeen steevast verrassende inzichten oplevert. In deze hands-on workshop leren de deelnemers een toegankelijk en veelgebruikt software-pakket (Mallet) besturen, dat van de gebruiker geen speciale ICT-vaardigheden vereist. Centraal staat de vraag hoe men deze onderzoekstechniek op relevante wijze kan aanwenden binnen mediëvistisch onderzoek.