| Toelichting |
Het wordt steeds eenvoudiger en gebruikelijker om grote hoeveelheden gegevens te verzamelen en op te slaan. Dit geldt niet alleen voor bijvoorbeeld point-of-sales consumenten gegevens en voor gegevens over individueel mobiel belgedrag maar ook voor bijvoorbeeld garantie- en storingsdata en voor productieprocessen waarbij sensoren op grote schaal data loggen. Met behulp van data mining is het mogelijk om in dergelijke grote gegevens verzamelingen verbanden en structuren te ontdekken en voorspelmodellen te ontwikkelen. Technieken uit zowel de toegepaste statistiek als de kunstmatige intelligentie worden daarbij ingezet.
Resultaat De cursus bevat de meest gangbare technieken op het gebied van toegepaste statistiek en kunstmatige intelligentie die van belang zijn voor het begrijpen en succesvol toepassen van data mining methoden. U verkrijgt inzicht en vaardigheid in de basistechnieken die nodig zijn voor het uitvoeren van analyses met relevante software op het gebied van data mining.
Na afloop van de cursus kunt u: - business problemen identificeren en een geschikte analysemethode bepalen; - begrijpen welke moeilijkheden gepaard gaan met het analyseren van omvangrijke databestanden; - een complete data mining analyse samenstellen, bestaande uit verkennend data onderzoek, het opdelen en transformeren van data, het invullen van missende waarden en het maken en interpreteren van modellen; - zorgen voor het trainen, beoordelen en vergelijken van regressiemodellen, neurale netwerken en beslissingsbomen; - een clusteranalyse verrichten; - een associatie- en sequentieanalyse uitvoeren.
De behandeling van de stof wordt afgewisseld met praktijkvoorbeelden en praktische oefeningen, waarbij ervaring opgedaan kan worden in het gebruik van data mining software.
De volgende onderwerpen komen aan de orde: - Datapreprocessing: Opschonen van een databestand, outliers, ontbrekende waarnemingen en data transformaties - Verkennend dataonderzoek - Voorspelmodellen op basis van lineaire regressie, variabelen selectie, data reductie en model evaluatie - Voorspel modellen voor het classificeren van data: naaste buren algoritmes, beslissingsbomen, neurale netwerken, logistische regressie - Methoden voor het opsporen van clusters en patronen in databestanden: Hierarchical and K-Means, Cluster analyse, Kohonen Netwerken - Associatie en sequentie analyse - Model evaluatie technieken
Docent dr. J.J.M. Rijpkema (TU Eindhoven, Faculteit Wiskunde & Informatica).
Dagindeling: Dag 1 t/m 4: 09.30 - 17.00 uur |