Van kernwoord of entiteitherkenning, het clusteren van big data corpora met de meeste recente ontwikkelen op het gebied van deep learning tot een volledige ETL pipeline voor documentverwerkingen. Binnen Python en R en frameworks zoals spaCy, NLTK opgeschaald via DataBricks werken wij aan het efficient verwerken van de als maar toenemende informatiestromen binnen organisaties.
Beginnen met predictive analytics? Door projecten uit te voeren in tal van toepassingsgebieden putten wij uit een breed scala gereedschappen om net dat stukje maatwerk te leveren dat het verschil maakt. Denk hierbij aan het opschonen datasets en aanpassen van machine learning algoritmes voor een specifieke casus voor toepassingsgebieden zoals: supply chain management, laboratorium automatisering of tijdseries voorspellen.
Geautomatiseerde kwaliteitscontrole, diagnostiek, monitoring — in veel toepassingen kunnen expert beoordelingen door de mens verbeterd worden, beslissingsondersteuning of volledige automatisering, door gebruik te maken van de laatste ontwikkelingen op het gebied van deep neural networks. Interesse om een verkenning of concrete use case waar een computer vision oplossing nodig is te starten? Aarzel niet om contact op te nemen.
In de meeste gevallen is er of nog veel onduidelijk over de bron data en moet er veelvuldig met de business worden afgestemd om ruwe data om te zetten in tastbare toegevoegde waarde. Door >6 jaar ervaring met het aansturen en uitvoeren van data science projecten, van opzet tot product, ontwikkelen wij in korte iteraties maatwerk in samenspraak met de opdrachtgever.
Momentum genereren en behouden is essentieel om een data science casus succesvol te laten landen. Shiny applicaties verkorten de delivery cycle door direct vanuit R een gebruiksvriendelijke web-applicatie te ontwikkelen zonder door tijdrovende multidisciplinaire software development fases te gaan. Met meerdere jaren ervaring in het ontwikkelen van Shiny apps en het uitrollen van RStudio producten zoals RStudio Connect ontwikkel ik prototypes of volledig operende applicaties. Zie Genome Wide Association Analysis or Quantitative Trait Loci mapping voor twee voorbeelden van Shiny apps die gebruikt worden door Wageningen Universiteit om theorie te koppelen aan praktisch onderzoek binnen statistische genetica vakken.
Kwantitatieve analyse zoals linear mixed models, unsupervised clustering en interactieve visualisatie kunnen helpen om processen te begrijpen en bruikbare inzichten te genereren. Door kennis van verschillende tooling in Python en R, D3 en Shiny kan een casus effectief uitgediept en onderzocht worden.
NLP
Voor een introductie in text mining in R, klik op de bovenstaande link.
Tijdreeksanalyse
Provincie Zuid-Holland heeft veel verkeer op de weg en in het water, door deze hoge verkeersintensiteit is optimalisatie van doorstroommogelijkheden van groot belang. Deep learning algoritmes kunnen met een accuraatheid van 0.75 tot 0.95 de verkeersstroom vooruit voorspellen waarmee verchillende scenario's doorgerekend kunnen worden qua verkeersdoorstroming en CO2 uitstoot om zo tot het optimale moment voor een brugopening te komen.
Kwantitatieve genetica met R/Shiny
De GWAS Shiny apps integreert kwaliteitscontrole, fenotypische data analyse, genotypische (PCA) analyse en genetische GWAS analyse gebruikmakend van univariate en multivariate mapping algoritmes.