AI challenge

Voor het Nederlandse bedrijf Pon maakten we met machine learning en voice-technologie in korte tijd een innovatief proof-of-concept om strategische keuzes te valideren.

Hoe kunnen AI- en voice-toepassingen ervoor zorgen dat werk- en urenrapportages van monteurs eerder opgeleverd worden, accurater zijn én minder tijd kosten? Een mooie innovatieve uitdaging! Samen met Pon hebben we inzichten opgedaan over mogelijke oplossingsrichtingen en die gevalideerd.

Pon en Q42
Pon is een van de grootste bedrijven in Nederland. Van auto's en bedrijfswagens tot slimme mobiliteitsoplossingen en van (elektrische) fietsen, zware machines en energieoplossingen tot maritieme en technische services: Pon is met vele bedrijven actief in uiteenlopende industrieën. Samen met Pon hebben we al veel innovatief werk gedaan. Van smart connected bicycles en multimodaal vervoer tot VR experiences. We delen een voorkeur voor korte lijnen en een actiegerichte bedrijfsstrategie met het oog op de toekomst.

De AI challenge
Dus toen het innovatielab van Pon ons benaderde voor een challenge om innovatie op het gebied van kunstmatige intelligentie te versnellen, zagen we volop kansen om echt werkende AI-toepassingen te maken. We verwachten namelijk dat deze technologie grote gevolgen gaat hebben voor Pon. Doelstelling van de challenge was om vanuit een relevante businesscase een sterk proof-of-concept plus een roadmap neer te zetten waarmee Pon kan doorpakken.

Meer waarde uit data
Door te beginnen met bedrijfsbrede interviews, van monteurs tot leidinggevenden, werd duidelijk dat Pon het verzamelen van data al volop in gang had gezet. De hypothese was dat er méér waarde uit de data gehaald zou kunnen worden, als de onderliggende onderhoudsrapportages accurater zijn. Wij hebben ons daarom gericht op het verbeteren van deze rapportages.

Suboptimale rapportages
Monteurs van Pon maken voor verschillende stakeholders en doelen rapportages. Voor klanten, certificering, garantie. Dit zorgt ervoor dat rapportages niet altijd hetzelfde zijn. Voor jachten bijvoorbeeld verwachten eigenaren een goudgerand rapport met foto’s, andere klanten staan daar weer anders in. Ook de voertaal verschilt. En tussen de interfaces waar de rapportages ingevoerd moeten worden, bestaat enerzijds veel overlap en zijn er weinig koppelingen anderzijds. Monteurs moeten dus meerdere keren dezelfde gegevens invullen. Daarbij komt dat sommige uitgelezen waardes direct genoteerd moeten worden, maar beschrijvingen van onderdelen prima op een ander moment ingevoerd kunnen worden. Sommige monteurs houden zelfs op papier de kerngegevens bij om die later in allerlei systemen in te voeren. Dit alles zorgt voor uitstelgedrag en een algemene vermindering van de kwaliteit van de rapportages.

Proof-of-concept
Door AI te combineren met voice hebben we deze workflow makkelijker gemaakt. Zeker in de professionele context van Pon, waarin veel met de handen wordt gewerkt, is voice een zeer effectieve interface om spraak naar tekst om te zetten. Ons proof-of-concept zou het voordeel hebben dat het monteurs tijd bespaart, fouten in rapportages vermindert, het werkproces plezieriger maakt én veel meer waardevolle data oplevert.

Een eigen spraakherkenningsmodel
Voor het proof-of-concept bleek het gebruik van standaard consumenten-voice-infrastructuur (Google, Amazon, et cetera) niet genoeg. Het correct verstaan van een professional in het werkveld is lastiger dan de setting van bijvoorbeeld een woonkamer. Een monteur gebruikt vakterminologie die niet voorhanden is in de normale spraakherkenning, het taalgebruik is kortaf en hij of zij werkt vaak in een omgeving met aanzienlijk achtergrondgeluid. Om deze tekortkoming van standaard Automated Speech Recognition (ASR) op te lossen hebben we ingezet op een custom ASR. In ons eigen spraakherkenningsmodel kunnen we vak- en contextspecifieke data, configuraties en trainingssets gebruiken. Zo wordt de prestatie flink verbeterd voor de context van Pon.

De validatie
Alhoewel het prototype werkte, bleek er één tekortkoming. Voor de context van Pon zijn er te weinig voice-datasets om een bruikbaar Nederlands ASR-model te trainen. Het custom model zou met nog veel meer woorden gevoed moeten worden om het taalgebruik van monteurs in de praktijk goed te herkennen. Door het proof-of-concept te maken hebben we gevalideerd dat het nu nog te vroeg is voor Pon om hiermee verder te gaan. Zodoende hebben we Pon een strategische richting gegeven voor de inzet van AI in combinatie met voice. En bovendien: we hebben Pon de onnodige ontwikkeling van een volledig uitgewerkte oplossing bespaard.