Realtime data en historische data: een goed huwelijk?

Blijf jezelf voortdurend vragen stellen als: kloppen de data van het algoritme, nu en over een half jaar of een jaar

02-01-2019  Stel, je bent logistiek manager van een bedrijf dat feestartikelen levert. Bovendien ben je (mede-)verantwoordelijk voor het magazijn. Je verzamelt dagelijks gegevens en wil op basis van deze gegevens beslissingen nemen voor zowel de korte- als de lange termijn. De directeur heeft gezegd dat je gebruik moet maken van realtime data en historische data. Maar wanneer gebruik je deze verschillende soorten data? En hoe kun je hiermee je bedrijfsvoering verbeteren?

Historische data

Historische data zijn nuttig wanneer je voorspellingen wilt maken voor een langere termijn. Bijvoorbeeld als je wilt weten hoeveel ballonnen er verkocht gaan worden in de komende maand. Op basis van deze voorspelling kan vervolgens besloten worden hoeveel ballonnen er ingekocht moeten worden om aan de vraag te voldoen. De historische data vormen de basis voor tactische beslissingen. Het is wel heel erg belangrijk om de data te blijven aanvullen met nieuwe data en (relatief) oude of niet meer relevante data niet mee te nemen of minder zwaar te laten meetellen. Voorbeeldje? De vraag naar oranje ballonnen zal, in een jaar waarin er geen EK of WK is, of wanneer Nederland niet gekwalificeerd is, er heel anders uitzien dan wanneer dat wel het geval zou zijn.

Realtime data

Realtime data gebruik je voor operationele zaken en kortetermijnhandelen, bijvoorbeeld om te controleren of je voorspelling van de hoeveelheid ballonnen ook daadwerkelijk klopt. Realtime data gebruik je ook om bestaande modellen (die gemaakt zijn aan de hand van historische data) uit te voeren en waar nodig bij te sturen. Het heeft dus ook een bepaalde controlefunctie. Realtime data is ook heel belangrijk bij sectoren waarin in de snelheid van reageren heel belangrijk is. Denk hierbij aan Fast Moving Consumer Goods als voedsel en drank, of de e-commerce.

Betrouwbaarheid essentieel

Op basis van historische data bouw je dus een algoritme (hoeveel ballonnen en slingers worden er waarschijnlijk verkocht?), dat je vervolgens aan de hand van realtime data voortdurend checkt of het allemaal goed gaat (hoeveel wijkt het algoritme af van de werkelijke vraag?). Die historische data moeten echter wel goed zijn. Dat dat wel eens mis kan gaan ontdekte een Amerikaanse onderzoeker bij het testen van gezichtsherkenningssoftware, onder andere van Microsoft en IBM. De systemen waren voor 99 procent in staat om gezichten correct te herkennen, maar dat bleek alleen op te gaan voor de gezichten van blanke mannen. Bij donkere vrouwen bleek het algoritme het slechts in 35 procent van de gevallen bij het rechte te eind te hebben.

De historische data die gebruikt waren voor het trainen van het algoritme (lees: machine learning), bestonden voor het grootste gedeelte uit – je raadt het al – blanke mannen. Daardoor was het algoritme goed getraind op het herkennen van blanke mannen, maar had het veel te weinig training gehad in het herkennen van donkere vrouwen. Het is te vergelijken met hoe westerse mensen moeite hebben om Aziatische mensen te onderscheiden.

Maar wat heeft onze logistiek manager hieraan?

Nou, stel je het volgende voor. De logistiek manager heeft een deel van zijn data gedigitaliseerd, namelijk de in- en verkoop van ballonnen en een klein gedeelte van de data van de in- en verkoop van slingers. De rest komt later wel, denkt hij. Hij gebruikt de historische data om een algoritme te trainen dat kan voorspellen wat er ingekocht moet worden. Het scheelt immers nogal wat magazijnruimte als je met minder voorraad hoeft te werken. Het algoritme werkt goed, totdat er steeds meer klachten komen over de beschikbaarheid van de slingers. “Er zijn veel te weinig slingers ingekocht”, meldt zijn teamleider. “Hoe kan dat nou?”, vraagt de logistiek manager zich af. Hij laat het algoritme checken. Dat blijkt goed te kunnen voorspellen, maar niet als het om slingers gaat.

Het antwoord blijkt te liggen in de data die gebruikt zijn om de verkoop van slingers te voorspellen. Deze data kwamen toevallig uit een deel van het jaar waarin er weinig slingers waren verkocht. Het algoritme nam dit als normaal aan, en voorspelde dus prompt een te kleine vraag naar slingers. Er werden dientengevolge dan ook te weinig slingers ingekocht. Met als gevolg dat er op stel en sprong nieuwe slingers moesten worden besteld – uiteraard tegen een meerprijs.

Wat kunnen we hiervan leren?

Historische data en realtime data kunnen niet zonder elkaar. Maar om ervoor te zorgen dat dit een goed huwelijk wordt en blijft, moet je aan de samenwerking blijven werken. Dus blijf jezelf voortdurend vragen stellen als: kloppen de data van het algoritme, nu en over een half jaar of een jaar? Waar baseer ik mijn algoritme eigenlijk op? Wat zeggen de realtime data? Zijn er data die uit de database moeten omdat ze te oud zijn of niet meer relevant? Zorg er in elk geval voor dat je beide data-vormen inzet waarvoor ze bedoeld zijn. Op z’n minst haalt het huwelijk tussen historische en realtime data dan de houten status.

Whitepaper ‘Data en digitalisering in de logistiek’

Wil je weten hoe het gesteld is met data en digitalisering in de logistiek? Je leest er alles over in onze whitepaper ‘Data en digitalisering in de logistiek’. Het stuk schetst de belangrijkste uitkomsten van het gelijknamige onderzoek onder meer dan 250 managers in de logistiek. Meld je aan voor de SCM-update en ontvang de whitepaper vandaag nog.

Onze ledenadviseur Nanne
Contact

Vragen over supply chain management?

Nanne en de andere ledenadviseurs helpen je graag verder