Cikk
olvasás: 4 perc
Hogyan mérjük fel a kereslet várható mértékét? Mi így csináltuk - 1. rész
Akár az ipart, akár a kereskedelmet nézzük, egy kellően pontos és megbízható kereslet előrejelzés nagyon sok ületi döntésnek az alapja. A beszerzési döntéseket a vásárlói igényekhez tudjuk igazítani, a raktárkészletet a várható kereslet mentén optimalizálhatjuk. Nő a termékek forgási sebessége, csökken a készlettartás költsége, végső soron pedig nő a profitunk. De mit tehetünk azért, hogy ezeket elérjük? A kulcsszó most is az „adat” – lássuk a megvalósítás módját!
Egy ügyfelünk is hasonló problémákkal küzdött, melyek egy logisztikai tervezés során jöttek a felszínre, így elkészítettünk egy modellt nyilvánosan elérhető adatok alapján. A modell létrehozásához egyebek mellett az amerikai Walmart hipermarketeiben értékesített termékek eladott darabszámáról szóló adatokat vettük alapul, melyekhez a világ egyik legnagyobb adattudományi és gépi tanulási közösségének, a Kaggle-nek köszönhetően jutottunk hozzá.
A vizsgált adathalmaz 5 évnyi eladási adatot tartalmazott összesen 3049 különböző termékre 10 különböző boltban, emellett a termékek árát és a naptári eseményeket (ünnepnapok, sportesemények, stb.) is tartalmazta. A célunk ezzel a hatalmas adatmennyiséggel az volt, hogy a meglévő eladások alapján 28 napra tudjuk előre jelezni az eladásokat – ez a gyakorlatban mintegy 30.490 predikciót jelent minden napra!
Adatok az adatok alapján
Miután összegyűjtöttük őket, természetesen alapos vizsgálatnak vetettük alá a szóban forgó adatokat. Az előzetes elemzések során számos olyan jellegzetességre lettünk figyelmesek, melyek hatással voltak az adatelőkészítésre és a becslő modell kiválasztására is. A teljesség igénye nélkül most meg is mutatjuk a legfontosabbakat ezek közül!- Szezonalitás: Nem csak a megszokott téli-nyári és az ehhez hasonló szezonalitás volt a jellemző, hanem például az olyanok is, mint hogy nagyobb a forgalom a hó elején, mint a végén. De szintén voltak forgalombeli különbségek a hétvégék és a hétköznapok között (spoiler: természetesen a hétvégék javára.)
- Trendek: 5 év nem nagy idő, de arra pont elég, hogy bizonyos időbeli trendek kiütközzenek. Ez pont kapóra jött nekünk, hiszen 5 évnyi adathalmazzal dolgoztunk, ebből pedig az jött le számunkra, hogy az értékesítés növekedésének mértéke nemcsak régiónként, de boltonként is eltérő, és az egyes kombinációk is szignifikánsan különböző mértéket és trendeket mutatnak.
- Események: jelentősen tudják befolyásolni az eladásokat az ünnepnapokon túl az olyan események, mint például iskolai szünet vagy a jelentősebb sportesemények, mint például az amerikai Super Bowl.
A kereslet előrejelzését regressziós feladatként közelítettük meg. Az előrejelzés jóságát vagy jobb modellel, vagy több magyarázó változóval lehet javítani. A modell választása sokkal korlátozottabb, így a fő feladatunk a leíró képzés (feature engineering) volt, amelyet egy kiválasztott modell architektúra mellett iteratívan végeztünk. A feature engineering része még a kategorikus változók (bolt, kategória) kezelése is. Erre több technika is van, amiknek a teljesítménye eltérhet a különböző adathalmazokon. A megfelelő technika kiválasztása az iteratív folyamatban történt.
Az egyik legizgalmasabb része a feature engineering-nek az áradatok elemzése volt. Az elérhető adatok lehetővé tették az olyan hatások figyelembevételét is a kereslet előrejelzésben, mint a termék promóciók, áremelés vagy éppen az egyes áruházak árképzési gyakorlata.
És hogy ezek után miként készítettük el a modellt, és mik lettek a végeredmények, végkövetkeztetések? Következő cikkünkből kiderül!