Prediktív analitika a piacfelmérésben

Hogyan lesz a tényekből előrejelzés – és az előrejelzésből profit?

A piacfelmérés klasszikus célja az, hogy megértsük a jelent: kik a vevőink, milyen igényeik vannak, hogyan értékelik a márkát, mi zavarja őket a vásárlásban. A döntések azonban mindig a jövőre vonatkoznak: mikor és mennyit érdemes gyártani, melyik ajánlat hoz több bevételt, melyik célcsoport fog konvertálni, hogyan változik a kereslet szezonban, áremelésnél, kampány idején. Itt lép be a képbe a prediktív analitika: a történeti adatokból és aktuális jelzésekből előrejelzi a várható viselkedést, és ezeket az előrejelzéseket operatív döntésekké fordítja.

Ez az útmutató gyakorlati szemmel mutatja meg,

  • mit jelent a prediktív analitika piacfelmérésben,
  • milyen modellek működnek a valóságban,
  • milyen adatokat érdemes összerakni,
  • hogyan mérjük a minőséget (nem csak „szép grafikonokban”),
  • és hogyan ültetjük át a szervezet működésébe úgy, hogy attól még gyorsabb, okosabb és nyereségesebb legyen az üzlet.

1) Mi az a prediktív analitika – és miben több a leíró elemzésnél?

  • Leíró (descriptive): „Mi történt?” – riport, dashboard, NPS/CSAT, piaci részesedés, kampányeredmények.
  • Diagnosztikus (diagnostic): „Miért történt?” – korrelációk, hipotézisek, szegmentáció.
  • Prediktív (predictive): „Mi fog történni?” – konverziós valószínűség, churn kockázat, kereslet-előrejelzés.
  • Előíró (prescriptive): „Mit tegyünk?” – ajánlott akció: melyik csatornán, milyen ajánlattal, mikor lépjünk.

A piacfelmérés klasszikusan az első kettőre fókuszál. A prediktív hozzáadott értéke, hogy a riportokból akcióképes döntéstámogatás lesz: nem csak megmondjuk, hogy „a 25–34-es korosztály kedveli a csomagot”, hanem megmutatjuk melyik 25–34-es és melyik üzenettel fog konvertálni a következő 14 napban.


2) Milyen üzleti kérdésekre ad választ?

  • Kereslet-előrejelzés: termék/szolgáltatás volumene régió, csatorna, hét napja szerint.
  • Konverzió-előrejelzés: lead → vásárló valószínűsége, „next best offer”, „next best time”.
  • Árérzékenység és árrugalmasság: hogyan hat egy 5–10% árváltozás a mennyiségre és árrésre.
  • Churn/lemorzsolódás: ki fog elpártolni a következő 30–90 napban; milyen jelzés előzi meg.
  • Uplift modellezés: kinek érdemes kampányt küldeni, mert miatta fog változni a viselkedése (nem csak „aki amúgy is vásárolna”).
  • Termékportfólió-optimalizáció: melyik kombináció húzza fel a kosárértéket vagy hűséget.
  • Új piacra lépés: régiók/klaszterek potenciáljának előrejelzése (demográfia, fizetőképesség, versenyhelyzet).

3) Adat – a predikció „üzemanyaga”

3.1. Források, amiket érdemes integrálni

  • Kutatási adatok: kérdőívek (CAWI/CATI), fókuszcsoportból kinyerhető kvantifikált jegyek (pl. kulcsszavak).
  • CRM/értékesítés: lead státuszok, kampányok, konverziók, kosár, ismételt vásárlás.
  • Kampánylogok: csatorna, kreatív, frekvencia, megnyitás/kattintás, hívás-időzítés.
  • Web/app analitika: session-ek, események, források, funnel-lépések.
  • Transzakciós/ERP: árak, készlet, akciók, visszáruk.
  • Külső jelzések: szezon, időjárás, makrotrendek, versenytársi árfigyelés, lokációs adatok.

3.2. Feature engineering – a „titkos szósz”

A nyers mezők ritkán prediktívek. Erősebb jel származtatott változókból jön:

  • RFM: Recency (utolsó aktivitás), Frequency (aktivitások száma), Monetary (költés).
  • Időablakos aggregátumok: utóbbi 7/14/30 nap eseményei (kattintás, kosár, hívás).
  • Idősoros dekompozíció: trend, szezon, ünnepnap-hatás, promóciós impulzus.
  • Interakciós változók: pl. „ár × promóció jelenlét”, „csatorna × napszak”.
  • Szöveg/NLP: ügyfél-üzenetekből szentimentelemzés, témamodellek (pl. LDA), kulcsszavak.

4) Modellek – mit érdemes használni?

4.1. Klasszikus baseline-ok

  • Logisztikus regresszió: konverzió/churn valószínűség; jól magyarázható.
  • OLS/GLM: mennyiségi előrejelzés (eladott darab, kosárérték).
  • ARIMA/ETS: idősoros kereslet (bolt-szint, napi/ heti).

4.2. Gépi tanulás

  • Random Forest / Gradient Boosting (XGBoost, LightGBM, CatBoost): erős általános teljesítmény, nemlineáris hatások, jó „tabular data” esetén.
  • Survival/Cox modellek: churn/időzítés (mikor következik be az esemény).
  • Uplift modellek (T-learner, S-learner, Causal Forest): ki változtat viselkedésen, ha hatás éri (kampány, árváltás).
  • Propensity score modellek: konverziós hajlandóság.
  • Idősoros ML: Prophet, LightGBM idősori featurizálással (szezon, ünnep, promóció, időjárás).

4.3. Kísérletezés (A/B, többkarú bandita)

Predikciót validálni is kell. A jó gyakorlat: előrejelzés + kontrollált kísérlet (A/B) → valódi ok-okozat. Többkarú banditák dinamikusan osztanak költséget a jobban teljesítő kreatív/időzítés felé.


5) Mérőszámok – mivel bizonyítjuk, hogy jó a modell?

  • Klasszifikáció (konverzió/churn): AUC/ROC, PR-AUC (ritka eseménynél fontosabb), logloss, lift@k (pl. a top 10% lista hányszorosan jobban teljesít az átlaghoz képest).
  • Regresszió/kereslet: RMSE/MAE (üzleti skálán is értelmezve), sMAPE, WAPE.
  • Uplift: Qini görbe, uplift@k (tényleges inkrementális hatás a kezelt vs. kontroll között).
  • Forecast bias: mennyire optimista/pesszimista rendszeresen; service level: a kereslet mekkora részét fedezi a készlet.

Fontos: mindig legyen üzleti KPI-áthidalás: „+1 AUC pont = hány Ft inkrementális bevétel / megtakarítás?”. E nélkül a modell-szépség nem lesz döntés.


6) Bevezetés – hogyan lesz a modellből működő rendszer?

6.1. MLOps / DataOps alapszabályok

  • Verziózás: adat, kód, modell, hiperparaméterek – mind dokumentálva.
  • Újratanítás: szezon, piaci változás kötött ütemben (pl. havonta).
  • Drift monitoring: ha az adatdisztribúció elcsúszik (új célcsoport, új csatorna), jelezzen.
  • Shadow/Champion–Challenger: új modell párhuzamosan fut a régivel; veszély nélkül mérhető.

6.2. Döntéstámogatás – ember a körben

  • Ajánló/végrehajtó réteg: értékesítőnek lead-sorrend, ügyfélszolgálatnak „next best action”, kampánymenedzsernek célzás-lista.
  • Magyarázhatóság: SHAP/feature importance vizualizáció – „miért ezt ajánlja?”. A bizalom kulcsa.
  • Feedback loop: a végrehajtott akciók eredménye visszamegy tréning-adatnak (önjavító rendszer).

7) Adatvédelem, etika, bias

  • Jogalap & minimál-adat: csak a szükséges mezőket használd; anonimizálj, ahol lehet.
  • Átláthatóság: ha az ajánlás „érzékeny” döntést befolyásol (hitel, árképzés), kell magyarázhatóság.
  • Bias-tesztek: csoportonkénti teljesítmény; ne „büntessen” kisebbségi szegmenst.
  • Governance: ki felel az adatért, ki a modellért, ki dönt az éles bevezetésről?

8) Gyors „receptkönyv” tipikus feladatokra

8.1. Kereslet-előrejelzés (retail/D2C)

  • Adat: napi eladások bolt × SKU, ár, promó, készlet, időjárás, ünnep.
  • Modell: Prophet / LightGBM idősori featurizálással.
  • Kimenet: heti előrejelzés konfidencia-sávval + készletajánlás.
  • Üzleti haszon: készlethiány-csökkenés, eladatlan készlet visszafogása.

8.2. Lead konverzió (B2B)

  • Adat: forrás, iparág, cégméret, szerepkör, tartalomfogyasztás, hívásnapló.
  • Modell: logisztikus regresszió / XGBoost.
  • Kimenet: lead-score, next best time, „kinek telefonáljunk ma?”.
  • Üzleti haszon: sales fókusz a top 10–20%-ra → több meeting ugyanannyi hívással.

8.3. Churn előrejelzés (előfizetés)

  • Adat: használati ritmus, hibajegyek, számlázás, kampányreakciók, NPS.
  • Modell: survival / XGBoost.
  • Kimenet: churn valószínűség + ajánlott retenciós akció.
  • Üzleti haszon: célzott mentés – kedvezményt csak azoknak, akiket tényleg megfordít.

8.4. Árrugalmasság / promóciós hatás

  • Adat: ár, promóció, polchelly, versenytársár (scrape), mennyiség.
  • Modell: GLM/Elastic Net + idősori komponensek.
  • Kimenet: „+5% ár → −x% mennyiség” görbe termékszinten.
  • Üzleti haszon: fedezet-optimalizált ár- és promóciós naptár.

8.5. Uplift modellezés (kampány)

  • Adat: kezelt vs. kontroll, reakció, felhasználói jegyek.
  • Modell: Causal/Uplift Forest.
  • Kimenet: „persuadable” lista – kiknél okoz hatást a kampány.
  • Üzleti haszon: kevesebb pazarlás, több inkrementális nyereség ugyanannyi költésből.

9) Szervezeti bevezetés – hogyan lesz fenntartható?

  1. Egyértelmű üzleti cél: „Mire használjuk?” – ne „mert menő”.
  2. Kis pilot, gyors visszacsatolás: 4–6 hét, 1 KPI.
  3. Tulajdonosok kijelölése: adatos, modellező, döntéshozó.
  4. „Human-in-the-loop”: a szakértő jóváhagy – növeli a bizalmat.
  5. Dokumentáció és oktatás: érthető anyagok a végfelhasználónak (értékesítő, kampánymenedzser, operátor).
  6. Folyamatos karbantartás: szezon, piac, termék változik → modell frissül.

10) Tipikus buktatók (és hogyan kerüld el)

  • Adat-szigetek: kutatás, CRM, kampány-analitika nincsenek összekötve → gyenge jel. Megoldás: egységes ID, ETL, kulcsmezők egyeztetése.
  • Túl hosszú idő a „laborban”: fél év fejlesztés üzleti visszacsatolás nélkül. Megoldás: 4–6 hetes iterációk.
  • „Fekete doboz”: nincs magyarázhatóság → nem fogják használni. Megoldás: SHAP, top-faktorok, egyszerű baseline-ok mellett futtatni a komplex modellt.
  • Mindent egyből: 10 use case egyszerre. Megoldás: 1–2 legnagyobb hatásúval kezdeni.
  • Compliance kihagyása: GDPR, etika, bias nélkül veszélyes. Megoldás: privacy-by-design, minimum-adat, audit-napló.

11) Rövid, „vezetői” összefoglaló

A prediktív analitika pénzzé a következőképp válik:

  • kevesebb pazarlás: csak annak kommunikálsz, aki tényleg mozdítható (uplift),
  • jobb időzítés: akkor lépsz, amikor a legnagyobb a konverzió-esély (propensity + next best time),
  • kevesebb elveszett bevétel: előre látod a churn-t és korán lépsz,
  • stabil ellátás: kereslet-előrejelzéssel nem halmozol, de nem is fogysz ki,
  • fókuszált értékesítés: a csapat idejét a legértékesebb leadekre teszed.

A jó modell nem önmagában érték, hanem akkor, amikor be van kötve a napi működésbe: listákat ad az értékesítőknek, időablakot az ügyfélszolgálatnak, ár- és promóciós javaslatot a kereskedelemnek, és minden nap tanul az új eredményekből.