Prediktív analitika a piacfelmérésben

Hogyan lesz a tényekből előrejelzés – és az előrejelzésből profit?

A piacfelmérés klasszikus célja az, hogy megértsük a jelent: kik a vevőink, milyen igényeik vannak, hogyan értékelik a márkát, mi zavarja őket a vásárlásban. A döntések azonban mindig a jövőre vonatkoznak: mikor és mennyit érdemes gyártani, melyik ajánlat hoz több bevételt, melyik célcsoport fog konvertálni, hogyan változik a kereslet szezonban, áremelésnél, kampány idején. Itt lép be a képbe a prediktív analitika: a történeti adatokból és aktuális jelzésekből előrejelzi a várható viselkedést, és ezeket az előrejelzéseket operatív döntésekké fordítja.

Ez az útmutató gyakorlati szemmel mutatja meg,

mit jelent a prediktív analitika piacfelmérésben,
milyen modellek működnek a valóságban,
milyen adatokat érdemes összerakni,
hogyan mérjük a minőséget (nem csak „szép grafikonokban”),
és hogyan ültetjük át a szervezet működésébe úgy, hogy attól még gyorsabb, okosabb és nyereségesebb legyen az üzlet.

1) Mi az a prediktív analitika – és miben több a leíró elemzésnél?

Leíró (descriptive): „Mi történt?” – riport, dashboard, NPS/CSAT, piaci részesedés, kampányeredmények.
Diagnosztikus (diagnostic): „Miért történt?” – korrelációk, hipotézisek, szegmentáció.
Prediktív (predictive): „Mi fog történni?” – konverziós valószínűség, churn kockázat, kereslet-előrejelzés.
Előíró (prescriptive): „Mit tegyünk?” – ajánlott akció: melyik csatornán, milyen ajánlattal, mikor lépjünk.

A piacfelmérés klasszikusan az első kettőre fókuszál. A prediktív hozzáadott értéke, hogy a riportokból akcióképes döntéstámogatás lesz: nem csak megmondjuk, hogy „a 25–34-es korosztály kedveli a csomagot”, hanem megmutatjuk melyik 25–34-es és melyik üzenettel fog konvertálni a következő 14 napban.

2) Milyen üzleti kérdésekre ad választ?

Kereslet-előrejelzés: termék/szolgáltatás volumene régió, csatorna, hét napja szerint.
Konverzió-előrejelzés: lead → vásárló valószínűsége, „next best offer”, „next best time”.
Árérzékenység és árrugalmasság: hogyan hat egy 5–10% árváltozás a mennyiségre és árrésre.
Churn/lemorzsolódás: ki fog elpártolni a következő 30–90 napban; milyen jelzés előzi meg.
Uplift modellezés: kinek érdemes kampányt küldeni, mert miatta fog változni a viselkedése (nem csak „aki amúgy is vásárolna”).
Termékportfólió-optimalizáció: melyik kombináció húzza fel a kosárértéket vagy hűséget.
Új piacra lépés: régiók/klaszterek potenciáljának előrejelzése (demográfia, fizetőképesség, versenyhelyzet).

3) Adat – a predikció „üzemanyaga”

3.1. Források, amiket érdemes integrálni

Kutatási adatok: kérdőívek (CAWI/CATI), fókuszcsoportból kinyerhető kvantifikált jegyek (pl. kulcsszavak).
CRM/értékesítés: lead státuszok, kampányok, konverziók, kosár, ismételt vásárlás.
Kampánylogok: csatorna, kreatív, frekvencia, megnyitás/kattintás, hívás-időzítés.
Web/app analitika: session-ek, események, források, funnel-lépések.
Transzakciós/ERP: árak, készlet, akciók, visszáruk.
Külső jelzések: szezon, időjárás, makrotrendek, versenytársi árfigyelés, lokációs adatok.

3.2. Feature engineering – a „titkos szósz”

A nyers mezők ritkán prediktívek. Erősebb jel származtatott változókból jön:

RFM: Recency (utolsó aktivitás), Frequency (aktivitások száma), Monetary (költés).
Időablakos aggregátumok: utóbbi 7/14/30 nap eseményei (kattintás, kosár, hívás).
Idősoros dekompozíció: trend, szezon, ünnepnap-hatás, promóciós impulzus.
Interakciós változók: pl. „ár × promóció jelenlét”, „csatorna × napszak”.
Szöveg/NLP: ügyfél-üzenetekből szentimentelemzés, témamodellek (pl. LDA), kulcsszavak.

4) Modellek – mit érdemes használni?

4.1. Klasszikus baseline-ok

Logisztikus regresszió: konverzió/churn valószínűség; jól magyarázható.
OLS/GLM: mennyiségi előrejelzés (eladott darab, kosárérték).
ARIMA/ETS: idősoros kereslet (bolt-szint, napi/ heti).

4.2. Gépi tanulás

Random Forest / Gradient Boosting (XGBoost, LightGBM, CatBoost): erős általános teljesítmény, nemlineáris hatások, jó „tabular data” esetén.
Survival/Cox modellek: churn/időzítés (mikor következik be az esemény).
Uplift modellek (T-learner, S-learner, Causal Forest): ki változtat viselkedésen, ha hatás éri (kampány, árváltás).
Propensity score modellek: konverziós hajlandóság.
Idősoros ML: Prophet, LightGBM idősori featurizálással (szezon, ünnep, promóció, időjárás).

4.3. Kísérletezés (A/B, többkarú bandita)

Predikciót validálni is kell. A jó gyakorlat: előrejelzés + kontrollált kísérlet (A/B) → valódi ok-okozat. Többkarú banditák dinamikusan osztanak költséget a jobban teljesítő kreatív/időzítés felé.

5) Mérőszámok – mivel bizonyítjuk, hogy jó a modell?

Klasszifikáció (konverzió/churn): AUC/ROC, PR-AUC (ritka eseménynél fontosabb), logloss, lift@k (pl. a top 10% lista hányszorosan jobban teljesít az átlaghoz képest).
Regresszió/kereslet: RMSE/MAE (üzleti skálán is értelmezve), sMAPE, WAPE.
Uplift: Qini görbe, uplift@k (tényleges inkrementális hatás a kezelt vs. kontroll között).
Forecast bias: mennyire optimista/pesszimista rendszeresen; service level: a kereslet mekkora részét fedezi a készlet.

Fontos: mindig legyen üzleti KPI-áthidalás: „+1 AUC pont = hány Ft inkrementális bevétel / megtakarítás?”. E nélkül a modell-szépség nem lesz döntés.

6) Bevezetés – hogyan lesz a modellből működő rendszer?

6.1. MLOps / DataOps alapszabályok

Verziózás: adat, kód, modell, hiperparaméterek – mind dokumentálva.
Újratanítás: szezon, piaci változás kötött ütemben (pl. havonta).
Drift monitoring: ha az adatdisztribúció elcsúszik (új célcsoport, új csatorna), jelezzen.
Shadow/Champion–Challenger: új modell párhuzamosan fut a régivel; veszély nélkül mérhető.

6.2. Döntéstámogatás – ember a körben

Ajánló/végrehajtó réteg: értékesítőnek lead-sorrend, ügyfélszolgálatnak „next best action”, kampánymenedzsernek célzás-lista.
Magyarázhatóság: SHAP/feature importance vizualizáció – „miért ezt ajánlja?”. A bizalom kulcsa.
Feedback loop: a végrehajtott akciók eredménye visszamegy tréning-adatnak (önjavító rendszer).

7) Adatvédelem, etika, bias

Jogalap & minimál-adat: csak a szükséges mezőket használd; anonimizálj, ahol lehet.
Átláthatóság: ha az ajánlás „érzékeny” döntést befolyásol (hitel, árképzés), kell magyarázhatóság.
Bias-tesztek: csoportonkénti teljesítmény; ne „büntessen” kisebbségi szegmenst.
Governance: ki felel az adatért, ki a modellért, ki dönt az éles bevezetésről?

8) Gyors „receptkönyv” tipikus feladatokra

8.1. Kereslet-előrejelzés (retail/D2C)

Adat: napi eladások bolt × SKU, ár, promó, készlet, időjárás, ünnep.
Modell: Prophet / LightGBM idősori featurizálással.
Kimenet: heti előrejelzés konfidencia-sávval + készletajánlás.
Üzleti haszon: készlethiány-csökkenés, eladatlan készlet visszafogása.

8.2. Lead konverzió (B2B)

Adat: forrás, iparág, cégméret, szerepkör, tartalomfogyasztás, hívásnapló.
Modell: logisztikus regresszió / XGBoost.
Kimenet: lead-score, next best time, „kinek telefonáljunk ma?”.
Üzleti haszon: sales fókusz a top 10–20%-ra → több meeting ugyanannyi hívással.

8.3. Churn előrejelzés (előfizetés)

Adat: használati ritmus, hibajegyek, számlázás, kampányreakciók, NPS.
Modell: survival / XGBoost.
Kimenet: churn valószínűség + ajánlott retenciós akció.
Üzleti haszon: célzott mentés – kedvezményt csak azoknak, akiket tényleg megfordít.

8.4. Árrugalmasság / promóciós hatás

Adat: ár, promóció, polchelly, versenytársár (scrape), mennyiség.
Modell: GLM/Elastic Net + idősori komponensek.
Kimenet: „+5% ár → −x% mennyiség” görbe termékszinten.
Üzleti haszon: fedezet-optimalizált ár- és promóciós naptár.

8.5. Uplift modellezés (kampány)

Adat: kezelt vs. kontroll, reakció, felhasználói jegyek.
Modell: Causal/Uplift Forest.
Kimenet: „persuadable” lista – kiknél okoz hatást a kampány.
Üzleti haszon: kevesebb pazarlás, több inkrementális nyereség ugyanannyi költésből.

9) Szervezeti bevezetés – hogyan lesz fenntartható?

Egyértelmű üzleti cél: „Mire használjuk?” – ne „mert menő”.
Kis pilot, gyors visszacsatolás: 4–6 hét, 1 KPI.
Tulajdonosok kijelölése: adatos, modellező, döntéshozó.
„Human-in-the-loop”: a szakértő jóváhagy – növeli a bizalmat.
Dokumentáció és oktatás: érthető anyagok a végfelhasználónak (értékesítő, kampánymenedzser, operátor).
Folyamatos karbantartás: szezon, piac, termék változik → modell frissül.

10) Tipikus buktatók (és hogyan kerüld el)

Adat-szigetek: kutatás, CRM, kampány-analitika nincsenek összekötve → gyenge jel. Megoldás: egységes ID, ETL, kulcsmezők egyeztetése.
Túl hosszú idő a „laborban”: fél év fejlesztés üzleti visszacsatolás nélkül. Megoldás: 4–6 hetes iterációk.
„Fekete doboz”: nincs magyarázhatóság → nem fogják használni. Megoldás: SHAP, top-faktorok, egyszerű baseline-ok mellett futtatni a komplex modellt.
Mindent egyből: 10 use case egyszerre. Megoldás: 1–2 legnagyobb hatásúval kezdeni.
Compliance kihagyása: GDPR, etika, bias nélkül veszélyes. Megoldás: privacy-by-design, minimum-adat, audit-napló.

11) Rövid, „vezetői” összefoglaló

A prediktív analitika pénzzé a következőképp válik:

kevesebb pazarlás: csak annak kommunikálsz, aki tényleg mozdítható (uplift),
jobb időzítés: akkor lépsz, amikor a legnagyobb a konverzió-esély (propensity + next best time),
kevesebb elveszett bevétel: előre látod a churn-t és korán lépsz,
stabil ellátás: kereslet-előrejelzéssel nem halmozol, de nem is fogysz ki,
fókuszált értékesítés: a csapat idejét a legértékesebb leadekre teszed.

A jó modell nem önmagában érték, hanem akkor, amikor be van kötve a napi működésbe: listákat ad az értékesítőknek, időablakot az ügyfélszolgálatnak, ár- és promóciós javaslatot a kereskedelemnek, és minden nap tanul az új eredményekből.