Pyramida potřeb digitální analytiky

Pyramida potřeb digitální analytiky

Internet je plný pojmů jako data science, big data, umělá inteligence, deep learning. A spousta firem cítí potřebu alespoň nějak tyto koncepty do své analytiky zahrnout. Ano, nástroje jako TensorFlow, ML Azure, Amazon API, RapidMiner a další jsou skvělé a užitečné, nicméně pod tlakem trendu se do nich firmy snaží zapojit špinavá a neúplná data v různých formátech a významech, strukturovaných způsobem, který nedává smysl, a očekávají, že jim tyto nástroje zázrakem pomohou.

Ovšem, než začnete chrlit modely, musíte si být jisti, že vaše data reflektují realitu.

Z praxe s našimi klienty víme, že většina z nich na strojové učení (Machine Learning) prostě ještě připravena není. Co se digitální analytiky týče, nejsou připraveni ani ti velcí hráči na trhu. Nejčastější příčinou je nedostatečně vybudovaná infrastruktura k implementaci a využívání algoritmů a operací z oblasti datových věd. Klasický koncept Maslowovy pyramidy potřeb se tak dá krásně aplikovat do datového prostředí. Ano, sebeurčení je skvělé, ale nejdříve potřebujete vodu, jídlo a mít kde bydlet - tedy datovou gramotnost, sběr a infrastrukturu.

Pyramida potřeb digitální analytiky

Pyramida potřeb digitální analytiky (inspirována Monicou Rogati)

Naši klienti se pohybují v celém spektru pyramidy, majoritní většina těch nových je ovšem na jejích nejnižších stupních. Mají problém se základním nastavením sledování behaviorálních dat a vyžadují alespoň nějakou práci se správným nastavením GTM nástroje a Google Analytics, aby přesně sledovali vše, co uživatel dělá na svých webových stránkách a v aplikacích. Protože, abyste mohli dělat pokročilé analýzy, potřebujete mít data v pořádku.

Tedy, úplně nejzákladnější je zodpovědět si otázky, jaká data potřebujete a která jsou dostupná? Pokud nabízíte produkty a služby zákazníkům, produkujete a sbíráte všechny relevantní uživatelské interakce? Jak složité je zaznamenávat interakce, které ještě nemáte, a jsou pro další analýzy nezbytné? Správný datový soubor je to, co umožňuje pokroky v dalších fázích.

Následně řešíte, jaký je tok dat skrz vaše nástroje a systémy. Máte spolehlivé datové pumpy (ETL) pro transformaci dat? Kde máte data uložena a jak snadný je k nim přístup pro možnosti analýz? Spolehlivý datový tok je klíč k jakékoliv práci s daty. Následný krok je jejich průzkum, čištění a transformace. Data o zákaznicích se poskládají do jednotlivých session. Čištění dat je velmi podceňovanou činností, bez ní ovšem spolehlivost analýz silně klesá. Tohle je fáze, kdy máte zjistit, že vám chybí potřebná data, jsou chybná, špatně pochopena, jsou vynechávány některé události – a vrátit se na začátek pyramidy.

Pokud jste schopni spolehlivě prozkoumat a vyčistit data, víte, že integrace dat z různých zdrojů je stabilní, můžete se posunout k modelování čili tomu, co se obecně nazývá jako Business Intelligence nebo datová analytika. Definujete metriky ke sledování, jejich sezónnost a citlivost na různé faktory. Můžete se pustit do hrubé segmentace svých zákazníků, která může přinést nějaké zajímavé informace. Skládáte dashboardy, analyzujete a detekujete anomálie v datech. Z této fáze by mělo vyplynout, co chcete dále sledovat, určit či předvídat, a můžete začít s přípravou trénovacích dat generováním labelů (např. který zákazník konvertoval) pro modely strojového učení.

Pokud se vaše firma pouští do práce s daty, které ovlivňují vaše koncové zákazníky, je potřeba začlenit alespoň jednoduché A/B testování nebo jiný experimentální rámec, aby se změny daly implementovat postupně bez rizika velkých katastrof a získaly se tak hrubé odhady účinků změn dříve, než budou mít dopad na všechny zákazníky. V tomto kroku je také vhodné nastavit primitivní základ pro modelování. Jednoduché heuristiky je překvapivě těžké porazit a dokáží vyladit celý systém bez tajemných black-boxů strojového učení.

Nyní je čas na jednoduché algoritmy strojového učení jako regrese nebo rozdělování. Teď můžete přemýšlet o dalších datech, kterými obohatit modely a zlepšit váš výkon (zahrnete například data o počasí). Optimalizujete a automatizujete jednotlivé kroky. Segmentace je založena nad více daty a jste schopni své segmenty ladit. Teď se můžete dotknout vrcholku pyramidy a pustit se do složitějších metod strojového učení…

Využívejte technik prediktivní analytiky a strojového učení tak, abyste dosáhli lepších výsledků v tom, co děláte jako core business.

Není nutné od začátku stavět obrovskou základnu dat. Někdy se stačí zaměřit na konkrétní bussinesový problém a vytvořit takzvaný minimálně životaschopný produkt. Začnete stavět pyramidu vertikálně a problém kompletně vyřešíte. Jakmile budete mít postavenou pyramidu, můžete ji rozšiřovat horizontálně o další klíčové otázky vašeho podnikání a data s nimi spojenými. Vždycky si nejprve položte otázku, a pak teprve budujte datový produkt, který pomůže jejímu vyřešení.

Dostat se na takzvaný minimální základ nemusí trvat rok a nepotřebujete k tomu množství drahých nástrojů. Vždy existují průběžné kroky, které přinesou užitečné výsledky. Důležité je vědět, co chcete (jaký je business case), znát současný stav a plán postupu až na vrchol pyramidy. Jak budete postupovat pyramidou směrem nahoru, objevíte nové možnosti a pohledy na data. Pokud máte nastavené vše správně, zajistíte si flexibilitu pro pozdější zlepšování a modifikace digitální analytiky.

U našich zákazníků provádíme nejprve audit dat, abychom zjistili, kde si stojí, a co je potřeba udělat, abychom mohli začít s pokročilejšími analýzami. Tento proces je celkem rychlý a bezbolestný a většinou přinese nějakou okamžitou hodnotu spolu s plánem dalších větších kroků.