Data jsou zlatem moderní doby a datoví analytici jsou vlastně moderní zlatokopové. Prorektor VŠE Ota Novotný již několik let učí, jak se tohle „zlato“ správně hledá a co všechno s ním lze dělat. A jak říká, po lidech studujících datovou analytiku je ve firmách obrovská poptávka. Jak by také ne, když jich podle odhadů chybí v české ekonomice tisíce až desetitisíce.
Občas se říká, že data jsou zlatem moderní doby. Jestli to platí, pak jsou datoví analytici moderní zlatokopové. Je jich v Česku dostatek?
Určitě není.
Kolik bychom jich tedy potřebovali?
Na to jsou různé výzkumy. Podle některých jich v Česku chybí tisíce, podle jiných dokonce desítky tisíc. Záleží, jak se na tuto profesi díváte. Jestli „pouze“ jako na specialistu pracujícího na pozici datový analytik, takoví většinou pracují v nějaké velké firmě, která má své vlastní analytické oddělení. V každé firmě ale potřebujete člověka, který umí analyticky pracovat s daty, aby je mohl využívat pro svou profesi. A tady jsou to opravdu desítky tisíc chybějících.
Roste zájem o datovou analytiku?
Určitě ano. Je to vidět i na zvyšujícím se počtu firem, které s námi spolupracují. Když jsme před sedmi lety začínali se studijními programy pro analýzu dat na VŠE, tak jsme měli tři firemní partnery. Teď jich je přes třicet a jejich počet se bude dál rozšiřovat.
Jaké studijní programy v této oblasti vlastně nabízíte?
Máme jak program pro bakaláře, tak i magistry a rovněž program MBA. Ročně u nás ve všech těch programech studuje kolem 170 až 180 lidí. Kdybychom napočítali studující všech vysokoškolských univerzitních programů tohoto typu v celé České republice, dostaneme se možná ke čtyřem stovkám. V poměru k potřebám Česka je to samozřejmě stále málo. Proto máme i programy, jež pomáhají firmám vyškolit vlastní zaměstnance jako datové analytiky. Jejich součástí je i kurz Datové minimum, je to vlastně zážitková hra, která se ve firmách používá k vytipování lidí, kterým datová analýza jde a mají v ní potenciál.
Jak se pozná, že má člověk pro datovou analýzu předpoklady? Jaké schopnosti a vlastnosti by měl mít?
Předně musí mít nadhled, musí mít otevřenou hlavu a schopnost přemýšlet, jak věci, s nimiž se v realitě setkává, uchopit a transformovat do datového problému. Měl by mít byznysové znalosti. Když máte člověka se skvělými datovými znalostmi, ale musíte mu od základů vysvětlovat, jak to v dané firmě funguje, tak je jeho použitelnost významně menší.
Dnes můžete sbírat ve firmě spoustu dat. Když ale nevíte, proč je sbíráte, tak vytvoříte velký balast, který je k ničemu.
Kde dělají firmy při datové analýze chyby?
Nejdůležitější je vědět, k čemu vlastně datovou analýzu potřebuji. Spousta lidí ve firmách si myslí, že nasazení nástrojů pro analýzu přinese nějakým kouzlem hodnotu samo o sobě. Když se jich ale zeptáte, co vlastně tou analýzou potřebují zjistit, tak to nedokážou určit. Na začátku je tedy nutné pokládat si ty správné otázky. Pak určitě platí, že méně je více. Dnes si do cloudové technologie můžete v podstatě nasypat všechna firemní data, když to tedy vaše kreditka unese. Ale pokud nevíte, proč je tam máte, tak akorát vytvoříte obrovský balast, který může v důsledku napáchat víc škody, než kdybyste data nesbírali vůbec. Proto také vždycky na začátku datové analýzy lidem říkám, aby si určili, co je pro ně důležité. Nemělo by to být dvacet věcí, ale třeba jen tři. Když pak ve firmě neměříte desítky věcí, ale jen tři a o ně tu firmu opřete, tak to najednou funguje mnohem lépe.
Už několik let pořádáte KPMG Data Festival. Oč vlastně jde a proč jste se do takové akce pustili?
Je to akce, jejímž cílem je dostat do datařiny co nejvíce lidí. Proto je to také zdarma pro všechny, kdo se chtějí zúčastnit. Původně jsme mířili především na studenty, ale postupem času se ukázalo, že zájem mají i lidé z malých a středních firem a nyní nás navštěvují i týmy z firem velkých – každý si na festivalu najde to svoje. Každý rok se zaměřujeme na některé téma, letos v říjnu to bude na téma „datového podsvětí“ – nepořádku v datech. Firmy se dnes spíš potýkají s tím, že mají dat moc, ale vzhledem k nepořádku, ze kterého někdy vznikají, jim nemohou stoprocentně věřit.
Když se středně velká firma rozhodne, že si udělá pořádek v datech, jak dlouho jí to podle vašich zkušeností zabere?
Řekl bych, že tak půl roku až rok. To, že firma má svoje data někde uložená, totiž vůbec neznamená, že půjdou dobře vytěžit. Myšlenka, že se data někam nasypou a ono z toho něco rychle vypadne, je naivní. Je za tím strašně moc práce.
Jak si představit výsledný produkt takové analýzy? Je to v té nejjednodušší formě třeba excelovská tabulka?
Excelovská tabulka je něco, čeho se upřímně chceme vyvarovat. Excelovská tabulka vám třeba vyplivne seznam faktur. Když jich je ale dvacet tisíc, tak jsou vám k ničemu, protože se v tak dlouhém seznamu ztratíte. Když na tato data ovšem aplikujete nějaký pokročilejší nástroj, najednou se na ty faktury můžete dívat třeba přes zákazníky, přes produkty, které kupují, a tak dále. Díváte se tedy zpětně, co se v té dané firmě stalo. Při použití dalších nástrojů se můžete dobrat toho, proč se to stalo. A dokonce pak můžete s určitou mírou pravděpodobnosti predikovat, co se stane v budoucnosti. Poslední fáze je, že nasadíte technologie, které budou zabraňovat nebo podporovat to, co by se v té budoucnosti mohlo stát. V současnosti se ale v Česku potýkáme s tím, že spousta firem má vůbec problém zpracovat data tak, aby zjistily, co se v jejich podniku vůbec stalo. Pokud nemáte v datech pořádek, tak ty další fáze prostě nemají smysl.
Ota Novotný
Prorektor pro rozvoj a corporate relations na Vysoké škole ekonomické v Praze. Vystudoval Vysokou školu ekonomickou v Praze, kde získal i titul Ph.D. v oboru informatika. Od roku 1996 zde na katedře informačních technologií přednáší problematiku business intelligence, měření výkonnosti informačních systémů a jejich auditu.
Jsou-li data neúplná nebo nepřesná, mohou přece výsledky jejich analýzy napáchat víc škody než užitku.
To samozřejmě ano a už se to také několikrát stalo. Naposledy pamatuji, že se během pandemie v jedné zemi vycházelo z datového zdroje v Excelu, který má limitovaný počet řádků. Záznamů, které do něj vstupovaly, bylo ale dvakrát tolik, tudíž se polovina dat vůbec do analýzy nedostala a výsledky byly hrubě zkresleny. Když pak nemáte kontrolní mechanismy, může snadno dojít ke katastrofě. Neustálá kontrola procesů, které data ve firmě připravují, je naprosto nezbytná.
Když se podíváme na srovnání se zahraničím, umí české firmy dobře analyzovat svá data?
Srovnání se rozhodně nemusíme bát, určitě nezaostáváme. Česko je již řadu let špičkou v regionu ohledně zpracování dat. Řada velkých nadnárodních společností k nám přesunula svoje centra analýzy dat, naopak české firmy nabízející služby datové analytiky expandují do zahraničí. V Česku vznikla také řada zajímavých start-upů založených právě na analýze dat.
Na druhou stranu je zde stále prostor pro zlepšování – zejména v sektoru malých a středních firem – v tom se ale nelišíme od našich sousedů v regionu.
Jak datovou analýzu promění nástup umělé inteligence?
Víme, že změna nastane, že bude velká, jen zatím nevíme, jak bude konkrétně vypadat. Už dnes hodně zrychluje proces přípravy podkladů pro datové analýzy. Jinak řečeno – už není třeba tolik programovat nebo nastavovat, tyhle úlohy lze zadat umělé inteligenci. Tím pádem je možné se mnohem rychleji dostat k vlastní analýze a hledání odpovědí. I v této fázi se práce s daty bude měnit a zrychlovat – například už nyní je možné místo klikání do reportů nebo analytických dashboardů pokládat umělé inteligenci otázky, aby sama v datech něco našla a pokusila se interpretovat. Na druhou stranu bude podle mě vždy spíš pomocnou rukou a pořád bude zapotřebí člověka s kritickým myšlením, který získané odpovědi musí se znalostí firemního kontextu ověřit.
Sběr a analýza dat s sebou přináší bezpochyby i řadu etických otázek. Věnujete se jim třeba už ve výuce?
Určitě ano a platí, že se etickými aspekty téhle práce zabýváme čím dál víc. Bez toho to nejde. Vy když pracujete s daty, získáte hlubokou znalost firmy i jejích zákazníků a bez určité formy etiky by datový analytik určitě pracovat neměl. Já osobně se ale snažím do studentů dostat, že by je mělo vždy zajímat, zda se jejich datová analýza používá pro dobro, nebo pro zlo. A vím o datových analyticích, kteří odešli z firem, protože nebyli přesvědčeni, že jejich činnost je etická.