Adatvizualizáció

Írta: Tanos Bálint

Nos, akkor a folytatás folytatásaként az adatvizualizációról, avagy miért jobb minden grafikonon ábrázolva? Semmi matek, csak a színek 😀 (A cikk eredetije elérhető az alábbi linken ITT)
Az előző részben azt fejtegettem, hogy gyűjtsük az adatainkat, mert anélkül teljes vakrepülésben dolgozunk. Most mutatok pár egyszerű példát arra, hogy mit lehet kezdeni az összeszedett adatokkal anélkül, hogy egyetlen képletet előrántanánk, vagy számítást elvégeznénk. Az adatvizualizációban pont az a klassz, hogy az esetek jó részében az ábrák magukért beszélnek. Éppen ezért itt most nem fogok hivatkozni semmilyen statisztikai fogalomra, csak megmutatom az ábrázolt adatokat, és hogy mit lehet érdemes rajtuk nézni. Mondanom sem kell, hogy szándékosan egyszerű és jól értelmezhető példákkal dolgoztam, de meglepő módon az edzői gyakorlatban is vannak ilyenek.

Kezdjük egy könnyed edzéstervezős példával! Tegyük fel, hogy terveztem egy hullámoztatott edzésciklust, ahol elvárásom, hogy a volumen és az intenzitás (legyen ezúttal a relatív intenzitás, bár ez tökmindegy a példa szempontjából) egymással mindig ellentétes irányba mozogjon. Nyilván a számokon is látszik, de ha elsiklott volna a tekintetem fölötte, az adatvizualizációm – egy közönséges vonalgrafikon, ahol a bal skála a volument, a jobb pedig a relatív intenzitást jelöli – azonnal érzékelhetővé teszi, hogy valami nem teljesen okés a tervben.

A sötétzöld vonal jelzi, hogy két helyütt az intenzitás nem csökken, ahogy a volumen emelkedik. Ha ez a stratégiám része, remek, ha nem, akkor viszont könnyen észrevehetővé tettem, és javíthatom. (A sötétzöld vonal nem a grafikon része, hanem utólag húztam be, de egyébként bele is lehet rakni egy Google Sheets grafikonba ilyen hibafigyelő feature-t, ha épp ez a perverziónk; az enyém ez, de tudjuk, hogy fura figura vagyok.)
Javítom tehát a hibát, és a grafikon automatikusan frissül is, immáron úgy néz ki, ahogy kell.

 

 

 

Feladat: találj két különbséget a grafikonon 😀 (A cím nem számít!)Joggal merülhet persze fel, hogy azért az ember csak észreveszi a számokból, hogy sikerült-e hullámoztatnia a tervet. Ez egyébként ha elég sok szám van a tervben, nem  mindig sikerül, de elfogadhatjuk jogos felvetésnek. Viszont a legtöbb edzésterv nem egy gyakorlatból szokott állni (még Pavel is kettőt használ! :D), és minél több a tényező, annál nehezebb csak a számokból kiokoskodni például azt, hogy sikerült-e ellentétesen hullámoztatnunk a két gyakorlatot. Ez több módon valósulhat meg, itt most pl. azt szeretnénk, ha amikor az egyik gyakorlat intenzitása éppen nő, a másiké csökkenjen, és ugyanígy történjen a volumennel is, miközben mindkét gyakorlat a fenti módon hullámoztatva van. No ennek ellenőrzése csak a számokból már egy fokkal szaftosabb feladat, de egy jó ábra, mint tudjuk, segít a bajban (vagy az a cserkész? mindegy): 

Az ábra csak első pillantásra látszik zűrösnek: a sárga és a kék vonal mutatják, ahogy a két gyakorlat intenzitása kúszik fel, és soha nincs mindkettő az aktuális hullám csúcsán, tehát ellentétesen mozognak, ahogy terveztük – ugyanezt látjuk a volumennel a piros és zöld vonalakkal. Ez jó vizuális megerősítés arra, hogy a tervezési munka jó volt. Persze semmit nem árul el arról, hogy a sportoló mit fog produkálni a ciklus végén, de hát ez csak egy vonaldiagram, ne várjunk tőle csodát!
Eddig könnyű volt, mert igazából csak a megtervezett edzéseink paramétereit vizualizáltuk, nézzünk most egy olyat, ahol méréseket teszünk ki grafikonokra. Ez lesz az igazán érdekes rész, a jutalom, amiért idáig olvastál 😀
Tegyük fel, hogy sportolónknak mérjük a nyugalmi pulzusát, és ezt minden edzésnapon (vagy minden nap) feljegyezzük. Ez nyilván nem nagy mutatvány, de önmagában nem is árul el sokat, ha van egy ilyenünk: 

 

Azonban ezzel az adatsorral több mindent tudunk kezdeni, és a vizualizációkkal új és új információkhoz juthatunk hozzá. Például kitehetjük a pulzusértékeket egy hisztogramra. (Pici egyszerűsítéssel) a hisztogram vízszintes tengelyén az egyes pulzusértékek vannak, a függőleges tengelyén pedig az egyes pulzusértékek gyakorisága. 

Látható, hogy az 50 mért napból a leggyakrabban 56 és 58 között, az esetek többségében 52 és 62 között volt az RHR, az e fölötti értékek ritkák. Ez már nem haszontalan, mert ha sportolónk eztán 65-ös nyugalmi pulzust jelent, sejthetjük, hogy _valami_ van, bár ezen a ponton nem tudhatjuk feltétlen, mi az a valami, de óvatosságra vagyunk intve a szokatlanul magas érték által, amelynek szokatlanságát éppen a hisztogram árulta el.

További lépésként feltehetjük a nyugalmi pulzusokat egy oszlopdiagramra időrendben: 

 

Ezen a diagramon a vízszintes tengelyen az idő, a függőleges tengelyen a pulzus van. A halvány kék vonal a trendvonal, ami azt mutatja egyszerűsítve, hogy úgy nagy általánosságban merre haladnak az adataink, csökkenő, vagy növekvő tendenciát mutatnak. A trendvonalunk emelkedik, ami arra utal, hogy a sportoló nyugalmi pulzusa növekszik – az megint csak rajtunk áll, hogy ezzel az információval mit kezdünk, értékelhetjük akár figyelmeztető jelnek is. (Ez már azon múlik, hogy mit gondolunk a nyugalmi pulzusról mint indikátorról.) 

Természetesen – és itt válik a dolog igazán izgissé, gratulálok, hogy még olvasol 😀 – a nyugalmi pulzus adatainkat összevethetjük valamilyen más mérőszámmal, pl. a sportolóval minden nap végeztetünk valamilyen felugrásos gyakorlatot, és mérjük a súlypontemelkedést. Ha ez a második mérőszám a sport szempontjából releváns, akkor közvetlen visszacsatolást kapunk a sportteljesítmény valamilyen aspektusára. A lenti pontdiagram tulajdonképpen egy koordinátarendszer, amelynek vízszintes tengelyén a nyugalmi pulzus, függőleges tengelyén pedig a felugrás magassága van, azaz minden pötty az mutatja, hogy egy adott napon a sportoló milyen RHR mellett milyen magasra ugrott. 

Ehhez is passzítottunk egy trendvonalat (ezeket a gép számolja, nem én rajzolom be), ami egy nagyon egyértelmű összefüggést rajzol ki: minél alacsonyabb a sportolónk nyugalmi pulzusa, annál magasabbra ugrik. [Hangsúlyozandók: a) az összefüggés NEM azt jelenti, hogy a nyugalmi pulzus miatt ugrik magasabbra a sportoló, tehát okozati összefüggés nem szükségszerűen van jelen!, b) ez egy fiktív példa, generált adatokkal.] Ennek fényében új értelmet nyer minden korábbi diagrammunk: a nyugalmi pulzussal elég jó eséllyel fogjuk tudni, hogy milyen ugrásokat várhatunk a sportolótól – ez lehet akár egy fontos tényező a sportjában -, és tudjuk, hogy az ugrások tekintetében aggodalomra adhat okot a növekvő nyugalmi pulzus. Puszta érdekességképpen, hogy miért hasznos a trendvonal (és miért lesznek hasznosak a számok ezeknek az összefüggéseknek a kvantifikálásra) itt hagyom az ugrásmagasságokat időben – ha nem tudnánk előre, hogy mire kell figyelni, nem biztos, hogy felkapnánk a fejünket a tendenciára, főleg, ha csak a számokat látnánk ábrázolás nélkül.

 És ímé, egy csomó dolgot megtudtunk bármiféle kézi matekozás nélkül (a gép azért matekozott nekünk, de az meg az ő baja ugye), pusztán azáltal, hogy a begyűjtött adatainkat feldobáltuk chartokra. A dolog persze képes ennél sokkal komplexebb méreteket ölteni, de az edzői monitorozáshoz ezek nem feltétlenül szükségesek.
Aki ezen kis ízelítő után sem kapott kedvet az adatvizualizációhoz, annak az itt elvesztgetett húsz percét irodánkban jóváírjuk “adatvizualizáció edzőknek” c. (még) fiktív tanfolyamunkra adott kedvezmény formájában. Aki meg kedvet kapott, annak meg azért

Vélemény, hozzászólás?