Felieton: Analiza danych, 
czyli o predykcji przyszłości

    Fot.: Pixabay

    Średnią uderzeń w sportach takich jak baseball czy krykiet stosunkowo łatwo obliczyć – to po prostu stosunek trafień w piłkę do wszystkich uderzeń. Nieco trudniej jest w przypadku tzw. ERA (Earned Run Avarege) – jest to statystyka dla miotacza, którą wylicza się jako stosunek liczby runów przeciwnej drużyny do liczby zmian, jakie miotacz rozegrał do momentu zejścia z boiska, pomnożony przez 9.

    Przez połowę mojego życia, a przy okazji przez większość pierwszego stulecia popularności gry w baseball w USA, były to metody określania realnej wartości gracza. Później dane statystyczne w baseballu stały się nieco bardziej skomplikowane. Zauważono, że przyznawanie niektórym graczom baz za darmo (base on balls) przekłada się na zdobywanie punktów – tak samo jak poprawne uderzenia piłki. Jednak „bazy za damo” nie wliczają się do średniej uderzeń, zatem wprowadzono pojęcie OBP (On-Base Percentage), o nieco bardziej skomplikowanej formule – jest to stosunek sumy uderzeń, baz za darmo oraz baz zdobytych w wyniku uderzenia piłką do liczby podejść do odbicia.

    Efektywność gry miotacza można również określić, mierząc, ilu biegaczy dopuścili do biegu podczas zmiany – określa to wartość WHIP (Walks and Hits per Innings Pitched) – stosunek sumy baz za darmo oraz uderzeń do liczby rozegranych zmian. Jest to dziś najbardziej miarodajna statystyka w baseballu.

    Liczy się wynik

    Jaki jest wniosek z tego trochę przydługiego wstępu? Rozwój analizy danych sportowych sprawił, że stała się ona niemal sportem samym w sobie. Teraz można zmierzyć dokładną prędkość, z jaką biegnie skrzydłowy w piłce nożnej czy footballu amerykańskim, lub dokładną trasę i odległość biegu gracza w baseballu podczas wszystkich runów w grze.

    Pomiary mają dokładność liczoną w setnych sekundy. Wykorzystywane są kamery z dużą liczbą rejestrowanych klatek na sekundę, aby określić, klatka po klatce, czy piłka wpadła do bramki, kto przybiegł pierwszy na metę, czy skoczek w dal nadepnął na linię albo czy piłka wyszła na aut. Najważniejszym momentem zatem nie jest przekroczenie przez zawodnika linii mety, ale oczekiwanie na analizę obrazu przez sędziów.

    Oczywiście wciąż w ostatecznym rozrachunku liczy się wynik. Liczy się długość skoku, czas biegu na określony dystans czy wynik meczu. Nadal to kolor medalu ostatecznie wskazuje, kto jest zwycięzcą.

    Akwizycja i zarządzanie danymi w produkcji

    Ostatnie Igrzyska Olimpijskie w Rio de Janeiro były swego rodzaju poligonem i okazją do zmierzenia swych sił dla wszystkich zajmujących się analizą danych sportowych. Podczas relacji z każdego wydarzenia oprócz zmagań zawodników na ekranie stale widoczne były wyniki pomiarów, a w tle – kamery, czujniki i sędziowie. Niemal wszystkie te metody akwizycji i zarządzania danymi można zaimplementować w przedsiębiorstwie produkcyjnym.

    Nie tylko suche dane

    Nie można jednak dać się pochłonąć suchej analizie danych. Dane same w sobie nie są odpowiedzią na wszystkie pytania – to jedynie nieprzefiltrowany obraz naszego świata. Zebrane dane są pozbawione ego, nie mają swoich doświadczeń czy złego charakteru i nie chcą celowo przekłamywać rzeczywistości – po prostu pokazują, co się dzieje w danym momencie, w danej chwili.

    Mając wystarczająco dużo punktów danych, uzyskuje się wgląd w szerszy zakres czasu. Można zobaczyć, jak wyglądała niedaleka przeszłość, ale także – przy użyciu danych z przeszłości – przewidzieć bliską przyszłość. Dzięki temu, znając liczbę przepracowanych godzin każdego z urządzeń oraz dane o przebytych awariach, można zaplanować profilaktyczną konserwację urządzeń. Dysponując predykcją niedalekiej przyszłości, można ją korygować – np. dostosować produkcję do prognozy znacznego wzrostu popytu na dany produkt.

    * * *

    Reasumując, same dane nie dają odpowiedzi, pozwalają natomiast formułować lepsze i bardziej wnikliwe pytania. Ważne jest przy tym, jak analizowane są dostępne dane i czy wykorzystywane są
    do tego celu nowe metody ich pozyskiwania oraz przetwarzania.

    Autor: Bob Vavra, redaktor naczelny Plant Engineering 


    1W baseballu jest to zawodnik wyspecjalizowany w rzucaniu piłki, zajmujący pozycję w centrum boiska.
    2Bieg przez wszystkie trzy bazy i dotarcie do czwartej – bazy domowej.