Dane, zwinność, chudość i wartość biznesowa

Data: 2019-07-04
Autor: Sebastian Konkol
Dane, zwinność, chudość i wartość biznesowa

Zwinność (agile) i chudość (lean) to terminy, które na dobre już zintegrowały się z myśleniem o rozwoju systemów informatycznych. Wiemy już jak zwinnie realizować projekty informatyczne, a nawet z relatywnie dużym prawdopodobieństwem umiemy tę wiedzę wykorzystać w praktyce. Aplikujemy tę wiedzę jednak do sfery funkcjonalności rozwiązań informatycznych, nie zaś do sfery danych. Jak zbudować fundament dla zwinności w sferze danych? O tym właśnie poniżej.

Od dawna już wiemy, że wolumen danych rośnie nieprawdopodobnie, że wzrasta różnorodność struktur i formatów danych. Wiadomo co więcej, że zwiększa się tempo zmienności tych cech. Trochę na to pozwoliliśmy skupiając się na sferze funkcjonalnej rozwiązań informatycznych, nieco zaniedbując obszar danych. W konsekwencji w miejsce wyidealizowanych Data Lakes powstają zwykle Data Swamps, a wydobycie wiarygodnej wiedzy biznesowej z coraz mniej wiarygodnych zasobów danych staje się z każdym rokiem znacząco kosztowniejsze. W odniesieniu do danych agile nie nadaje się do zaaplikowania tak, jak jest aplikowany do funkcjonalności. Podejście eksperymentów małymi kroczkami nie działa dla danych co najmniej z dwóch powodów. Po pierwsze, o ile można zacżąć od realizacji prostej funkcji aplikacji i umożliwić jej użytkowanie, o tyle operowanie na jednej klasie danych niewiele wnośi. Innymi słowy, MVP z perspektywy wymagań funkcjonalnych jest zwykle znacząco mniejsze, niż MVP dla danych, if you know, what I mean. Po drugie, z danymi jest jeden kłopot, że raz wyprodukowane dane nigdy nie są poprawiane (tak, jak funkcjonalności) – jak głosi mantra „ludzi od danych” – aplikacje się zmieniają, a dane pozostają. Efekt jest oczywisty: im więcej zwinności w sferze funkcjonalnej, tym większy bałagan w danych, a rachunek przychodzi z dużym opóźnieniem miesięcy lub nawet lat, bowiem dowiadujemy się o tym dopiero wtedy, kiedy chcemy wydobyć wartość z takich danych. Każde użycie takich danych wymaga różnych operacji (o często magicznych nazwach), które sprowadzają się jednak do znanej pracy czyszczenia danych. Ekonomia jest tu nieubłagana – jeśli czyszczenie danych wykonywane jest nie na wejściu, tylko na wyjściu, to kosztuje za każdym razem, kiedy chcemy użyć danych, a im bardziej chcemy ich użyć, tym kosztowniejsze jest „odbagnianie” danych. Część wysiłku zapewnienia jakości danych – czasem mała, a czasem znacząca – musi być włożona upfront, gdyż bez tego nie ma sensu składować danych, których nikt nie odważy się rutynowo użyć.

No tak, ale tak jak biznes zależy w coraz większym stopniu od danych, zwinność w biznesie (warunek utrzymania się na powierzchni) wymaga także zwinności w danych. Jak to osiągnąć? Przepis w trzech krokach

Po pierwsze, będę niepopularny i „nieedżajlowy”, trzeba trochę się napracować na samym początku. Konieczne jest osiągnięcie zrozumienia klas danych, jakie mają znaczenie dla prowadzenia biznesu – zbudowanie wiedzy o danych. Opiera się to na dość tradycyjnym podejściu, określenia definicji obiektów danych, ich cykli życia i wzajemnych powiązań oraz zrozumienia ich wpływu na działalność biznesową (np. sposób i intensywność użytkowania w różnych obszarach działalności, procesach biznesowych, zależność tych działań od jakości tych danych i ryzyka ich błędnego użycia). Na tej podstawie powinna powstać klasyfikacja obiektów danych bazująca na ich wartości biznesowej, sile wpływu na ciągłość działania, charakterystyce zmienności, czy innych cechach adekwatnych dla danego biznesu. Dane o małej wartości mogą być pozostawione same sobie, a do danych o dużym znaczeniu powinien zostać przyłożony znaczący wysiłek dbania o ich jakość (np. ingerencje w procesy i systemy operujące na tych danych, czy procesy governance dla tych danych). W miarę budowania tej wiedzy powinny być także podejmowane wysiłki edukacyjne o wartości danych i ich znaczeniu dla biznesu firmy, ale także poprawiające umiejętność poprawnego prowadzenia podstawowych operacji na danych (tak, znajomość SQL to nie tylko język, ale strukturalne myślenie o danych i powiązaniach między nimi). Takie działania stanowią fundament całej reszty.

Po drugie, za podstawę dla organizacji dostępu do danych powinna zostać przyjęta filozofia Data as a Service, sprowadzająca się do zapewnienia zunifikowanego dostępu do każdego znaczącego zbioru danych – zbioru którego dane odpowiadają regułom zapewnienia jakości. Zunifikowany dostęp może się opierać o wspólne środowisko typu Data Sandbox, czy też o możliwość prostego przeszukiwania poszczególnych zbiorów danych za pośrednictwem przeglądarki WWW. Nie chodzi tu jednak o budowanie złożonych i wyrafinowanych mechanizmów automatycznego łączenia danych, raportowania i analiz – wręcz przeciwnie, im prościej, tym lepiej. Celem tych działań bowiem jest zbudowanie zwinnej architektury danych, który uzyskać można dzięki efektowi systemu złożonego (użytkownik + system teleinformatyczny), w którym rolą teleinformatyki jest dostarczać klocki, a rolą użytkownika jest ich układanie. Zdolnością adaptacji to cecha, w której ludzie ciągle jeszcze przewyższają o wiele rzędów wielkości nawet najlepsze systemy teleinformatyczne.

Po trzecie, za modus operandi powinna zostać przyjęta zasada odczuwania skutków swoich działań. Ludzie realizujący działania skutkujące tworzeniem danych powinni najintensywniej „musieć używać” tych danych, aby zapewniać samoistne indukowanie poprawy danych w jak najkrótszej pętli sprzężenia zwrotnego. Ludzie tworzący dane muszą widzieć skutki swych działań (pozytywnych i negatywnych), bo tylko w ten sposób uda się systemowo poprawiać ich jakość oraz zauważać zmiany zachodzące w charakterystyce danych (także wynikające z czynników zewnętrznych), a przez to podnosić ich użyteczność, a w konsekwencji utrzymać ich wartość biznesową.

Prawda, że proste? Oczywiście, że to złożone przedsięwzięcie, szczególnie w sferze zmian kultury organizacyjnej firmy. Naturalnie, takie działania mogą być systematycznie i skutecznie wspomagane przez rozwiązania informatyczne, ale jedynie wspomagane. Wartości biznesowej danych nie uda się wymusić. Dbałość o wartość danych, jak każda sprawa dotycząca jakości, musi wynikać z przekonań każdego użytkownika danych, a zwinność jest nieodłącznie zależna od innowacyjności ludzi prawdziwie zaangażowanych w te działania.

Pozostaw komentarz