Scoring klientów w telekomunikacji

Data: 2009-10-21
Autor: Sebastian Konkol

Jako narzędzie wielokryterialnej oceny, scoring stosowany jest raczej powszechnie. W zastosowaniach ściśle biznesowych narzędzia scoringowe znane są w branży bankowości, gdzie służą najczęściej wyznaczaniu syntetycznej oceny zdolności kredytowej osoby wnioskującej o kredyt. Wiele form działalności opiera się w dużej mierze na ocenach będących wynikami wyliczeń realizowanych przez narzędzia scoringowe – wskaźniki S&P czy Fair Isaac służą ocenie przedsiębiorstw, osób i papierów wartościowych. Narzędzia scoringowe znajdują także zastosowania w działalności operacyjnej operatora telekomunikacyjnego, od działań marketingowych, poprzez sprzedaż, aż po utrzymanie klienta i windykację należności.

Spośród obszarów stosowania narzędzi scoringowych w telekomunikacji, najczęstsze zastosowania mają wyznaczanie wartości klienta, ryzyka świadczenia usług i predykcje zachowań. Modele wyznaczające wartość klienta (LTV, Life-time Value) pozwalają określić przewidywany wolumen obrotu z danym klientem przez cały okres jego współpracy z operatorem. Sens stosowania modeli określających ryzyko świadczenia usług (Credit Risk) sprowadza się zwykle do wyznaczania ryzyka zaprzestania płatności, czyli narażenia operatora na straty finansowe wynikające z nieuregulowanych rachunków. Modele dokonujące predykcji zachowań klienta mogą dotyczyć różnych aspektów relacji operatora z klientem, a najczęściej dokonują one predykcji zbliżającego się rozwiązania umowy przez klienta (tzw. Churn). Narzędzia scoringowe dają więc wiele możliwości i dostarczać mogą bardzo wartościowych informacji o kliencie operatora. Stosowane konsekwentnie pozwalają na spójną ocenę klienta w różnych kontekstach i relacjach z nim utrzymywanych.

Zdolności predykcyjne udostępniane przez narzędzia scoringowe nie wynikają z przypisywanej im magicznej mocy. Są one budowane przy zastosowaniu nieco zaawansowanych metod modelowania statystycznego i działają na zasadzie analogii: jeśli w przeszłości, w wielu przypadkach o podobnych okolicznościach następowało jakieś charakterystyczne zdarzenie, to z dużą dozą pewności można przypuszczać, że w sytuacji o analogicznych okolicznościach w przyszłości wynikiem będzie to właśnie, charakterystyczne zdarzenie. W pewnym uproszczeniu, model scoringowy to algorytm wyliczający pewną wartość jako sumę ważoną danych wejściowych. Modele te powstają dzięki obserwacji zależności między potencjalnie dużą pulą różnych zmiennych a zjawiskiem, jakiego predykcji ma służyć tworzony model. Obserwacje te prowadzone są dzięki analizie danych historycznych, w których zapisywane są wartości zmiennych wejściowych wraz z powiązanymi z nimi wartościami wielkości obserwowanej. W taki sposób dokonuje się selekcji tych zmiennych, które wykazują związki z objaśnianym zjawiskiem – zawęża się listę zmiennych jedynie do tych, których wartości są w pewien sposób skorelowane z wartością objaśnianego zjawiska i określa się siłę związku poprzez wskazanie wag, z jakimi poszczególne zmienne mają wchodzić do sumy ważonej modelu scoringowego. Wytworzony model można zasilić wartościami zmiennych określającymi bieżącą sytuację, dla której predykcję chce się uzyskać. Na podstawie takich danych model wylicza wartość, którą przewidzi statystycznie prawdopodobny stan objaśnianego zjawiska w przyszłości.

Czyżby więc cudowne narzędzie o mocy wyroczni? Oczywiście, że nie. Zbudowanie modelu statystycznego wymaga (a) posiadania (b) wiarygodnych (c) danych opisujących dokładnie to, chcemy uczynić (d) przedmiotem predykcji. Szczególnie ważne jest tu zapewnienie jednoznaczności rozumienia zarówno danych wejściowych jak i sposobu interpretacji uzyskiwanego wyniku. Zwykle największą trudność sprawia określenie przedmiotu predykcji modelu oraz ustalenie precyzyjnego słownika danych, jakimi może posługiwać się model – szczególnie dlatego, że model będzie wykorzystywany przez dłuższy czas, w którym dane wejściowe mogą podlegać zmianom, np. rozszerzyć dziedzinę lub zbiór wartości, zmienić znaczenie itp. Kontynuując nieprzyjemne wieści na temat narzędzi scoringowych, po wytworzeniu (w procesie analiz statystycznych) modelu scoringowego, prędzej czy później pojawia się konieczność jego odświeżenia –weryfikacji skuteczności działania i ewentualnego uzupełnienia. Taka konieczność może wynikać z kilku przyczyn. Przede wszystkim z tego, że (w konsekwencji nieoznaczoności Heisenberga) sam akt badania wpływa na badany obiekt, więc jeśli wyniki predykcji stosujemy do bieżących działań w związku z jakimś zjawiskiem (np. oceny wiarygodności płatniczej klientów firm telekomunikacyjnej), to charakterystyka klientów tych firm się zmienia (w tym przykładzie, mniej jest oszustów wśród klientów firm telekomunikacyjnych, bo nie mogą oszukiwać firm telekomunikacyjnych nie będąc ich klientem). Inną przyczyną jest zaburzenie widzenia świata, bo gdyby wnioskować na podstawie przeglądu stanu zjawiska „filtrowanego” przez stosowany model dochodzi się do błędnych wniosków (w przykładzie, mniejsza liczba oszustów wśród klientów firm telekomunikacyjnych nie oznacza mniejszej liczby oszustów w społeczeństwie). Na koniec, samo zjawisko może się zmieniać w czasie, więc stosowany model może działać źle (w naszym przykładzie, może klasyfikować wiarygodnych płatników jako potencjalnych oszustów lub osoby oszukujące jako wiarygodnych płatników) ze względu na rzeczywistą zmianę korelacji w dzisiaj zbieranych danych, które są przeliczane według reguł, jakie zostały wypracowane w przeszłości (podczas budowania modelu) na podstawie danych już wtedy historycznych. W modelowaniu statystycznym znane są rozwiązania dla zagadnienia konieczności aktualizacji modelu, a powszechnym jest stosowanie grupy kontrolnej. Jej stosowanie polega na tym, że w procesie decyzyjnym, w którym normalnie jest wykorzystywany model statystyczny, dla pewnego losowo wybieranego odsetka przypadków robi się wyjątek i nie stosuje się tego modelu. Dzięki temu uzyskuje się stały strumyczek próbek danych opisujących badane zjawisko, który pozwala na weryfikację jakości działania modelu. W grupie kontrolnej tkwi jednak pewien haczyk – w zastosowaniach biznesowych oznacza to, że zjawisko, przed którym firma chce się bronić, musi być w pewnym stopniu uprawnione (w naszym przypadku oznacza to, że część z przypadków zaklasyfikowanych jako grupa kontrolna stanie się złymi płatnikami i przysporzy operatorowi rzeczywistych strat). Zwykle firmy nie chcą akceptować kosztów wynikających ze stosowania grupy kontrolnej. I to nie dlatego, że nie daje się wykazać, że aktualizacja modelu przynosi większe korzyści, niż wynosi koszt grupy kontrolnej. Powodem zwykle jest to, że w dużych firmach (szczególnie wśród operatorów telekomunikacyjnych) odpowiedzialność za zyski i koszty złego długu jest ściśle rozdzielona między dość odległe jednostki organizacyjne, a szefowie tych jednostek są wynagradzani według poprawy swoich wskaźników, a nie poprawy wskaźników innych jednostek. Absurdalne, ale typowe…

Wracając jednak do zastosowań, w sytuacji wyidealizowanej można sobie wyobrazić, że operator telekomunikacyjny posługuje się małym zbiorem narzędzi scoringowych dla oceny swojego klienta – w taki sam sposób (w sensie znaczenia wartości będącej wynikiem oceny) we wszystkich procesach firmy. Nie przeszkadza do stosowaniu coraz to innych danych wejściowych dla takich modeli. Na początku, kiedy o operator nie posiada historii współpracy z klientem, w jego dyspozycji są jedynie dane aplikacyjne (np. zapisywane w umowie z operatorem). Wraz z upływem czasu operator dowiaduje się coraz więcej o konkretnym kliencie śledząc historię jego poczynań, zdarzenia płatności i inne dane o charakterze behawioralnym. Nic nie stoi na przeszkodzie, aby włączyć dane behawioralne do modelu, jeśli tylko okazują się one być lepszym predykatorem zachowań klientów. Operator telekomunikacyjny mógłby więc oceniać klienta podobnie, jak to czynią banki, np. na podstawie trzech modeli: wartości klienta (LTV, Life-time Value), ryzyka niepłacenia (CR, Credit Risk) i ryzyka odejścia klienta (churn). Poza oczywistymi przypadkami działań w trakcie podpisywania umowy (ocena wartości klienta i ryzyka niepłacenia), czy działań zatrzymania klienta u operatora (churn), możliwe są także aplikacje wspomagające inne działania, jak np. up-selling. W tym przypadku, jeśli ryzyko odejścia klienta (churn) byłoby małe, to porównaie „iloczynu” wartości klietna i ryzyka niepłacenia do bieżącego salda rozliczeń mogłoby wspomagać proces decyzyjny, czy dany klient mogący kupić usługi warte więcej, niż obecnie wykorzystywane wart jest włączenia do kampanii sprzedażowych.

Zastosowań narzędzi scoringowych jest więcej, a sekret tkwi nie w ilości budowanych modeli, ale w przemyślanym ich stosowaniu w spójny i konsekwentny sposób.

Powodzenia!

Pozostaw komentarz