Analyze some Data
zł90-750 PLN
Płatność przy odbiorze
Ogólny opis zadań
Celem projektu jest zapoznanie się z budową w pełni automatycznych procesów raportowych wykorzystując zarówno metody przetwarzania danych jak i analizy statystyczne. Projekt oparty jest na podstawowych sposobach raportowania portfela kredytów detalicznych przydatnych w zarządzaniu ryzykiem kredytowym.
Teoretyczne podstawy
Analizę vintage wykonuje się by badać stabilność ryzyka kredytowego w czasie i by znaleźć asymptotyczną jego maksymalną wartość. Statystykę vintage liczy się zarówno ilościową jak i kwotową. Jest ona zależna od następujących parametrów:
m – liczba miesięcy po uruchomieniu kredytu
due – minimalna liczba opóźnionych rat
m_prod – miesiąc w którym wszystkie kredyty uruchomiono.
Vintage ilościowy (m_prod, m, due)=(liczba wszystkich kredytów uruchomionych w miesiącu m_prod
dla których m-miesięcy po uruchomieniu liczba opóźnionych rat >= due)/ (liczba wszystkich kredytów
uruchomionych w miesiącu m_prod).
Statystykę kwotową uzyskujemy ważąc licznik i mianownik kwotami branych kredytów.
Lista zadań
Ze zbioru production należy przeanalizować wszystkie zmienne opisujące rachunek (aid) i klienta (cid).
Każdą ze zmiennych należy podzielić na kategorie, maksymalnie 3. Dla przykładu zmienną act_age na
kategorie: młodzi (<18), starsi (<35) i najstarsi (>=35). Dla każdej skategoryzowanej zmiennej należy
wyznaczyć miernik współzależności ze zmienną zerojedynkową vintage3 po 12 miesiącach (w kodzie
powyżej zmienna vin3 dla seniority=12).
Należy posortować wszystkie zmienne według tej statystyki i dla pierwszych 5 najlepszych zmiennych
z grup app_: , act_:, ags:, agr:,wykonać wykresy w rożnych formatach: HTML – interaktywne raporty z
wygodnymi linkami i obrazkami png (ods graphics) , PDF – raport wykonany przez jakąś technikę (być może wykorzystując LaTeX) dającą ładne i wysokiej rozdzielczości raporty, Excel – raporty z gotowymi ładnymi elementami graficznymi.
Należy policzyć vintage dla due= 1, 2 i 3.
Linki reportów HTML powinny wskazywać także Excele i PDFy.
Finalny zestaw raportów powinien składać się z kilku warstw:
- warstwa zbiorcza, gdzie przedstawione są raporty całego portfela i dwóch produktów: css i ins.
- warstwa identyfikacji zmiennych i ich porządku
- warstwa każdej zmiennej.
Kreatywność
Istotą projektu jest nie tylko napisanie właściwych kodów, ale także umiejętne rozwiązanie problemu dużej liczby raportów i wielu obliczeń. Dodatkowo należy wpaść na pomysł jak policzyć prognozę vintage3 po 12 miesiącach zarówno ilościową jak i kwotową. Wykonawcy projektu powinni postawić się w roli zarządzającego ryzykiem kredytowym i umieć na podstawie wykonanych raportów
jednoznacznie stwierdzić, czy ryzyko portfela jest stabilne, czy profil klientów jest stabilny, a jeśli nie to co się zmienia. Można też zdecydować się na inną granulację, zamiast po miesiącach to po kwartałach lub półroczach. Finalne zestawy raportów muszą być czytelne i w powinny być tak
dobrane do danych, by można było w szybki sposób zauważyć najważniejsze zmiany.
Numer ID Projektu: #12927581