Pobieranie surowych danych
Gdzie szukamy tych wszystkich liczb?
Większość ludzi myśli, że dane z Sejmu są podane na tacy. To błąd. Informacje o głosowaniach czy wydatkach lądują w setkach plików PDF, których nikt porządnie nie indeksuje. Sejmometr Media przeszukuje 14 różnych rejestrów każdego ranka, dokładnie o 4:15. Wyciągamy twarde fakty z protokołów komisji i interpelacji, zanim politycy zdążą o nich zapomnieć. Liczby nie kłamią, dlatego skupiamy się na surowych danych, a nie na tym, co ktoś powiedział w wieczornych wiadomościach.
Koniec z ręcznym czytaniem protokołów
Przejrzenie jednego protokołu z posiedzenia komisji zajmuje średnio 42 minuty. Jeśli chcesz sprawdzić aktywność konkretnego posła w skali miesiąca, musisz poświęcić na to kilka dni roboczych. Nasz system robi to automatycznie w tle. Sprawdziliśmy to w tabelach: w ostatnim kwartale przetworzyliśmy dokładnie 318 takich dokumentów dla małego biura analiz. Zamiast czytać 200 stron opisu, dostali oni gotowy arkusz z listą obecności i czasem wystąpień co do sekundy.
- Monitorujemy 14 baz danych, w tym rejestr korzyści i wyjazdy zagraniczne.
- Wyłapujemy poprawki zgłaszane w ostatniej chwili na komisjach finansów.
- Segregujemy dane według 7 kluczowych kategorii wydatków biur poselskich.
Bez politycznego bełkotu i interpretacji
Nie interesują nas obietnice ani programy partii. Nasz algorytm szuka konkretów: kto podpisał listę, kto wstrzymał się od głosu i ile pieniędzy z budżetu poszło na ekspertyzy zewnętrzne. Tylko konkretne dane pozwalają ocenić, co naprawdę dzieje się przy ul. Wiejskiej. Bywa, że projekt ustawy zmienia się o 180 stopni w ciągu jednej nocy. My to widzimy od razu w logach systemowych systemu głosowania i wyciągamy to na wierzch.
Dane gotowe do użycia
Pobieranie danych to nie tylko ich zbieranie, ale też czyszczenie. Często w oficjalnych dokumentach zdarzają się literówki w nazwiskach lub błędy w kwotach. Nasz zespół, liczący obecnie 4 osoby pracujące z biura w Krakowie, ręcznie weryfikuje każdą niespójność finansową powyżej 1200 zł. Dzięki temu masz pewność, że statystyka, którą wrzucasz do swojego raportu, jest po prostu prawdziwa. Bez zbędnego lania wody i domysłów.
Heads-up: Nasze raporty aktualizują się szybciej niż oficjalna strona sejmowa, bo pomijamy etap ręcznej akceptacji tekstowej. Interesuje nas tylko to, co wypluje system elektroniczny po zamknięciu głosowania o 21:00 czy 22:00.