SM
← Return to main page

Pobieranie surowych danych

Gdzie szukamy tych wszystkich liczb?

Większość ludzi myśli, że dane z Sejmu są podane na tacy. To błąd. Informacje o głosowaniach czy wydatkach lądują w setkach plików PDF, których nikt porządnie nie indeksuje. Sejmometr Media przeszukuje 14 różnych rejestrów każdego ranka, dokładnie o 4:15. Wyciągamy twarde fakty z protokołów komisji i interpelacji, zanim politycy zdążą o nich zapomnieć. Liczby nie kłamią, dlatego skupiamy się na surowych danych, a nie na tym, co ktoś powiedział w wieczornych wiadomościach.

Koniec z ręcznym czytaniem protokołów

Przejrzenie jednego protokołu z posiedzenia komisji zajmuje średnio 42 minuty. Jeśli chcesz sprawdzić aktywność konkretnego posła w skali miesiąca, musisz poświęcić na to kilka dni roboczych. Nasz system robi to automatycznie w tle. Sprawdziliśmy to w tabelach: w ostatnim kwartale przetworzyliśmy dokładnie 318 takich dokumentów dla małego biura analiz. Zamiast czytać 200 stron opisu, dostali oni gotowy arkusz z listą obecności i czasem wystąpień co do sekundy.

  • Monitorujemy 14 baz danych, w tym rejestr korzyści i wyjazdy zagraniczne.
  • Wyłapujemy poprawki zgłaszane w ostatniej chwili na komisjach finansów.
  • Segregujemy dane według 7 kluczowych kategorii wydatków biur poselskich.

Bez politycznego bełkotu i interpretacji

Nie interesują nas obietnice ani programy partii. Nasz algorytm szuka konkretów: kto podpisał listę, kto wstrzymał się od głosu i ile pieniędzy z budżetu poszło na ekspertyzy zewnętrzne. Tylko konkretne dane pozwalają ocenić, co naprawdę dzieje się przy ul. Wiejskiej. Bywa, że projekt ustawy zmienia się o 180 stopni w ciągu jednej nocy. My to widzimy od razu w logach systemowych systemu głosowania i wyciągamy to na wierzch.

Dane gotowe do użycia

Pobieranie danych to nie tylko ich zbieranie, ale też czyszczenie. Często w oficjalnych dokumentach zdarzają się literówki w nazwiskach lub błędy w kwotach. Nasz zespół, liczący obecnie 4 osoby pracujące z biura w Krakowie, ręcznie weryfikuje każdą niespójność finansową powyżej 1200 zł. Dzięki temu masz pewność, że statystyka, którą wrzucasz do swojego raportu, jest po prostu prawdziwa. Bez zbędnego lania wody i domysłów.

Heads-up: Nasze raporty aktualizują się szybciej niż oficjalna strona sejmowa, bo pomijamy etap ręcznej akceptacji tekstowej. Interesuje nas tylko to, co wypluje system elektroniczny po zamknięciu głosowania o 21:00 czy 22:00.