Като се сдобия с някакви данни често отнема доста време докато разбера какво точно гледам. Обикновено започвам със статистика и извадки за първите неща, които ми правят впечатление. Така оценявам наличността и качеството на данните.
Има едно такова нещо като ЕПИП – електронни съдебни дела. Порталът е доста добър, бърз и позволява преглед на воденето на повечето дела заедно с документите, разпределението и прочие. Проблемът е, че не може да се търси по ключови думи, страни и нямат отворени данни.
В порталът има данни за 4.5 млн. дела. Най-ранните от тях са заведени пред 1970-та г., а 2.65 млн. са след началото на 2021-ва. Ето малко статистика за тях:

На първата снимка виждате делата по месеци от последните 15 години. Вижда се рязко увеличение между 2016-та до 2021-ва, което може да се обясни по-скоро с качването на данни в системата и липсата на повечето дела преди 2016-та, отколкото друго.

Втората графика показва часът, в който са заведени делата в последните пет години, когато този час е упоменат. Известен е часът за 58% от делата. Вероятно конкретни съдилища не публикуват тази информация, а само дата. Сред останалите се забелязва обедната почивка и края на работния ден. Вижда се обаче интересен феномен за завеждане да 1% от делата с известен част между 1 и 4 часа след полунощ.

Най-много дела сред публичните в системата са на Топлофикация София – почти 100 хиляди. Третата графика ги показва. Сред завеждащите десетки хиляди дела са телекоми, банки, фирми за събиране на задължения, ВИК дружества.

Прокуратурите на България са завели 432 хиляди дела сред публичните такива. Четвъртата графика ги показва. 12% от всички дела на прокурори в последните 5 години са заведени от Районна прокуратура – София.
Липсата на дела от СРП и редица други институции преди 2021-ва сочи към това, че липсват все още много дела в системата. Не е ясно дали просто не ги дават или са в процес на качване. Така обаче трудно може да преценим дали има увеличение на делата от някоя прокуратура или от определена компания като Топлофикация София. Друг проблем е различното изписване на институциите. Докато фирмите се преименуват, а редовните преструктурирания на съдебната система и обвинението водят до объркване, дори изписването на една и съща прокуратура или компания в същата година се различават значително.

На горната графика съм представил статистика на наличните дела в портала по съдилища. Може би това ще ни даде представа кои не са въвели стара информация или е изгубена в предшестващите им структури Вижда се ясно, че Административен съд – София-град не е представил никакви дела преди 2019-та, а е основан 2007-ма. Висшия административен съд има дела едва след 2021-ва. Висшия касационен съд са публикували за по-дълъг период, но имат дупка между 2017 и 2019-та, както и доста данни преди 2008-ма. Софийски районен съд и СГС не са публикували дела преди 2017-та, както и голяма част от данните на районни, окръжни и административни съдилища извън София. Последните обаче се вижда, че не са публикували и доста дела преди 2021-ва.
На следващата графика виждате същите данни като процент от всички налични дела в системата. Отново, това не означава, че един или друг съд е нямал дела предходни години, а че просто не са налични в електронния портал, както са задължени.

Всичко това е важно, защото с тези данни бихме могли и следва да проследяваме работата на прокурорите и съдилищата. До тук видяхте няколко бързи справки направени с bash, regexp и Google Docs на база основните данни, които се виждат само в заглавната страница на портала. Има около терабайт от структурирани данни и документи, които могат да се обработят и покажат значително повече.
Дори по-важно е да се дигирализира съдебното производство, каквото предложение вкара Божидар Божанов. Доколкото то очевидно няма да е публично, мярката ще запази доказателствата, проследимостта и ще лиши прокуратурата от редица оправдания, а всичко по веригата от възможността да затриват доказателства и да мотаят процеса. В публична част може да се изважда статистика в реално време колко преписки на каква фаза се намират и в коя институция. Сега това е статистика, която дори вътре в съдебната власт е практически невъзможна, а и съдейки по отказите по ЗДОИ – ревниво пазена тайна.