Когато ми хрумне нещо, започвам да се ровя за информация, за да си отговоря на въпроса. Събирам таблици, където ги има. Където не – пускам заявления по ЗДОИ или пиша скриптове, за да отворя нужните данни. Така стана и като тръгнах да търся нещо конкретно за българите в Германия и 2 часа по-късно имах 30 таблици и цяла статия със статистика.
Така се случва да събирам доста информация. Често имам идея как да я визуализирам или обработя като картата на българчетата родени в чужбина. Друг път не ми остава време или просто не успявам заради нужната обработка на ръка. Затова, например, преди почти две години, пуснах свободно архив с данните предоставени ми от всички РЗИ-та в България относно сигналите за пушене и проверките по тях.
Днес пускам още един такъв архив – на жертвите от войните на България през новата ни история. Всъщност тези данни са публични отдавна на Държавната агенция архиви. Проблемът е, че сайтът им е ужасен и през търсачката може да се прави много малко. И са сваляне са доста трудни заради странния формат. Като добавим, че са преписвани на ръка от списъците и има доста дублиращи се понятия и правописни грешки, задачата по обработването им става доста трудна. Това, което направих е да ги сваля в удобен формат (TSV), с който да е много по-лесно да се работи.
Първо агенцията отвори данните от Балканските войни. Отворих ги преди 5-6 години и си стоят така от тогава. Идеята ми беше да поставя на карта всяко споменато родно и лобно място на загинал войник. След това да проследя през времето пътя на тези войници между тези точки следвайки местата на смърт на хора от същите военни части и добавяйки исторически източници, за да са по-точни числата. Така може да се визуализират загубите на България през войните през времето, да се проследят отделни части, от къде са минали загиналите от даден град или да се проследи пътя на отделен човек. Така използвайки съвкупността от данните може да използваме известното за всички заедно, за да покажем пътя до смъртта на всеки един. Не знам дали ще е полезно и дори дали ще е визуално възможно, но ми се стори още тогава, че ще е навярно полезен инструмент за изучаване на тези войни.
Проблемът обаче идва от там, че доста от населените места ги няма врече, преименувани са или са слети с градове. В данните на ДАА има на места споменато настоящото име, което помага. Мислих да използвам Националния регистър на населените места, където има споменати всички стари селища, но там свалянето на данните е още по-тежко и търсенето е трудно. С други думи трябва доста работа на ръка. Един вариант беше да направя crowdsourcing проект, в който повече хора да помагат с картографирането, както направих с катастрофите в София преди 6 години. Така и не седнах да го напиша. Затова и картата я няма още. Единственото, което направих всъщност, е че през 2013-та пуснах възпоменание в Twitter на всеки загинал в на датата, в която е загинал, но 100 години по-рано.
Преди няколко дни ми писаха във връзка с таблицата за балканските войни – че била полезна за търсене и ме питаха дали нямам същите за другите. Дори не бях забелязал, че ДАА са пуснали данните. Затова написах бърз скрипт да свали всичко и да ги оформи като таблици. Резултатът е 140 хиляди записа за загубили живота си за България през Сръбско-българската, Балканските, Първата и Втората световна война. Може да ги свалите свободно и използвате както намерите за добре. Интересно е например, че някои от записите съдържат причина за смъртта. Данните са точно това, което ДАА е публикувало, но в несравнимо по-удобен вид. Осъзнавам, че на страницата им пише „Всички права запазени“, но също така знам, че нямат никакво право да слагат такъв лиценз. Както и миналия път, ще се радвам, ако пуснете линк отдолу към текста или визуализацията, която се направили.
Източник на заглавната снимка: Любомир Юруков
2 коментара