Два разговора защо оригиналните данни са важни

Одобрени бюджети по европроекти спрямо населението по общини. Карта и графики.

Говорил съм много защо отворените данни са важни и то в оригиналния си суров вид. Искам да отбележа два разговора, които илюстрират на разбираем език защо това е така.

Първият е една стара лекция от TED Talks, на която попаднах наскоро. Говори се за „математиката на войната“. Накратко – анализирали са данни за броя атаки, мястото и жервите на всяка тях по времето на различни конфликти в последните години. В лекцията се разглежда Афганистан, Иран и Сиера Леон. Данните, за жалост, не са взети от военните, а са събрани от съобщения в медиите. Аз правя нещо подобно за Lipsva.com.

Това, което са открили, са интересни математически зависимости в хода на войната. Станало е ясно, че само с броя атаки и разпределението на загиналите могат да научат доста за фрагментацията и целенасочеността на месните военни групировки и ефективността на кампаниите на ООН и американците през времето. Това са неподозирани ползи от иначе прост масив от данни.

Виж в YouTube.

Представете си сега, че приложим на подобен анализ данните за престъпленията, катастрофите или размера на администрацията. За катастрофите в София вече съм направил проект, който до сега е събрал значителна база данни. Ще се опитам скоро да разширя графиките и да направя изводи от тях. За администрацията – снощи пуснах заявление за достъп до информация, за да получа точно онези оригинални данни, за важността на които говоря горе. Има ги, публични са и смисълът на закона диктува, че трябва да имаме достъп до тях.

Други примери в тази насока ще видите и в този семинар за отворени данни в Betahaus, в които участва Пейо, Иван Бедров, Нели Огнянова и Антоанета Цонева.

Виж в YouTube.

10 коментара

  1. Странно. На това видео комисията сериализираше работата си.

    Последните 15-16 години гласувам в една и съща секция. Не знам дали е нарушение на правилата, но комисията разпаралелваше задачата. Докато предишният на опашката е още в тъмната стаичка, мен ме намираха в избирателните списъци. Служителят държеше пръста си на „моята“ страница, докато предишният излезе и се разпише на „своята“. Съответно при моето излизане списъците бяха готови за подпис, а следващият беше вече намерен…

    С тази оптимизация мога да приема, че са възможни пикови времена под минута. Разбира се средното време винаги ще е над пиковото.

  2. @CTEHATA – бил съм няколко пъти в комисии в чужбина. Там има допълнително забавяне, защото на повечето трябва да дописваме имената в списъка. И без това усложнение обаче не може да падне под минута и половина гласуването. Това, което казваш е вярно, но е в разрез с правилата – само по един се разрешава в стаята.

  3. На последните избори бях на вратата на стаята, а не вътре в нея, но пак се случи същото. Просто една дама дойде и ми взе личната карта. Което убеден съм пак е все някакво нарушение. Държането на вратата отворена може би също е такова.
    Все пак съм склонен да приема подобни сравнително дребни нарушения, породени от очевидната нужда да няма големи опашки. В крайна сметка по-мотивираният електорат ще е склонен да изчака по-дълго. Следователно дългите опашки увеличават тежестта на контролирания вот, тъй като при него мотивацията за гласуване е прекалено силна.

  4. Аз пък наскоро се замислих за това, дали могат да се изброят убитите след 10 ноември. Бая хора си отидоха мърцина от тоя свят и би било интересно да се знае кой, кога и защо е бил бастисан.

  5. @Апостол Апостолов – вероятно може, но ще е пак от медиите. Някой трябва да седне и да извади всички съобщения, да обощи информацията и да я структурира.

  6. @Апостол Апостолов – правят нещо подобно. Ако се абстрахираш от бруталната ирония, отдолу има(ше) доста данни.

  7. Одобрени бюджети по европроекти спрямо населението по общини. – Това е една от най-дълбоко пазените тайни от управниците, както и бюджетните субсидии по градове. От изобразената графика нещата не стават по-ясни. На практика например Пловдив получава десетки пъти по-малко европари, например спряма Бургас, спрямо София да не говорим. Има корелация между политическата принадлежност на местния кмет и парите.

  8. От тази карта си се вижда доста ясно колко са спечелените проекти спрямо населението по общини:
    http://opendata.yurukov.net/eu/map
    За субсидиите – има я информацията, но е доста разпръсната. Ще е интересно да я изкараме в графика.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните ви за коментари.