<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>opendata &#8211; Блогът на Юруков</title>
	<atom:link href="https://yurukov.net/blog/tag/opendata/feed/" rel="self" type="application/rss+xml" />
	<link>https://yurukov.net/blog</link>
	<description>Нещата които искам да споделя с другите</description>
	<lastBuildDate>Mon, 05 Jan 2026 11:14:06 +0000</lastBuildDate>
	<language>bg-BG</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>
<site xmlns="com-wordpress:feed-additions:1">1096121</site>	<item>
		<title>Градският транспорт и как данните биха помогнали да го подобрим</title>
		<link>https://yurukov.net/blog/2017/danni-za-transporta/</link>
					<comments>https://yurukov.net/blog/2017/danni-za-transporta/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Fri, 31 Mar 2017 11:52:09 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[bulgaria]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[варна]]></category>
		<category><![CDATA[графски транспорт]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[пловдив]]></category>
		<category><![CDATA[софия]]></category>
		<category><![CDATA[спирки]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=19771</guid>

					<description><![CDATA[Наскоро статус на Илиян Стоянов във Facebook ме подсети за това, че градския ни транспорт е една от сферите, в които липсват публични данни. Няколко града като София, Пловдив и Варна имат сайтове и дори app-ове, където човек може да провери разписание и планира маршрути. Самите данни за спирките и разписанието не са достъпни. Така...]]></description>
										<content:encoded><![CDATA[<p>Наскоро статус на Илиян Стоянов във Facebook ме подсети за това, че градския ни транспорт е една от сферите, в които липсват публични данни. Няколко града като София, Пловдив и Варна имат сайтове и дори app-ове, където човек може да провери разписание и планира маршрути. Самите данни за спирките и разписанието не са достъпни. Така не само не може друг да направи собствена услуга, но и не може да се анализира мрежата. </p>
<p>Затова седнах и първо отворих данните за спирките на споменатите три града. За тези в София вече <a href="https://www.facebook.com/boyan.yurukov/posts/10154766766827025" target="_blank" rel="noopener">писах</a> във Facebook. В Бургас въпреки евро-проекта за интегриран транспорт, изглежда няма дори дигитална карта на спирките.</p>
<p>С тези прости данни направих бързи карти на спирките на София, Пловдив и Варна. Като спрете с мишката върху всяка точка, ще видите името ѝ. Вляво има бутон, с който може да ги разглеждате на цял екран.</p>
<p><iframe width="100%" height="350" frameborder="0" src="https://yurukov.carto.com/viz/d969c5b0-13d1-11e7-8517-0ee66e2c9693/embed_map?zoom=11" allowfullscreen webkitallowfullscreen mozallowfullscreen oallowfullscreen msallowfullscreen></iframe></p>
<p><iframe width="100%" height="350" frameborder="0" src="https://yurukov.carto.com/viz/74d5c700-13ce-11e7-8822-0e05a8b3e3d7/embed_map?zoom=12" allowfullscreen webkitallowfullscreen mozallowfullscreen oallowfullscreen msallowfullscreen></iframe></p>
<p><iframe width="100%" height="350" frameborder="0" src="https://yurukov.carto.com/viz/179c5128-13cc-11e7-b5ec-0e3ff518bd15/embed_map?zoom=11" allowfullscreen webkitallowfullscreen mozallowfullscreen oallowfullscreen msallowfullscreen></iframe></p>
<p>Скриптовете и самите данни за спирките публикувах в Github. Ще ги намерите на <a href="https://gist.github.com/yurukov">страницата</a> ми с Gist-ове. </p>
<h3>Транспортът във Варна</h3>
<p>Във Варна, всъщност, данните дори не са налични от общината, а от частния проект <a href="https://varnatraffic.com" target="_blank" rel="noopener">varnatraffic.com</a> на Мап Софт. Той е и единственият, който намерих да показва местоположението на автобусите в реално време. Използвах данните им на база съобщение на сайта от преди две години, че предоставят всичко свободно като отворени данни. </p>
<p>За да илюстрирам колко е полезна тази информация, свалям вече седмица местоположението на всички автобуси в града. За този период събрах около 650 хиляди точки с различни параметри &#8211; номер на автобуса, предишна и следваща спирка, оставащо разстояние до спирката, закъснение. Следните три карти показват различен поглед над събраните данни.</p>
<p>Първата карта разглежда движението за седмицата между 21-ви и 28-ми март по часове и колко автобуси са били по улиците на града. В червено са доста натоварени отсечки, където много автобуси са се движели през дадения час. Картата показва как се увеличава и намалява този трафик в различните части на деня, както и през почивните дни. В неделя не се забелязва по-малко натоварване, за което вероятно допринасят и провелите се тогава <a href="http://yurukov.net/blog/2017/nomer-16/">избори</a>.</p>
<p><iframe loading="lazy" width="100%" height="700" frameborder="0" src="https://yurukov.carto.com/viz/1185468a-13c9-11e7-af9d-0e233c30368f/embed_map?zoom=11" allowfullscreen webkitallowfullscreen mozallowfullscreen oallowfullscreen msallowfullscreen class="post-wide"></iframe></p>
<p>Следващата карта се концентрира само върху понеделник, 27-ми март. Показва в детайли движението на всеки един автобус. В червено са отбелязани тези, които закъсняват повече от 5 мин. Забелязва се как между 7 и 8:30 вечерта много от автобусите закъсняват. Виждат се ясно и местата, където автобусите спират за почивки.</p>
<p><iframe loading="lazy" width="100%" height="700" frameborder="0" src="https://yurukov.carto.com/viz/16463a74-0e35-11e7-9cef-0e3ff518bd15/embed_map?zoom=12" allowfullscreen webkitallowfullscreen mozallowfullscreen oallowfullscreen msallowfullscreen class="post-wide"></iframe></p>
<p>Тъй като имаме закъсненията преди всяка спирка, може да анализираме и каква е вероятността да се чака на нея. Може също да разделим тази оценка по часове. Последната карта показва именно това. Анализът се базира само на данните от последните 7-8 дни. Пренебрегнете посочената дата в картата &#8211; часът е важен. Инструментът не позволява показването са на час.</p>
<p>В зелено са спирките, на които в конкретната част от деня се чака не повече от 15 секунди. В жълто са тези до 30 секунди. В гамата на червено са тези със закъснение между минута и час. Отново се вижда колко голямо средно закъснение има в различни часове от дена и части на града.</p>
<p><iframe loading="lazy" width="100%" height="600" frameborder="0" src="https://yurukov.carto.com/viz/0566a2c8-1549-11e7-87d5-0ecd1babdde5/embed_map?zoom=11" allowfullscreen webkitallowfullscreen mozallowfullscreen oallowfullscreen msallowfullscreen class="post-wide"></iframe></p>
<p>В някои случаи включвам и автобусите пристигнали с няколко минути по-рано &#8211; това също се счита за отклонение, тъй като някои пътници биха го изпуснали. Редовни такива показатели сочат към неоптимално разписание на даденото място и час. Такива са 26% от събраните точки за движението на градския транспорт. В 8.7% от времето, автобусите са подранявали с повече от 3 минути. В други 50% автобусите са закъснявали с повече от 20 секунди. </p>
<h3>Публичността не е услуга</h3>
<p>Публичността на която и да е информация не е услуга, която се представя от администрация или частна компания на обществото. Това е неизменна част от прозрачността, отчетността и социалната отговорност. За държавната и местната администрация <a href="http://yurukov.net/blog/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8">отворените данни</a> са още едно ниво на инфраструктура. Доскоро говорихме само за магистрали. В последните години започна все повече да се възприема и интернет свързаността като инфраструктура, при това не по-малко съществена за бизнеса. Информацията и най-вече тази в отворен формат придобива все по-голяма важност по аналогичен начин. Данните идващи от частните компании следва да допълнят тази картина и са новата дефиниция на социална отговорност, която често си приписват.</p>
<p>Това, което показах с данните от само няколко дни движение в един град, не са просто шарени карти. Това е илюстрация какво може да се направи за час-два работа, а не крайната цел. Информацията в момента се използва само за улеснение на пътуващите. Съберем ли всичко заедно за целия транспорт и за голям период, се отварят много възможности. Може да се открият проблемни кръстовища, да се подобрява графика, да се оптимизира движението на пътищата и интервала на светофарите. Дори само координатите на спирките може да се използват, за да се открият най-&#8222;изолираните&#8220; части от градовете и да се направи карта на най-лошо свързаните региони.</p>
<p>Обединявайки тези данни с масиви за трафика на коли, цените на имотите, координатите на училища, градини и болници, за схемата на почистване на улиците и прочие може да позволи много по-добро градско планиране. По-важното обаче, ще позволи на частни компании и неправителствени организации да изградят приложения използващи данните по различен начин. Най-лесното би било да се направят по-добри приложения за планиране на маршрут с градския транспорт. Сайтовете за недвижими имоти биха давали по-добра информация за свързаността на имота. Родителите биха могли по-лесно да откриват градини и ясли, които са привидно отдалечени, но биха били достигнати лесно с транспорт от дома или офиса им.</p>
<p>Всичко това би помогнало да се направят градовете по-добри и да се използва публичния транспорт повече допринасайки за намаляване на трафика и <a href="http://yurukov.net/blog/2016/mrasen-vazduh-naselenie/">замърсяването</a>. За съжаление, интуицията на повечето чиновници и поддържащи такива масиви от данни е, че информацията е тяхна собственост и ако бъде публикувана &#8222;някой може да я използва&#8220;. Това е реакцията, която съм получавал най-често от агенции и общини. Забравя се, че всъщност вече сме платили с данъците си за събирането на всеки информационен ресурс. Забравя се и че целта на всички тези регистри и информационни системи е именно информацията да е достъпна. При тези мащаби с индивидуални справки, PDF-и и снимки на документи това просто не става. </p>
<p>За щастие, вече е в сила изискването, че всички публични данни във всяка нова система на администрацията трябва да са налични като отворени данни. Следва само да следим това да се спазва и да използваме тези ресурси. Съществуват обаче много други стари системи, за които трябва да натискаме да се отворят. Координатите на спирките и автобусите градския транспорт е само един пример. Друг пример са координатите в реално време на снегорини и камиони чистещи улиците зимно време. Общините ги следят, но не публикуват информацията. Друг пример са адресите в градовете, анонимизирани и агрегирани данни от НАП за плащанията на пос терминали и такива от МВР за престъпления. </p>
<p>Тези примери спадат към дефиницията на big data. Не са просто полезни за гражданите и бизнеса, а информация, която самите институции често не успяват да обменят помежду си или дори да анализират. Затова всичко описано до тук повишава не само прозрачността, но и ефективно постига аспекти от така нужната структурна реформа на администрацията ни. </p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2017/danni-za-transporta/feed/</wfw:commentRss>
			<slash:comments>13</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">19771</post-id>	</item>
		<item>
		<title>Опасността от отворените данни</title>
		<link>https://yurukov.net/blog/2014/opasnostite-ot-opendata/</link>
					<comments>https://yurukov.net/blog/2014/opasnostite-ot-opendata/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Tue, 09 Dec 2014 17:06:36 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[egov]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[електронно управление]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[лични данни]]></category>
		<category><![CDATA[опасности]]></category>
		<category><![CDATA[прозрачност]]></category>
		<category><![CDATA[решения]]></category>
		<category><![CDATA[рискове]]></category>
		<category><![CDATA[сигурност]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=15887</guid>

					<description><![CDATA[В този блог съм писал много за отворените данни &#8211; технологиите, ползите, конкретни проекти, напредъка в България и критика за липсата на такъв. Малко обаче се говори за опасността от отворените данни. Както многократно съм изтъквал, те са нищо повече от технологичен инструмент, а почти всеки инструмент може да се използва двояко. Те може да...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2014/12/open-data-concept1.jpg" width="450" height="337" /></p>
<p>В този блог съм писал много за отворените данни &#8211; технологиите, ползите, конкретни проекти, напредъка в България и критика за липсата на такъв. Малко обаче се говори за опасността от отворените данни. Както многократно съм изтъквал, те са нищо повече от технологичен инструмент, а почти всеки инструмент може да се използва двояко. Те може да гарантират възможно най-голяма прозрачност, но дяволът винаги е в детайлите.</p>
<p>Тук ще срещнете някои от аргументите, които критиците на open data използват в старанието си да спрат реформите. С риск да им помогна с още такива, реших да събера всичко тук. Към всеки обаче съм добавил как може да се реши или защо значението му се преекспонира. Винаги ще има съпротива и неразбиране към нуждата за прозрачност и в никакъв случай едно решение не може да е перфектно. Още повече технологично решение като отворените данни. Важно е и да разберем какво значат те в сегашния контекст в България.<span id="more-15887"></span></p>
<h2 style="text-align:left;">Риск за лични данни и корпоративна информация</h2>
<h3>Проблем</h3>
<p>Това е едно от най-честите притеснения, когато се обсъжда темата за отворените данни. Когато се &#8222;отварят&#8220; масиви от информация, част от тях може да съдържат лични данни или търговска информация. Ако не се внимава, чиновниците може да публикуват всичко и да създадат предпоставка за кражба на самоличност или смяна на собственост на фирма чрез измама.</p>
<h3>Анализ</h3>
<p>Такива коментари имаше след обсъждането на <a href="http://yurukov.net/blog/2014/10/20/2-dobri-novini-za-open-data/" target="_blank">промяната на тарифата</a> за достъп до базата данни на Търговския регистър. Тя обещава истинско отваряне на данните и възможност обикновени граждани и НПО-та да анализират информацията. В същото време обаче критиците на мярката изтъкват, че автоматичният анализ на данните ще позволи на т.н. &#8222;крадци на компании&#8220; да идентифицират по-лесно потенциални жертви. </p>
<p>Има две важни точки, с които трябва да започнем. Първо, кражби на компании са се случвали доста преди публикуването на Търговския регистър. Второ, в описаната мярка не се дава достъп до повече информация, а само улеснява достъпа до вече съществуващ автоматичен интерфейс. В този смисъл потенциалните измамници няма да получат повече информация. Наистина, има вероятност да автоматизират търсенето си, но това е възможно и чрез платените сега системи за търговска информация. По-достъпните отворени данни до Търговския регистър обаче ще позволят на много други организации да следят и анализират за такива измами, което ще помогне за решаването и дори предотвратяването им. </p>
<p>В по-широкия смисъл, риск за личните данни съдържани в държавните информационни системи има и сега. Прилагането на принципа за отворени данни може да има само положителен ефект върху един съществуващ проблем. Всяка такава промяна изисква анализ кое може да е публично и кое не. Автоматизацията на отварянето на данни ще елиминира човешките грешки, като например забравена колона с лични адреси в Excel таблица. </p>
<h3>Решение</h3>
<p>Отварянето на обществени данни няма да създаде повече проблеми, но ще даде инструменти за решаването на съществуващите. Заради липсата на ясни процедури и протоколи за сигурност, досега сме ставали често свидетели на течове на лични данни. Проблемът тук не е в новата технология, а в начинът на работа до сега. Процесът на отваряне на данни може да промени това. </p>
<p>Друг метод за скриване на лична и служебна информация е агрегирането. Пример за това има в становището ми за новия Административен регистър, където предложих да се публикува сумата от натрупаните отпуски на служителите във всяко ведомство. При достатъчно добре избрано групиране се гарантира неприкосновеността на личността, но и че няма да има загуба на полезна публично достъпна информация. </p>
<h2 style="text-align:left;">Потенциална уязвимост в сигурността</h2>
<h3>Проблем</h3>
<p>Тази опасност е вариация на предишната точка. Рискът е, че при автоматичните интерфейси, които предоставят възможност за справки в публична информация, може да има уязвимости. Тази възможност съществува и сега, но аргументът е, че при повече такива интерфейси, рискът за пропуски е по-голям.</p>
<h3>Анализ</h3>
<p>Пример за такъв пропуск е регистъра за позволенията за сеч на Агенцията по горите. Това е прекрасен пример за прозрачност въведен от последния служебен кабинет, макар и да не може да се квалифицира като отворени данни. Докато го разглеждах, забелязах определена уязвимост с базата данни. След сигнал до администраторите тя беше оправена. </p>
<p>Такива проблеми има винаги във всяка система и изчистването им е продължителен процес. Това обаче не може да бъде аргумент срещу автоматизирането на достъпа до обществена информация. Точно обратното &#8211; когато има хора, които се занимават точно с това и използват ресурсите активно, грешките се намират по-бързо. Това всъщност е дори аргумент в ползва на <a href="http://blog.bozho.net/?p=1793" target="_blank">отворения код</a> в администрацията.</p>
<h3>Решение</h3>
<p>За да се подобри сигурността, трябва повече прозрачност при създаването, тестването и поддържането на информационните системи. Подходът към сигурността на софтуерът сега е подобен на този на цялата администрация &#8211; крием всичко с надеждата, че никой няма да забележи дупките. Това очевидно далеч не е достатъчно с днешните технологии.</p>
<h2 style="text-align:left;">Манипулация на официалните данни</h2>
<h3>Проблем</h3>
<p>Публикуваните справки може да бъдат манипулирани от съответните ведомства с цел прикриване на злоупотреби. Доверието в отворените данни и автоматизацията на анализа и визуализацията ще скрие тези манипулации. </p>
<h3>Анализ</h3>
<p>Подмяната на данни е сериозен проблем, който забелязваме и сега. Засичането ѝ е сравнително трудно, освен, ако не знаеш какво търсиш. Тук добър пример е <a href="https://www.facebook.com/boyan.yurukov/posts/10152769681817025?pnref=story" target="_blank">системата</a> за случайно разпределение на дела в съдебната система. Всички резултати от нея са публични, но отдавна се знае колко лесна за манипулиране е. </p>
<h3>Решение</h3>
<p>В света на отворените данни вече има решение на това и за него се изисква просто повече данни от различни източници. Автоматичната проверка ще покаже грешки в данните, но и проблеми в дефинициите и интерпретацията. Друго решение тук е автоматизирането на справките. При липсата на човешка намеса подмяната на публичните данни ще стане изключително трудна. </p>
<h2 style="text-align:left;">Манипулация на интерпретацията на данните</h2>
<h3>Проблем</h3>
<p>Отворените данни са просто инструмент, но като такъв имат нужда от история или графика, която да изведе истинската им стойност. Основавайки се на реални данни, журналисти и НПО-та може да показват грешни интерпретации подменящи значението на информацията.</p>
<h3>Анализ</h3>
<p>Отново, този проблем съществува и сега. Виждаме го ясно с <a href="http://yurukov.net/blog/2013/12/20/danoto-po-rajvdaemost/" target="_blank">данните за раждаемостта</a>. Когато псевдо-експерти, журналисти и политици искат да манипулират общественото мнение на база реални данни, то единствената надежда е отговор изтъкващ фактите. За това обаче няма нужда от реални данни &#8211; при липсата им първите винаги са си измисляли статистика.</p>
<h3>Решение</h3>
<p>Достъпа до повече публична информация би дал още инструменти за оборване на подобни подвеждащи изказвания. Не може да има технологично решение за липсата на етика при експерти и журналисти.</p>
<h2 style="text-align:left;">Технологична изолация на местния бизнес</h2>
<h3>Проблем</h3>
<p>Това е опасност, която не е толкова очевидна. Информацията е сила, а отворените данни дават възможност за откриване на нови ниши и оптимизация на бизнеса. Големи корпорации със сериозен ресурс може да се възползват по-добре от публичната информация и стандартизирани egov услуги и да надделеят над местния бизнес с локалните му знания и опит.</p>
<h3>Анализ</h3>
<p>Този проблем може да се илюстрира със създаването и отварянето на кадастър в някои провинции на Индия. Силно фрагментираната и неформално дефинирана собственост на земята там е била пречка за големия бизнес и въпросния регистър е извадил от бизнеса много локални посредници. В България може да се направи подобен аналог с множеството фирми, които се изхранват с попълване на документи и изпълнение на конкретни задачи заради проблемите в администрацията. Друг пример у нас биха били обществените поръчки, ако и когато уведомяването и кандидатстването за тях станат изцяло електронни.</p>
<p>По-добрият и стандартизиран достъп до информация наистина може да помогне на компаниите с повече опит в анализа. Това е аргумент в привличането на чуждестранни инвестиции. Инструментите за анализ обаче са широко достъпни в наши дни и няма пречка за малките компании да ги използват. Точно обратното &#8211; това създава огромна технологична ниша на местно ниво. Далеч сме от универсален анализ и интеграция на данни, затова знанията и опита на местно ниво винаги ще бъде нужен. Нещо повече &#8211; малкият бизнес дори може да спечели за сметка на големите международни компании, защото ще има достъп до повече инструменти и анализи, които досега са стрували скъпи. Пример за това отново е отварянето на данните на Търговския регистър, постановлението за което все още престоява в Министерски съвет.</p>
<h2 style="text-align:left;">Улеснение за корпоративните лобисти</h2>
<h3>Проблем</h3>
<p>Лобистки организации могат да използват същите тези инструменти за прозрачност, за да оптимизират отпорът си срещу регулаторни мерки. </p>
<h3>Анализ</h3>
<p>Отворените данни могат да се използват за идентифициране на проблеми в администрацията, изобличаване на корупция и проблеми при поръчки. Граждански организации могат да идентифицират рано проекти и наредби и да участват в дебатите. Аналогично обаче лобистките организации и НПО-та с непрозрачно финансиране могат да използват тези инструменти, за да оптимизират натиска си. </p>
<p>Пример за това може да бъдат проектите за закони и нормативни актове. Публикуването им на сайта на НС и Strategy.bg ни помага да реагираме по-рано, да задаваме правилните въпроси и да се организираме срещу корупционни практики и спорни текстове. Същото може да се направи обаче и срещу реформи заложени в тези проекти. Засичайки ги рано, тези организации може да организират кампании на дезинформация създавайки изкуствени скандали.</p>
<h3>Решение</h3>
<p>Отново този проблем съществува и сега. За жалост не малка част от медиите се използват като пощенски кутии за такива изкуствени скандали. Лобистки поправки и влияние се забелязват отдавана и каналите, по които получават информация за подготвени проекти, далеч не се ограничава до публично публикуваната информация. Отворените данни биха били решение именно на този проблем, защото биха автоматизирали публичността на редица процеси. Пример затова е случайното разпределение на делата, публичните консултации и обществените поръчки. </p>
<p>Обръщането на същия този механизъм срещу прозрачността и в полза на лобиските практики е теоретична възможност. Това само по себе си обаче няма да остане скрито, което до голяма степен ще го обезсмисли. Негативните кампании в медиите съществуват и сега и няма да се преборим с тях чрез повече публичност. Те са въпрос на медийна етика и обществено съзнание &#8211; въпроси, които не могат да се решат с технологии.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2014/opasnostite-ot-opendata/feed/</wfw:commentRss>
			<slash:comments>14</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">15887</post-id>	</item>
		<item>
		<title>Лекцията ми за отворените данни на TEDxBG</title>
		<link>https://yurukov.net/blog/2014/tedxbg2014/</link>
					<comments>https://yurukov.net/blog/2014/tedxbg2014/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Thu, 30 Oct 2014 15:45:19 +0000</pubDate>
				<category><![CDATA[Аз и Боян]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[tedxbg]]></category>
		<category><![CDATA[лекция]]></category>
		<category><![CDATA[отворени данни]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=15750</guid>

					<description><![CDATA[TEDxBG са пуснали вчера записа на лекцията ми за отворените данни от последното издание. Писах повече за нея през май. Като за първа лекция на английски не мисля, че е зле. Към 13:49 се обърках слайдовете, но май пак се разбира нещо. Мнения?]]></description>
										<content:encoded><![CDATA[<p><iframe loading="lazy" width="450" height="253" src="//www.youtube.com/embed/dbooazcpTbs" frameborder="0" allowfullscreen></iframe></p>
<p>TEDxBG са пуснали вчера записа на лекцията ми за отворените данни от последното издание. <a href="http://yurukov.net/blog/2014/05/19/tedxbg-i-vaprosi/">Писах повече за нея</a> през май. Като за първа лекция на английски не мисля, че е зле. Към 13:49 се обърках слайдовете, но май пак се разбира нещо. </p>
<p>Мнения?</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2014/tedxbg2014/feed/</wfw:commentRss>
			<slash:comments>5</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">15750</post-id>	</item>
		<item>
		<title>Платформа за анализ на изборите в България</title>
		<link>https://yurukov.net/blog/2014/karta-izbori/</link>
					<comments>https://yurukov.net/blog/2014/karta-izbori/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Fri, 04 Jul 2014 12:40:14 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Политика]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[активност]]></category>
		<category><![CDATA[бюджет]]></category>
		<category><![CDATA[данни]]></category>
		<category><![CDATA[избори]]></category>
		<category><![CDATA[карта]]></category>
		<category><![CDATA[нси]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=15359</guid>

					<description><![CDATA[Картата показва активността на ЕП 2013 Често резултатите от изборите не се изчерпват с това кой е избран като депутат или президент. Можем да научим много като сравним избиратели в списъците, гласове за малките партии, избирателна активност, различни региони помежду им и друга статистика. Проблемът при тези сравнения обаче винаги е бил, че обработването и...]]></description>
										<content:encoded><![CDATA[<p style="text-align:right"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2014/07/el11-1.png" width="450" height="450" style="border:1px solid gray;"/><i>Картата показва <a href="http://opendata.yurukov.net/elections/#P1%2FP2&#038;ep14-glas&#038;ep14-izba&#038;-c18---" target="_blank">активността</a> на ЕП 2013</i></p>
<p>Често резултатите от изборите не се изчерпват с това кой е избран като депутат или президент. Можем да научим много като сравним избиратели в списъците, гласове за малките партии, избирателна активност, различни региони помежду им и друга статистика. Проблемът при тези сравнения обаче винаги е бил, че обработването и визуализирането на данните е доста трудоемко. Затова често се прави само тогава, когато знаем какво търсим и искаме просто да го облечем в цифри и графики. Така пропускаме неочаквани връзки в данните и от тук тръгна последния ми проект.</p>
<p><strong><a href="http://opendata.yurukov.net/elections" target="_blank">Opendata:Elections</a></strong> е интерактивен инструмент, който показва карта на България разделена на общини. Избирайки различни параметри, може да създавате свои формули, резултатът от които ще се покаже на картата. Формулите съдържат прости оператори и се проверява за грешки в реално време. Параметрите могат да бъдат всякакви показатели от последните 6 вота заедно с невалидни бюлетини и преференции. Може да избирате данни за населението според НСИ (като етническа и религиозна структура) и различни бюджетни показатели. Събрах данните от сайта на ЦИК, НСИ и Министерството на финансите. Ще опиша всички параметри в някоя от следващите статии. </p>
<p><span id="more-15359"></span></p>
<p style="text-align:right"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2014/07/el2-1.png" width="450" height="298" style="border:1px solid gray;"/><i>Брой избиратели <a href="http://opendata.yurukov.net/elections/#sfr" target="_blank">изключени от списъците</a> за ЕП 2013<br />най-вероятно заради принципа на уседналост</i></p>
<p>Инструментът позволява да запишете формулата си със свое обяснение и интерпретация. Всяка записана формула има собствен линк и при споделяне, ще се отвори точно на вашето обяснение и графика. Може да отбележите чужди формули като интересни и да ги споделите. Ако не искате да записвате формулата, но искате да я покажете на познати, просто копирайте адреса на страницата. Той се обновява при всяка промяна на параметрите. Може да сменяте също цветовата грама и форматът на цифрите.</p>
<p>Както винаги, данните в този проект са толкова добри, колкото и източниците. Ще откриете, например, че в някои общини има странно много сгрешени или <a href="http://opendata.yurukov.net/elections/#P1%2FP2&#038;ep14-bltn-ik27&#038;ep14-bltn-pblt&#038;-c17---" target="_blank">невалидни бюлетини</a>. Подобни грешки при въвеждането на протоколите се забелязват лесно с проста формула. Други данни, несвързани с изборите, са интересни сами по себе си, като например промяната в задлъжнялостта на общините или дялът от бюджета си, който харчат за заплати.</p>
<p style="text-align:right"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2014/07/el3-1.png" width="450" height="298" style="border:1px solid gray;" /><i>Намаление в процентни пункта на <a href="http://opendata.yurukov.net/elections/#p1-p2&#038;mfnd-ik4-y1&#038;mfnd-ik4-y4&#038;-c23---" target="_blank">задлъжнялостта</a><br /> спрямо доходите на общините между 2012 и 2013</i></p>
<p>В близките седмици ще добавя още данни от НСИ като безработица и сграден фонд. Лесно мога да добавям и още данни от МФ за задлъжнялостта, когато станат налични. Скоро след изборите на 5-ти октомври ще добавя и резултатите от тях. Няма да правя повече промени по страницата и затова тия дни ще отворя кода в Github. Бях решил да я превеждам на английски, но ще е доста работа и не знам дали ще има интерес. Междувременно искам да благодаря на всички в Twitter, които ми помогнаха с тестване и обратна връзка.</p>
<p>Целта на тази карта е да ни помогне да осмислим изборите в България, да оборим клишета и да открием нови връзки. Затова има възможност да се записват обяснения към картите и да се споделя всяко мнение. На вас оставям да покажете тезите си и сухите данни на ЦИК в по-разбираем вид.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2014/karta-izbori/feed/</wfw:commentRss>
			<slash:comments>15</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">15359</post-id>	</item>
		<item>
		<title>С какви пари наш&#8217;та полиция ни пази</title>
		<link>https://yurukov.net/blog/2014/biudjet-na-policiqta/</link>
					<comments>https://yurukov.net/blog/2014/biudjet-na-policiqta/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Mon, 27 Jan 2014 16:05:21 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[бюджет]]></category>
		<category><![CDATA[заплати]]></category>
		<category><![CDATA[мвр]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[протести]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=14843</guid>

					<description><![CDATA[Всички видяхме как десетки хиляди полицаи бяха докарани в София, за да респектират протестиращите. Навярно ви е минавал през главата въпросът колко е струвало всичко това на данъкоплатците. Освен транспорта и престоя в столицата, на всички тези хора са изплатени командировъчни и извънредни. Отговорът би трябвало лесно да се намери на страницата на МВР. Припомням,...]]></description>
										<content:encoded><![CDATA[<p><a href="http://opendata.yurukov.net/spending/mvr/" target="_blank"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2014/01/mvr_scr1-1.png" width="448" height="402" style="border:1px solid gray" /></a></p>
<p>Всички видяхме как десетки хиляди полицаи бяха докарани в София, за да респектират протестиращите. Навярно ви е минавал през главата въпросът колко е струвало всичко това на данъкоплатците. Освен транспорта и престоя в столицата, на всички тези хора са изплатени командировъчни и извънредни.</p>
<p>Отговорът би трябвало лесно да се намери на страницата на МВР. Припомням, че от август 2012-та всички институции са задължени да публикуват ежедневни отчети за бюджетните си плащания по причини &#8211; заплати, осигуровки, издръжка и прочие. Настрана от <a href="http://www.dnevnik.bg/bulgaria/2012/09/17/1904531_publichnostta_na_plashtaniiata_v_bjudjetnata_sfera_-/" target="_blank">принципните проблеми</a> с изискването, дори това, което ни се предоставя е неизползваемо. Причината се крие във формата &#8211; всяка институция избира под каква форма да пусне данните. Някои дават таблица, други снимка на екрана си. МВР пуска PDF документи. За да си направите някаква справка, трябва да прегледате 360 документа, да копирате цифра по цифра и с елка да пресмятате. Това е състоянието на <a href="http://yurukov.net/blog/2012/12/22/prozrachnost/" target="_blank">прозрачността</a> в държавата ни в момента.<br />
<span id="more-14843"></span><br />
<img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2014/01/spending-1.png" width="450" height="260" style="border:1px solid gray" /></p>
<p>Има обаче добра новина. Хора като мен намират начини да извадят полезната информация скрита къде умишлено, къде от глупост и недоглеждане. Случаят на отчетите на МВР беше особено труден, защото след като прехвърлих данните в текстова форма, те нямаха ясно изразена структура. За човек би било лесно да разбере коя цифра към коя колона принадлежи на снимката горе, но не и за компютър. Също така има разделение със шпация между хилядите <em>(това две колони са или една цифра)</em>, разместване на редове, липсващи колони и т.н. След няколко опита през ноември намерих начин и автоматизирах процеса. От тогава насам всеки ден се обновяват данните за плащанията. От голяма помощ беше допълнителната информация за сумите по редове, защото така потвърждавам прочетените цифри. Все пак, около десетина отчета бяха толкова объркани, че се наложи да ги въвеждам на ръка. Целия код на проекта е достъпен в <a href="https://github.com/yurukov/Police-spending" target="_blank">GitHub</a>.</p>
<p>В последните седмици направих и <strong><a href="http://opendata.yurukov.net/spending/mvr/" target="_blank">интерактивно табло</a></strong> (dashboard) за данните. На него са показани общите суми преведени по дни и по месеци, причините и дирекциите, които са направили плащанията. Може да се филтрира по тези три показателя чрез графиките и таблиците. При избиране на филтър, адресът на страницата се обновява и може да споделите това, което виждате. Например, може изберете всички <a href="http://opendata.yurukov.net/spending/mvr/#130614,140119&#038;01" target="_blank">заплати</a> изплатени по време на #дансwithme или <a href="http://opendata.yurukov.net/spending/mvr/#130801,140119&#038;88" target="_blank">сравнение</a> на &#8222;средства за разпореждане&#8220; на този кабинет спрямо предишния. Над таблиците има бързи линкове за избиране. Повече за графиките и филтрирането ще прочетете на самото табло.</p>
<p>Представени така, данните показват интересни неща. Пример за това са въпросните &#8222;средства за разпореждане&#8220;. Не открих за какво точно се използват, но видях, че са се увеличили със 160 пъти до 27 млн.лв. Заплатите също са интересни. Има ясни пикове през април, юни и декември <em>(интересно защо)</em>. При подслушването има намаление при издръжката, макар и малко като сума, но <a href="http://opendata.yurukov.net/spending/mvr/#130801,140126&#038;01,03&#038;5" target="_blank">сериозно покачване</a> при заплатите през декември 2013. Всъщност това важи за всички дирекции. Около 70% от парите за МВР отиват за заплати и възнаграждения. Едва 18.6% са за издръжка. Припомням, че сме на едно от първите места в Европа по брой полицаи на глава от населението. Това има ясни измерения в разходите на най-скъпото ни ведомство.</p>
<p style="text-align:right;"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2014/01/spending1-1.png" width="450" height="130" /><em>Плащанията по месеци като изключим<br />заплати, стипендии и осигуровки</em></p>
<p>Разбира се, всички данни идват с условности. Качеството на тези зависят на първо място от коректността на министерството, която доколкото разбрах не се следи от МС въпреки поетия ангажимент. На второ място, възможно е да има грешки при автоматичната обработка. Най-вече обаче е важно как интерпретираме данните. Ще забележите, че има доста отрицателни преводи. Те са в категория &#8222;Служебни операции в БНБ&#8220; и предполагам, че се отнасят до суми връщани в държавния бюджет. Министерството също присъства в списъка, но преводите са почти нулирани &#8211; когато има превод от няколко милиона, те са връщани ден по-късно. Няма обяснение за тези странни плащания и навярно само касиерите могат да отговорят. </p>
<p>Важно е да отбележим, че тези суми се отнасят до парите, които министерството е превеждало на дирекциите си през системата СЕБРА. Не включват прословутите дарения от фирми. Не става ясно и каква част от компенсациите са заплати, бонуси, за извънреден труд или обезщетения. Притеснително е, че от началото на 2013-та МВР е спряло да внася осигуровки, но и това може да има някакво обяснение. </p>
<p>Нещо, което бързо ще научите, когато се заровите в данните, е че те не дават отговори, а нови въпроси, за които не сме се замисляли. Ако данните и интерпретацията им е вярна, въпросите са полезни и могат да осветят неприятни истини или да разбият заблуди. Всичко останало са спекулации.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2014/biudjet-na-policiqta/feed/</wfw:commentRss>
			<slash:comments>9</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">14843</post-id>	</item>
		<item>
		<title>Не точно цензура, но някъде в тази посока</title>
		<link>https://yurukov.net/blog/2013/nqkyde-kym-cenzuranta/</link>
					<comments>https://yurukov.net/blog/2013/nqkyde-kym-cenzuranta/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Mon, 25 Nov 2013 19:44:43 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[агенция]]></category>
		<category><![CDATA[архиви]]></category>
		<category><![CDATA[грешка]]></category>
		<category><![CDATA[ДС]]></category>
		<category><![CDATA[линк]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[политбюро]]></category>
		<category><![CDATA[сайт]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=14635</guid>

					<description><![CDATA[Представете си, че намирате една много интересна за вас информация. Например &#8211; колко директори на училища са били агенти на ДС. Сега си представете, че искате да споделите тази информация с някой. Как го правите? Лесно &#8211; копирате адреса и го споделяте я във Facebook, я в Twitter, я по мейл на горките си колеги....]]></description>
										<content:encoded><![CDATA[<p>Представете си, че намирате една много интересна за вас информация. Например &#8211; колко директори на училища са били агенти на ДС. Сега си представете, че искате да споделите тази информация с някой. Как го правите? Лесно &#8211; копирате адреса и го споделяте я във Facebook, я в Twitter, я по мейл на горките си колеги. Те отварят линка и получават информацията. </p>
<p>Не обаче и ако става въпрос за Държавна агенция &#8222;Архиви&#8220;. Там може да намерите архивите на Политбюрото, полицейските досиета от преди &#8217;44, имената на загиналите през Балканските войни и документи от еврейската общност. Работата е, че може да ги откриете само, ако отворите сайта <a href="http://www.archives.bg/" target="_blank">archives.bg</a>. Ако ги отворите през Google или споделена връзка <em>(както тази в предишното изречение)</em>, ще видите грешка &#8222;403 Забранено&#8220;. Това на прост език означава, че на ДАА са забранили някой да споделя каквото и да е от сайта. </p>
<p style="text-align:right"><a href="http://yurukov.net/blog/wp-content/uploads/2013/11/daa2.png" rel="lightbox[daa]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/11/daa2a-1.jpg" width="220" height="293" style="margin:0 6px 8px 0; border:1px solid gray;"/></a><a href="http://yurukov.net/blog/wp-content/uploads/2013/11/daa1.png" rel="lightbox[daa]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/11/daa1a-1.jpg" width="220" height="293" style="margin:0 0 8px 0; border:1px solid gray;" /></a><i>Страница отворена през линк и директно през сайта им.</i></p>
<p><span id="more-14635"></span><br />
Разбира се, след като видите въпросната грешка, може да презаредите страницата и тя ще се отвори нормално. Така се изчиства състоянието, че сте препратени от друг сайт и ДАА не ви блокира. Стандартната реакция на всеки обаче е да затвори прозореца, тъй като явно става дума за сгрешен линк. Всичко това може, разбира се, да е техническа грешка. Не се сещам обаче за ситуация, в която да се е случило. Освен може би, ако са искали да блокират някой конкретно, а са блокирали всички. <em>(Погледнете и тезата на Михаил в <a href="#comment-28636">коментарите</a>)</em> Навярно нямаме и основание да спекулираме, че има общо със смяната на шефа на агенцията с човек от МВР. </p>
<p>Открих този проблем с добавката за <a href="http://w-shadow.com/blog/2007/08/05/broken-link-checker-for-wordpress/" target="_blank">WP за търсене</a> на счупени линкове. Потвърдих, че не са блокирали само мен като отворих линкове от чужди сайтове. Имам проблеми да заредя страниците и през автоматичните ми скриптове за теглене на информация.</p>
<p>Още по темата:</p>
<p style="padding-left:15px"><a href="http://yurukov.net/blog/2013/03/14/twitter-vazpomenanie/" target="_blank">Възпоменание в Twitter на загиналите през Балканските войни</a><br />
<a href="http://opendata.yurukov.net/balkanwars/" target="_blank">Отворени данни за загиналите войници през Балканските войни</a><br />
<a href="http://opendata.yurukov.net/statesecurity/" target="_blank">Отворени данни за сътрудниците на Държавна сигурност</a></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/nqkyde-kym-cenzuranta/feed/</wfw:commentRss>
			<slash:comments>9</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">14635</post-id>	</item>
		<item>
		<title>OGP, България и какво е направено за прозрачността</title>
		<link>https://yurukov.net/blog/2013/ogp-i-bulgaria/</link>
					<comments>https://yurukov.net/blog/2013/ogp-i-bulgaria/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Tue, 29 Oct 2013 13:21:29 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[ogp]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[прозрачност]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=14502</guid>

					<description><![CDATA[В четвъртък в Лондон започва годишната среща на Open Government Partnership, за който писах доста до сега. България се включи в партньорството декларирайки редица цели в отваряне на данни и процедури в администрацията. На срещата трябва да представим доклад за напредъка си. Напредък?! През юни 2012-та излезе общ план в 33 точки за различни мерки...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/10/ogp1.jpg" width="450" height="144" /></p>
<p>В четвъртък в Лондон започва годишната среща на Open Government Partnership, за който писах <a href="http://yurukov.net/blog/?s=ogp" target="_blank" rel="noopener">доста</a> до сега. България се включи в партньорството декларирайки редица цели в отваряне на данни и процедури в администрацията. На срещата трябва да представим доклад за напредъка си.</p>
<h3>Напредък?!</h3>
<p>През юни 2012-та излезе <a href="http://yurukov.net/blog/2012/06/27/prozrachnost-v-balgari/" target="_blank" rel="noopener">общ план</a> в 33 точки за различни мерки за прозрачност. Точно тя бяха изпратени на OGP като официални цели. Очакваше се да последва стратегия с конкретни мерки по ресори, но доколкото ми е известно това не стана. От идеите само по една беше направена нещо &#8211; всяка бюджетна институция да пуска ежедневно справка с бюджетните си плащания. Тези справки обаче са практически неизползваеми &#8211; не са в отворен формат; пръснати са из сайтовете на ведомствата; не съдържат данни за отделни плащания, а за общи суми по направление; липсва документация за качеството, отговорните лица и прочие. Няма никаква техническа пречка всички тези проблеми да бъдат оправени от администраторите на финансовото министерство. Трябва <em>само</em> да бъде спусната заповед с точни инструкции от МС.</p>
<p>Знам, че са били водени разговори през последната година и половина за изготвяне на opendata портал. Продукт на Microsoft е бил дискутиран. Моето предложение все още е CKAN, който се използва от много подобни национални портали. В специалната страница за OGP в Strategy.bg няма нищо ново от март 2012-та. В началото на 2013-та беше създаден Обществен съвет &#8222;Прозрачност&#8220; към транспортното министерство. В него се обсъждаха различни идеи и технологии. През юни излезе linked data търсачка за документите на Министерски съвет, която е дело на Пейо Попов. Към Egov.bg има и страница за оперативна съвместимост с регистър към различни данни. Изглежда обаче е попълнен само с тестова информация.<br />
<span id="more-14502"></span></p>
<p><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/03/freedomofinformation1-1.jpg"></p>
<h3>Още стратегии</h3>
<p>След изборите ми писаха от дирекция в МС, която явно се занимава специално с отворени данни. Тогава им изпратих всичко, което съм изготвил като технически спецификации, предложения, примери, доклади и прочие. Знам, че изготвят стратегия за отворени данни, но не съм я видял до сега. Единствено на 9-ти август излезе решение на Съвета за административната реформа за въвеждане на opendata и директива 2013/37/ЕС (повторно използване на публична информация). Изготвянето на стратегия, както сме видели многократно до сега, само по себе си нищо не означава. Надеждата ми е обаче, че законодателните промени около директивата ще се случат по-скоро. Дай боже и да се изготви технически изисквания за публичните данни &#8211; нещо, за което говорим от години. </p>
<p>Стратегията на тази дирекция, доколкото разбирам, ще пренапише целите от юни 2012-та. По последните на практика няма движение нито от миналия, нито от сегашния кабинет. Затова ми е много интересно какво ще бъде съобщено в края на седмицата. Попитах няколко пъти, но не получих отговори дали ще имаме представител и какво би представил в Лондон.</p>
<h3>Open Data Преброяване</h3>
<p>Междувременно излезе един вид <a href="http://census.okfn.org" target="_blank" rel="noopener">индекс на отворените данни</a> изготвен от OKFN. Интересна статия за него ще намерите в <a href="http://www.economist.com/blogs/graphicdetail/2013/10/daily-chart-19?fsrc=scn/tw_ec/the_open_society_and_its_enemies" target="_blank" rel="noopener">Economist</a>. България има сравнително добър резултат, но това далеч не е заради усилията на публичната администрация. С Пейо се постарахме да изровим колкото се може за България, за да покажем, че нещо се случва въобще. Повечето данни съществуват всъщност заради манията в последното десетилетие да правим регистри за всичко. Проблемът обаче е, че при липсата на единни стандарти, всеки регистър или публична информация се качва според както му хрумне на клетия чиновник натоварен със задачата. Така се стига до комични ситуации като снимка на екран с таблица. По този критерий се проваляме драстично &#8211; има ги данните, но не са използваеми. Проваляме се и с данните за фирмите &#8211; тези от <a href="http://yurukov.net/blog/2012/01/24/koi-ima-pylen-dostyp-do-tr/" target="_blank" rel="noopener">търговския регистър се заплащат</a> против всякаква бизнес и държавническа логика. </p>
<p>Още по темата за отворени данни може да прочие ще намерите в <a href="http://yurukov.net/blog/?s=opendata" target="_blank" rel="noopener">предишните ми статии</a>. Погледнете и някои от <a href="http://opendata.yurukov.net/" target="_blank" rel="noopener">проектите ми за отваряне</a> на данни и визуализирането им. Ще продължа да пускам новини за OGP в <a href="https://twitter.com/yurukov">Twitter</a>. </p>
<p style="text-align:right;"><a href="http://yurukov.net/blog/wp-content/uploads/2013/10/Open-data-index-mapped-001.jpg"><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/10/Open-data-index-mapped-002.jpg"/></a><i>Карта от <a href="http://www.theguardian.com/news/datablog/2013/oct/28/uk-top-open-data-index-how-countries-compare">The Guardian</a> на най-добре справящите се с opendata страни</i></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/ogp-i-bulgaria/feed/</wfw:commentRss>
			<slash:comments>3</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">14502</post-id>	</item>
		<item>
		<title>Замърсяването в България</title>
		<link>https://yurukov.net/blog/2013/zamarsqvane-v-bg/</link>
					<comments>https://yurukov.net/blog/2013/zamarsqvane-v-bg/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Wed, 16 Oct 2013 12:25:38 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[българия]]></category>
		<category><![CDATA[вода]]></category>
		<category><![CDATA[въздух]]></category>
		<category><![CDATA[градове]]></category>
		<category><![CDATA[графика]]></category>
		<category><![CDATA[замърсяване]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[почва]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=14463</guid>

					<description><![CDATA[Истинският проблем със замърсяването е ерозията и трафика Вчера излезе статия в NYT, според която 4 от 10-те най-замърсени градове в Европа са в България. Статията цитира изследване на Европейската агенция за околна среда обобщаващо измервания направени между 2002 и 2011. Самото изследване не предизвика такъв отзвук в родните медии, колкото гръмкото заглавие на NYT....]]></description>
										<content:encoded><![CDATA[<p style="text-align:right;"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/10/11-11-21-63698_1.jpg" width="450" height="234"/><i>Истинският проблем със замърсяването е ерозията и трафика</i></p>
<p>Вчера излезе <a href="http://www.nytimes.com/interactive/2013/10/15/business/international/europe-air-quality.html?ref=international&#038;_r=0" target="_blank">статия</a> в NYT, според която 4 от 10-те най-замърсени градове в Европа са в България. Статията цитира <a href="http://www.eea.europa.eu/publications/air-quality-in-europe-2013" target="_blank">изследване</a> на Европейската агенция за околна среда обобщаващо измервания направени между 2002 и 2011. Самото изследване не предизвика такъв <a href="http://www.dnevnik.bg/zelen/2013/10/15/2161183_100_ot_gradskoto_naselenie_u_nas_dishat_silno_zamursen/" target="_blank">отзвук</a> в родните медии, колкото гръмкото заглавие на NYT. Добре е обаче да се загледаме по-добре в данните, за да намерим причините. </p>
<p>По случайност няколко дни преди излизането на доклада започнах да разглеждам индустриалното замърсяване. Тук не включвам праха <em>(виж <a href="http://yurukov.net/blog/2013/10/16/zamarsqvane-v-bg/#more-1910">допълнението</a>)</em> или емисиите от коли и човешка дейност, за които се говори в доклада. В България, както във всяка друга европейска държава, има доста добър регистър за всички предприятия изхвърлящи емисии и боравещи с отпадъци. Има подобни данни по години кой какво къде и колко е изхвърлял. Разбира се, данните не могат да се получат наведнъж в удобен формат <em>(що да може)</em> и затова написах скрипт да ги сваля. Допълнителни връзки ще намерите по-долу.</p>
<p><a href="http://opendata.yurukov.net/ecology/"><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/10/ecology1.jpg" alt="ecology" width="450" /></a><br />
<span id="more-14463"></span><br />
Вчера пуснах официално и <a href="http://opendata.yurukov.net/ecology/" target="_blank">интерактивна визуализация</a> показваща взаимовръзките. На страницата ще видите карта с няколко графики. На картата са показани всички замърсяващи инсталации. Виждат се като точки с примерен радиус на въздействие, а при по-голямо увеличение &#8211; като маркери на картата. Другите графики показват промяната на изхвърлените количества през годините, колко е изхвърлено като процент във въздуха, водата и почвата, какъв процент от инсталациите измерват, изчисляват или преценят какви са емисиите им. Двете таблици показват съответно вида химикали и 10-те най-замърсяващи инсталации заедно с количествата. Всяка таблица показва тенденция на покачване или намаляване, а като спрете с мишката върху въпросния ред ще видите повече подробности в проценти. </p>
<p>Всички графики са свързани една с друга и позволяват филтриране на данните. Ако увеличите картата до даден регион, на другите графики и таблици ще се покажат данни само за инсталации попадащи в него. Аналогично, ако изберете от втората кръгова графика &#8222;Въздух&#8220;, ще се покажат само инсталации, химикали и количества изхвърляни във въздуха. В таблиците може да избирате един или повече елемента като ги натискате един след друг. Ако натиснете на групата, ще изберете всички елементи от нея. Над таблиците и над графиката има бързи линкове за отделни филтри и изчистване на всички ограничения. </p>
<p><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/10/ecology11.jpg" alt="ecology" width="450" /></p>
<p>Направих графиката с идеята да можем по-лесно да видим кой как замърсява околната среда в различни региони на страната. Разбира се, замърсяването не може да бъде избегнато, защото е неразделна част от индустрията. Може обаче да бъде намалено до минимум или да се въведат процеси с по-малко отпадъци. Важно е да се разбере, че данните, за които говоря, покриват само индустриалното замърсяване. Големият проблем, който евро-докладът посочва, е прахът <em>(виж <a href="http://yurukov.net/blog/2013/10/16/zamarsqvane-v-bg/#more-1910">допълнението</a>)</em>. Той може да бъде решен чрез устойчиво озеленяване в градовете, стриктно спазване на ограниченията при строеж, намаляване на използването на коли и редовно почистване на улици и тротоари. Във връзка с устойчивото озеленяване има интересни инициативи за &#8222;осиновяване&#8220; на градинки. Повече за това обаче друг път.</p>
<p>Данните от регистъра може да свалите като CSV/Excel таблици на <a href="http://opendata.yurukov.net/ecology/data/">тази страница</a>. Там ще намерите и цялата SQL база данни. Кодът на страницата е в <a href="https://github.com/yurukov/Ecology_Opendata">Github</a>. Данните за цяла Европа може да намерите в RDF формат на страницата на E-PRTR. Включват и тези за България, но само до 2011-та. Затова отворих нашия регистър, а ми трябваха в по-прост формат. Ще намерите и доста подробен <a href="http://ec.europa.eu/environment/industry/stationary/eper/pdf/bg_prtr.pdf">документ</a> на български език описваш данните в регистъра и методологията на събиране. </p>
<h2 id="more-1910">Допълнение 19 октомври</h2>
<p>Разглеждайки по-подробно данните открих, че всъщност са включвани праховите частици (PM10). На графиката се вижда че средно за страната прахът изхвърлен от индустрията е намалял сериозно &#8211; през 2012-та вече е 1/3 от количествата през 2009-та. При инсталациите край София и Перник разликата е още по-драстична &#8211; 30 пъти. Аналогична тенденция виждаме при много други замърсители.</p>
<p>Направих някои промени в графиката, които са вече публични от снощи. Първата е, че в лявата таблица не се показват вече площадките, а управляващите компании. Втората е, че добавих бързи линкове с филтри. Те позволяват да се фокусира картата на даден регион и автоматично да се избират определени замърсители или параметри, за да се покаже определен аспект от данните. Например &#8211; <a href="http://opendata.yurukov.net/ecology/#42.478,22.705,42.932,23.968&#038;&#038;15_air&#038;&#038;&#038;air" target="_blank">праховото замърсяване около Перник и София</a>. Третата промяна е, че когато сменяте параметрите на графиката, фолтърът се запазва в адреса отгоре. Така може да го споделите, както направих с предишния линк. Когато някой го отвори, ще види това, което вие сте гледали като филтрирани данни. Още един пример &#8211; всички компании, които пренасят <a href="http://opendata.yurukov.net/ecology/#&#038;&#038;8_waste-transfer,30_waste-transfer&#038;&#038;&#038;waste-transfer" target="_blank">опасни отпадъци в и извън страната</a>. </p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/zamarsqvane-v-bg/feed/</wfw:commentRss>
			<slash:comments>26</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">14463</post-id>	</item>
		<item>
		<title>Картата на престъпността на МВР &#8211; прекрасно, но защо не е публична?</title>
		<link>https://yurukov.net/blog/2013/karta-na-prestapnostta/</link>
					<comments>https://yurukov.net/blog/2013/karta-na-prestapnostta/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Fri, 19 Jul 2013 16:00:11 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[crime.bg кражби]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[карта]]></category>
		<category><![CDATA[мвр]]></category>
		<category><![CDATA[престъпления]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=14195</guid>

					<description><![CDATA[Не ми се случва често да хваля МВР. Всъщност на малко хора им се случва. Сега ще го направя&#8230; донякъде. Покрай Lipsva видях от първа ръка колко дълбоки проблеми има системата, но и че нерядко заради стереотипи не оценяваме работата, която вършат. Във вторник на пресконференция директорът на &#8222;Координация и информационно-аналитична дейност&#8220; Николай Крушков е...]]></description>
										<content:encoded><![CDATA[<p>Не ми се случва често да хваля МВР. Всъщност на малко хора им се случва. Сега ще го направя&#8230; донякъде. Покрай <a href="http://lipsva.com" target="_blank" rel="noopener noreferrer">Lipsva</a> видях от първа ръка колко дълбоки проблеми има системата, но и че нерядко заради стереотипи не оценяваме работата, която вършат. </p>
<p>Във вторник на пресконференция директорът на &#8222;Координация и информационно-аналитична дейност&#8220; Николай Крушков е представил интерактивна карта на престъпността изготвена от МВР. Тук съм пуснал няколко снимки от презентацията му. Ако сте чели блога ми до сега ще разберете защо първата ми работа беше да намеря сайта и да видя как може да се извадят данните. За жалост не е публичен, но за това по-нататък. </p>
<p><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/m1.jpg" rel="lightbox[mvrmap]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/m1s.jpg" width="220" height="147" style="border:1px solid gray;margin:0 6px 8px 0;"/></a><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/m3.jpg" rel="lightbox[mvrmap]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/m3s.jpg" width="220" height="147" style="border:1px solid gray;margin-bottom:8px;"/></a></p>
<p>Новият инструмент на МВР позволява анализ по време и местоположение на всички престъпления. Сега работи с оперативни данни от реални престъпления от тази година и се обновява всеки месец. Интересно ми е дали може да се направи ежедневно &#8211; още при въвеждане на докада в системата. Не става ясно дали има категоризация по типове престъпление (обир, побой и т.н.), но е логично да са го предвидили.</p>
<p>По снимките бих казал, че графично системата изглежда добре. Има heatmap на случаите, както и разпределение по квартали и региони &#8211; нещо, което мен ме интересува най-много. От презентацията става ясно, че може да се открие концентрация на престъпления от даден тип. Според целите им, така ще планират разследванията и патрулите по-добре. <span id="more-14195"></span></p>
<p><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/m2.jpg" rel="lightbox[mvrmap]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/m2s.jpg" width="220" height="147" style="border:1px solid gray;margin:0 6px 8px 0;"/></a><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/m7.jpg" rel="lightbox[mvrmap]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/m7s.jpg" width="220" height="147" style="border:1px solid gray;margin-bottom:8px;"/></a><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/m8.jpg" rel="lightbox[mvrmap]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/m8s.jpg" width="220" height="147" style="border:1px solid gray;margin:0 6px 8px 0;"/></a><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/m9.jpg" rel="lightbox[mvrmap]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/m9s.jpg" width="220" height="147" style="border:1px solid gray;margin-bottom:8px;"/></a></p>
<p>Разбира се, ползите от разбор на данните за престъпността са известни отдавна. Това, в което всички се съмнявахме беше, че МВР въобще прави такъв анализ. С този инструмент ще е доста по-лесно. Въпросът обаче е дали някаква част от него ще е публична. Зададох този въпрос и чакам отговор. Не очаквам, разбира се, целия инструмент да бъде публичен заради достъпа до оперативните данни. На снимките се вижда доста точно местоположението на отделни случаи, а вероятно може да се видят и други подробности.</p>
<p>Все пак може да получим суровата информация. Това е нещо, което много градове и държави по света вече са направили и позволява журналисти и научни работници да ги анализират. Именно заради тази липса направих <a href="http://yurukov.net/blog/2011/08/07/crime-bg-karta-na-prestypnostta-v-bylgariq/" target="_blank" rel="noopener noreferrer">Crime.bg</a>, но проекта беше неуспешен. За това обаче ще пиша друг път. МВР не може, разбира се, да ни предостави всичко заради защитата на личните данни на засегнатите. Има обаче начини да пусне информация в отворен формат, която да е достатъчно защитена и в същото време полезна. </p>
<p>За целта се скрива определена информация и се намалява точността на друга. Може, например, да получим CSV (или Excel) с по един запис за всяко престъпление в страната. Записа ще има няколко колони &#8211; уникален номер, категоризация на типа престъпление, географски координати записани с точност от няколко стотин метра, дата и час на престъплението или период, в който се е случил. Това ще е доста добро начало. Няма да може да се определи точния адрес заради приблизителните координати. Към всеки случай може да се добавя по-късно и в каква фаза е разследването. </p>
<p style="text-align:right;"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/colormap.png" width="450" height="238" style="border:1px solid gray"/><i>Доста приятна карта на престъпността в щатите</i></p>
<p>Първата пряка полза от публичността е, че потърпевшите могат сами да проверяват дали сигналът им е бил отразен в системата на полицията. Тук говорим за доверие, което липсва у нас. За съжаление, много хора вярват, че полицията крие истинските измерения на престъпността, че не разследва случаите и затова не виждат смисъл да съобщават кражби и побоища. Основната полза обаче е анализа на съвкупност от престъпления. Ще се идентифицират региони с висока престъпност и това ще помогне при избор на жилища. Ще се вижда ефективността на акции и конкретни арести на полицията, смени в ръководството на РПУ-та, осветяване на паркове и нови жилищни комплекси. Най-важното обаче е, че данните ще могат да се комбинират с други и да се използват по неподозирани начини. За сравнение, сега получаваме обща статистика потребна единствено за гръмки заглавия в медиите без особена мисъл зад тях. Същият ефект би имало да нахвърлим случайни цифри на една таблица &#8211; не може да се провери и пак ще се цитира дословно от журналистите. </p>
<p>Създаването на инструмент като този, който МВР показа, не е трудно. Трудно е да се осъзнае нуждата от такъв, както и да се осмисли информацията. Затова &#8211; браво на МВР за визията. Надявам се обаче, че все пак ще пуснат данните, за които говоря, в отворен формат. Видимо ги имат събрани и е въпрос на проста справка, за да се пуснат в мрежата. Всъщност това е информация, за която вече сме си платили и е публична собственост. Повечето институции <a href="http://yurukov.net/blog/2012/11/07/i-kat-i-mvr/">обаче се притесняват от такава прозрачност</a> заради криворазбрано чувство за собственост и нужда от контрол над всякаква информация. </p>
<p>Презентацията на МВР ще намерите на страницата на пресцентъра им. Ето примерни карти с подробно описание на всяко престъпление от Аризона, <a href="https://www.crimemapping.com/Share/4fc1adcc6ae24be6ba6d37125f9ee47f" target="_blank" rel="noopener noreferrer">LA</a> и Лондон.</p>
<h2>Още статии по темата:</h2>
<p style="clear:both;text-align:left;"><a href="http://yurukov.net/blog/2012/11/07/i-kat-i-mvr/"><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/11/bureaucrat-pan_19193-130x130.jpg" style="float:left;width:130px;padding:0 15px 15px;"/> </p>
<p><span style="font-size:130%;">Електронно управление с чиновнически дъх</span></a><br /><i>7 ноември 2012</i></p>
<p style="clear:both;text-align:left;"><a href="http://yurukov.net/blog/2010/10/19/za-lichnite-danni-na-bezsledno-izchezna/"><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2010/10/lipsva-130x130.gif" style="float:left;width:130px;padding:0 15px 15px;"/> </p>
<p><span style="font-size:130%;">За личните данни на безследно изчезналите</span></a><br /><i>19 октомври 2010</i></p>
<p style="clear:both;text-align:left;"><a href="http://yurukov.net/blog/2012/09/09/katastrofite-v-sofiq/"><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/09/1234561-130x130.jpg" style="float:left;width:130px;padding:0 15px 15px;"/> </p>
<p><span style="font-size:130%;">Катастрофите в София</span></a><br /><i>9 септември 2012</i></p>
<p style="clear:both;"><a href="http://yurukov.net/blog/2010/06/12/bezsledno-izcheznalite-na-bylgariq/"><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2010/06/3736850281_f03ddaac48_b-130x130.jpg" style="float:left;width:130px;padding:0 15px 15px;"/> </p>
<p><span style="font-size:130%;">Безследно изчезналите на България</span></a><br /><i>12 юни 2010</i></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/karta-na-prestapnostta/feed/</wfw:commentRss>
			<slash:comments>10</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">14195</post-id>	</item>
		<item>
		<title>Раждаемостта в България</title>
		<link>https://yurukov.net/blog/2013/rajdaemost_bg/</link>
					<comments>https://yurukov.net/blog/2013/rajdaemost_bg/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Thu, 11 Jul 2013 14:16:41 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[данни]]></category>
		<category><![CDATA[електронно управление]]></category>
		<category><![CDATA[здравеопазването]]></category>
		<category><![CDATA[министерство]]></category>
		<category><![CDATA[нси]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[раждания]]></category>
		<category><![CDATA[статистика]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=14150</guid>

					<description><![CDATA[Преди година Министерството на Здравеопазването пусна регистър на ражданията. Целта му беше всяко родилно отделение в страната да въвежда данни за всяко раждане &#8211; кой екип, какви проблеми е имало, данните на детето и прочие. В публичната част на регистъра виждаме ежедневно броя родени по области. Както се досещате, още като го пуснаха отворих данните...]]></description>
										<content:encoded><![CDATA[<p>Преди година Министерството на Здравеопазването пусна регистър на ражданията. Целта му беше всяко родилно отделение в страната да въвежда данни за всяко раждане &#8211; кой екип, какви проблеми е имало, данните на детето и прочие. В публичната част на регистъра виждаме ежедневно броя родени по области. Както се досещате, още като го пуснаха <a href="http://yurukov.net/blog/2012/01/10/danni-za-rajdaemostta-v-bg/" target="_blank">отворих данните</a> и направих проста <a href="http://opendata.yurukov.net/birth/" target="_blank">визуализация</a>.</p>
<p>През изминалата година и половина на няколко пъти се свързах с тези, които поддържат регистъра. Писах за множеството проблеми с данните в него и го дадох на няколко места като <a href="http://yurukov.net/blog/2012/03/20/anti-opengov/" target="_blank">анти-пример за отворено управление</a>. Дори като изключим това, че ме блокираха няколко пъти и въведоха captcha, за да не може да се свалят &#8222;публичните данни&#8220;, отрано се оказа, че самото въвеждане на информация от болниците е непълно. Разбираемо е да има няколко дни забавяне, какъвто толеранс са въвели в инструкциите, но на места явно срокът доста по-голям. Успявах обаче да обновявам данните и да поддържам графиките. </p>
<p style="text-align:right;"><small>Натиснете графиката за по-голям размер</small><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/birth1-1.png" rel="lightbox[birth]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/birth1s-1.png" width="450" height="127"/></a><small>Календар по седмици показващ дните, в които е имало <span style="color:green">повече</span> или <span style="color:red">по-малко</span> раждания от средното за годината. Месеците са заградени в черна рамка.</small></p>
<p>Наскоро реших да анализирам данните за 2012-та и да ги сравня с тези на НСИ. Останах стъписан &#8211; в някои региони има разлики от порядъка на два пъти. По-притеснително е, че 8.31% от ражданията регистрирани от НСИ не са отразени в регистъра на ражданията на МЗ. Това са 5787 деца.<br />
<span id="more-14150"></span></p>
<h2>Неточности и неясноти</h2>
<p>Тезата ми за тях е, че регистъра на МЗ отразява само родените в болниците докато НСИ &#8211; всички регистрирани в ГРАО. Така разликата вероятно идва от децата родени в чужбина и получили автоматично гражданство. Докато за 2012-та ражданията в България излизат около 95 на 10000 души, то според горните цифри в чужбина има 57 родени на 10000 <em>(приемайки условно 1 милион зад граница)</em>. Не успях обаче да потвърдя тази теза.</p>
<p style="text-align:right;"><small>Натиснете графиката за по-голям размер</small><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/birth2-1.png" rel="lightbox[birth]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/birth2s-1.png" width="450" height="278" /></a><small>Деца родени извън областта в %</small></p>
<p>След разговор с НСИ обаче разбрах защо има такива големи разминавания при областите. НСИ взима информация от ГРАО и записва ражданията по адресна регистрация на родителите. Така, ако едно дете е родено в София, но родителите му имат постоянен адрес в Благоевград, НСИ ще сметне раждането в Благоевград, а МЗ <em>(евентуално)</em> в София. На горната графика се вижда това разминаване. В зелено са областите, където са родени много деца с адреси в други области. В червено са областите, където родилките са предпочели да отидат другаде. Разбираемо жените от София-област раждат предимно в София. Интересното е, че същото важи за Ямбол, които раждат в Сливен. На графиката по-долу виждате къде са родени най-много деца за 2012-та спрямо населението между 20 и 59 години. </p>
<p>За жалост, тези данни не са точни заради проблемите с регистъра на МЗ. Попитах и тях за тези разминавания и за методологията им. Когато ми отговориха <em>(най-накрая и не много охотно)</em> се оказа, че въвеждането на информация не се проверява. Разчита се на коректността на болниците без те да имат реален стимул. Това обяснява защо откривам 2% разлика между данните, които съм зареждал в течение на 2012-та и тези, които виждаме сега &#8211; няколко месеца по-късно. В Габрово, например, са пропуснали да въведат 15% от ражданията си навреме. </p>
<p style="text-align:right;"><small>Натиснете графиката за по-голям размер</small><a href="http://yurukov.net/blog/wp-content/uploads/2013/07/birth3-1.png" rel="lightbox[birth]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/07/birth3s-1.png" width="450" height="278"/></a><small>Брой раждания на всеки 10000 души</small></p>
<p>Разбира се, това че някакъв си списък в мрежата не е точен говори единствено за лоша организация в Министерството на здравеопазването &#8211; нещо, което знаем така или иначе. Публичната таблица не показва много, но регистърът може да е доста полезен. Първоначалната му цел е била да се използва за анализ на проблемите в болниците и при ражданията. Разминаванията, които виждам, говорят, че това е невъзможно предвид некачествените данни.</p>
<h2>Модел на поведение в администрацията</h2>
<p>Ще попитате какво пък такова значение има един регистър. Вероятно не чак толкова голямо, макар за него и сега да се харчат пари и стотици човекочаса за поддръжка и въвеждане. Този модел на работа обаче е типичен за всеки регистър, на който съм попадал в администрацията ни. И това, и предишните правителства говорят за отчетност и прозрачност. Истината е, че ако нахвърлим случайни цифри на Excel таблица и я пуснем в мрежата резултатът ще е далеч по-добър &#8211; анализите ще са също толкова точни, но поне няма да се харчат милиони за неизползвани правилно и принципно неизползваеми системи. Липсва стратегия за публичност на информацията, описание на методологията, стандарти за публикуване, поддържани и съвместимост на данните. </p>
<p>Ще завърша с част от разговора ми с Валери Борисов през юли 2010-та &#8211; тогава шеф на дирекция &#8222;Електронно управление&#8220;.</p>
<blockquote><p>&#8230;<br />
Както знаете, постоянно се пускат обществени поръчки и се създават вътрешно софтуерни системи, изискванията за които се изготвят от чиновници и поддържащ персонал без съгласуваност. Макар понякога изискванията към новите сайтове и услуги да съвпадат със стратегията, която представяте, често това не е случая. Такъв пример е поръчката за новият сайт на НС.<br />
&#8230;<br />
В този смисъл, ако има централно ръководство с препоръчителни изисквания, стандарти, формати и структура на данните, ще се постигнат три цели. Първо, тези, които изготвят поръчките ще имат на разположение рамка, върху която да работят. Второ, при създаването на сайтовете, много от отворените данни ще са на разположение дори преди началото на изпълнение на стратегията за ЕУ. Това ще е от полза както на бизнеса и хората, така и на самата стратегия за ЕУ, защото ще осигури пазар за продукта, който ЕУ предоставя и ще елиминира няколко то рисковите фактори споменати в края на плана. И не на последно място &#8211; когато проектите по ЕУ започнат, интеграцията на старите системи на различните институции ще е много по-лесно, заради това, че са изготвени по подобни стандарти и изисквания.<br />
&#8230;</p></blockquote>
<p>Същите неща повтарям от доста време и малко се е променило. През 2012-та несъвместимостта на системите беше основното извинение за липсата на напредък в eGov от страна на кабинета. Очаквам и следващите да го повтарят, докато в същото време парадират с прозрачността си. </p>
<h3>Допълнителна информация</h3>
<p>Сравнение на статистиката за ражданията &#8211; <a href="http://yurukov.net/blog/wp-content/uploads/2013/07/nsi_mz.ods">OpenOffice</a> и <a href="http://yurukov.net/blog/wp-content/uploads/2013/07/nsi_mz.xls">Excel</a><br />
<a href="http://isr.mh.government.bg/" target="_blank">Регистъра на ражданията на МЗ</a><br />
<a href="http://www.nsi.bg/bg/content/2956/%D1%80%D0%B0%D0%B6%D0%B4%D0%B0%D0%BD%D0%B8%D1%8F-%D0%BF%D0%BE-%D0%BC%D0%B5%D1%81%D1%82%D0%BE%D0%B6%D0%B8%D0%B2%D0%B5%D0%B5%D0%BD%D0%B5-%D1%81%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8-%D1%80%D0%B0%D0%B9%D0%BE%D0%BD%D0%B8-%D0%BE%D0%B1%D0%BB%D0%B0%D1%81%D1%82%D0%B8-%D0%B8-%D0%BF%D0%BE%D0%BB" target="_blank">Данни за ражданията на НСИ</a><br />
<a href="http://yurukov.net/blog/2013/07/08/smartnostta-v-bg/" target="_blank">Малко графики за смъртността и причините за нея в България</a></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/rajdaemost_bg/feed/</wfw:commentRss>
			<slash:comments>12</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">14150</post-id>	</item>
		<item>
		<title>Данни за производството и износа на ток в България</title>
		<link>https://yurukov.net/blog/2013/proizvodstvo-na-tok/</link>
					<comments>https://yurukov.net/blog/2013/proizvodstvo-na-tok/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Wed, 08 May 2013 21:21:01 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[веи]]></category>
		<category><![CDATA[енергийна система]]></category>
		<category><![CDATA[есо]]></category>
		<category><![CDATA[микс]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[ток]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=13941</guid>

					<description><![CDATA[На 21 април ЕСО пусна страница с информация колко ток се произвежда в страната по тип централи. Обновява се на всеки 35 секунди. Проблемът с тази таблица е, че няма исторически данни и се вижда само моментното състояние. Затова реших да направя скрипт, който да сваля данните и да ги предоставя в отворен формат в...]]></description>
										<content:encoded><![CDATA[<p>На 21 април ЕСО пусна <a href="https://www.eso.bg/" target="_blank" rel="noopener">страница</a> с информация колко ток се произвежда в страната по тип централи. Обновява се на всеки 35 секунди. Проблемът с тази таблица е, че няма исторически данни и се вижда само моментното състояние. Затова реших да направя скрипт, който да сваля данните и да ги предоставя в отворен формат в реално време. Всеки може да ги свали през <a href="http://opendata.yurukov.net/energy/api" target="_blank" rel="noopener">този интерфейс</a>. Към тях включих и данните за внос и износ на енергия. Те се обновяват с до 48 часа закъснение.</p>
<p>Доста обмислях как да визуализирам цялата тази информация. Проблемът е, че става дума за огромен масив от данни, който расте постоянно. За по-малко от три седмици са се събрали 430000 точки (data points). Имам още 380000 точки от исторически данни за износ и внос през последните 6 години. Като файл са по-малко от 5Mb, но никой browser не може да се справи със задачата. На този етап съм се отказал и оставям двете временни графики &#8211; данните за <a href="http://opendata.yurukov.net/energy/" target="_blank" rel="noopener">трансграничния пренос</a> и за <a href="http://opendata.yurukov.net/energy/details" target="_blank" rel="noopener">производството в страната</a>. Втората показва потреблението, производството и баланса за последните 6 часа и седмица. </p>
<p style="text-align:right;"><small>Кликнете на графиките за по-голям размер.</small><a href="http://yurukov.net/blog/wp-content/uploads/2013/05/tok1.png" rel="lightbox[tok]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/05/tok1s-1.png" width="450" height="248" /></a><i>Енергийния микс от последните 17 дни</i></p>
<p><span id="more-13941"></span></p>
<p style="text-align:right;"><a href="http://yurukov.net/blog/wp-content/uploads/2013/05/tok2.png" rel="lightbox[tok]"><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/05/tok2s-1.png" width="450" /></a><i>Внос и износ на ток от 21ви април до 1ви май</i></p>
<p>Исках да направя по-интуитивни интерактивни инструменти, но не намерих начин. Горе виждате два от експериментите, които няма да видят бял свят. Ще ми се да направя страница с 3-4 графики показващи миска в реално време и как той се отразява на крайната цена. Тоест как решенията на ЕСО минута по минута влияят на цената на тока, който плаща крайния потребител. За целта обаче ми трябват точните изкупни цени на всеки източник на енергия. Самите те обаче се променят динамично. Към тях трябва да добавим и преносните такси на НЕК и ЕРП-тата. Не успях да ги събера в таблица въпреки помощта на доста хора от Twitter и Facebook. Фактът, че сайта на ДКЕВР не работи от седмици също не помага. </p>
<p>Графиките, които съм пуснал, позволяват да се видят определени събития в работата на енергийната ни система. Например, колко се намалява натоварването на Козлодуй, колко произвеждат фотоволтиците и как ВЕЦ-овете регулират баланса в системата. На базата на тези наблюдения си позволих да пусна няколко коментара във Facebook за странни сигнали в данните. Пример за това беше удвояването на производството от ФвЕЦ-ове в 12:50 днес и повишаването на потреблението с 350Mw в абсолютно същата минута. Offnews писаха също за това. Стори ми се странно, но коментарите под <a href="https://www.facebook.com/boyan.yurukov/posts/10151590478312025" target="_blank" rel="noopener">статуса ми</a> бързо дадоха обяснение за случая. </p>
<p style="text-align:right;"><a href="http://yurukov.net/blog/wp-content/uploads/2013/05/tok3.png"  rel="lightbox[tok]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/05/tok3s-1.png" width="450" height="42"/></a><i>Потреблението и производството на ток в последните 17 дни</i></p>
<p>Важно уточнение е, че зад данните, които виждаме в ЕСО, има една много сложна енергийна система. Нямам илюзии, че я разбирам и затова съм предоставил отворени данни на всеки, който би желал да ги анализира. Те, както и графиките, могат да дадат насоки къде да търсим, а не директни изводи за проблеми и измами. Това важи за всички подобни данни. Аналогична е ситуацията с интерактивната графика за <a href="http://opendata.yurukov.net/vei/" target="_blank" rel="noopener">производството от възобновяеми източници</a>, която пуснах преди референдума преди няколко месеца. За нея писах <a href="http://yurukov.net/blog/2013/01/24/qdrena-vei-energiq/" target="_blank" rel="noopener">по-подробно в този блог</a>. </p>
<p>Надявам се, че ще помогнат на тези с познания в сферата да обяснят реалността с нагледни примери. Моята задача е да отварям данни и докато имам време и нерви ще го правя. Затова е важно и журналистите у нас да се запознаят с това как да работят с данни и колко важен източник на информация са те. Има вече такъв интерес в различни организации у нас и има достатъчно специалисти, които биха искали да се занимават с това. Повече за отворените данни може да прочетете в <a href="http://yurukov.net/blog/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8" target="_blank" rel="noopener">предишните ми статии</a> по темата, в <a href="https://okfn.org/" target="_blank" rel="noopener">блога на OKFN</a>, блога на Пейо и в страницата ми с <a href="http://opendata.yurukov.net/" target="_blank" rel="noopener">отворени данни</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/proizvodstvo-na-tok/feed/</wfw:commentRss>
			<slash:comments>8</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">13941</post-id>	</item>
		<item>
		<title>Прозрачност със ситен шрифт</title>
		<link>https://yurukov.net/blog/2013/prozrachno-sas-siten-shrift/</link>
					<comments>https://yurukov.net/blog/2013/prozrachno-sas-siten-shrift/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Thu, 11 Apr 2013 19:56:30 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[грао]]></category>
		<category><![CDATA[електронен подпис]]></category>
		<category><![CDATA[заявления]]></category>
		<category><![CDATA[избори]]></category>
		<category><![CDATA[мррв]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[прозрачност]]></category>
		<category><![CDATA[цик]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=13828</guid>

					<description><![CDATA[Freedom of information act &#8211; американският вариант на ЗДОИ Замислете се &#8211; колко пъти сте подписвали договор в банка, мобилен оператор или поредната гражданска кампания. Данните са ни навсякъде из фирми и НПО-та. Затова бях сред тези, който приветстват новината, че ще можем да проверяваме в ГРАО дали някой е злоупотребил с личните ни данни...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/04/freedom-informatio_2431517b.jpg" width="450" height="265" /><small>Freedom of information act &#8211; американският вариант на ЗДОИ</small></p>
<p>Замислете се &#8211; колко пъти сте подписвали договор в банка, мобилен оператор или поредната гражданска кампания. Данните са ни навсякъде из фирми и НПО-та. Затова бях сред тези, който приветстват новината, че ще можем да проверяваме в ГРАО дали някой е злоупотребил с личните ни данни що се отнася до изборните списъци. Убеден съм, че не може 1 милион души да са се подписали и исках тази порочна практика да се осветли. </p>
<p>Тази мярка на прозрачност би била прекрасен и ефективен пример за борба с корупцията и злоупотребите, ако обаче нямаше ситен шрифт. След наплива от мейли към ЦИК, МРРБ излезе с <a href="http://www.mrrb.government.bg/?controller=news&#038;id=4374" target="_blank">инструкции</a> как се подават такива заявления. Искат трите имена, ЕГН, номер на лична карта, адрес за кореспонденция и изрично се декларира от лицето съгласие за обработката на личните му данни. Може да се подават или с писмо до министерството, или по мейл, но <strong>само с електронен подпис</strong>. Замислете се, колко българи имат личен електронен подпис. Тази мярка е безсмислена предвид, че на сайта на ГРАО може само с ЕГН да проверим къде трябва да гласуваме, а на при НАП &#8211; колко дължим за здравни. Да не говорим, че мейлът посочен за подаване на заявления <strong>не работи</strong>. Малка подробност, но важна. </p>
<p>Въпросът е, защо са решили да направят така процедурата, че да е практически невъзможно да се използва. Вероятно нямат ресурс да отговорят на наплива от усъмнили се в честността на родните партии. Вероятно никой не се е сетил за по-удобен начин. Не мога отговорно да твърдя, че има зла умисъл в блокирането на иначе добра идея за прозрачност, но това определено е модел, който виждаме във всяка сфера на администрацията. Законът за личните данни се използва само тогава, когато не искат да ни дадат нещо. Типичен пример бяха бонусите на висшите чиновници. Преди време МВР твърдеше, че не могат да ми дадат удобен списък с имената на <em>обявените в бюлетина</em> им безследно изчезнали, защото това били лични данни.<br />
<span id="more-13828"></span></p>
<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/04/open-file-drawer-dreamstime_m_11507119_3.jpg" width="450" height="159" /></p>
<p>Вчера комисар Нели Круз приветства <a href="http://europa.eu/rapid/press-release_IP-13-316_en.htm" target="_blank">одобрението</a> на правилата за отворени данни в общността. Отбеляза как това ще донесе нови бизнес възможности и по-добра администрация. До няколко седмици очакваме евро-парламента да ги гласува. След това ще бъдат ратифицирани и въведени от всяка членка. Къде е България в това отношение? Много пъти в този блог, по различни конференции и интервюта съм хвалил определени аспекти от работата на кабинета и съм отбелязвал как да се оправят други. </p>
<p>Истината е, че прозрачността у нас е <a href="http://yurukov.net/blog/2013/03/12/matov-s-nadejdi-za-prozrachno/" target="_blank">матова, както писах преди</a>. Обявява се нещо интересно и полезно и се разхвърля из сложен бюрократичен лабиринт в неизползваем вид. Въпреки ЗДОИ, въпреки ратификацията на куп резолюции, въпреки политическите заявки за прозрачност и участието в Open Government Partnership бих казал направо, че <strong>в България достъпни данни от обществени институции няма</strong>. Нито един масив от данни, нито един файл, който мога да нарека отворен. Каквито и положителни примери да има, то те са &#8222;освободени&#8220; и изчистени от opendata ентусиасти. Това е. </p>
<p>Пиша всичко това, защото казусът с партийните подписки е емблематичен за начина на мислене в администрацията що се отнася до прозрачността. Преди малко повече от година имах разговор в Министерски Съвет и посочих, че най-важно ще е чиновниците взимащи ежедневни решения като горното да разберат за какъв хал се прави всичко това. Същото написах през 2010-та на тогавашния шеф на дирекция електронно управление Валери Борисов. Виждаме ефекта от липсата на мерки. </p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/prozrachno-sas-siten-shrift/feed/</wfw:commentRss>
			<slash:comments>4</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">13828</post-id>	</item>
		<item>
		<title>Два разговора защо оригиналните данни са важни</title>
		<link>https://yurukov.net/blog/2013/originalni-danni/</link>
					<comments>https://yurukov.net/blog/2013/originalni-danni/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Mon, 08 Apr 2013 11:19:44 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[betahous]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[пеио попов]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=13807</guid>

					<description><![CDATA[Одобрени бюджети по европроекти спрямо населението по общини. Карта и графики. Говорил съм много защо отворените данни са важни и то в оригиналния си суров вид. Искам да отбележа два разговора, които илюстрират на разбираем език защо това е така. Първият е една стара лекция от TED Talks, на която попаднах наскоро. Говори се за...]]></description>
										<content:encoded><![CDATA[<p style="text-align:right;"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/04/opendata.jpg" width="450" height="276" /><em>Одобрени бюджети по европроекти спрямо населението по общини. <a href="http://opendata.yurukov.net/eu/a.html" target="_blank" rel="noopener noreferrer">Карта</a> и <a href="http://opendata.yurukov.net/eu/" target="_blank" rel="noopener noreferrer">графики</a>.</em></p>
<p>Говорил съм много защо отворените данни са важни и то в оригиналния си суров вид. Искам да отбележа два разговора, които илюстрират на разбираем език защо това е така.</p>
<p>Първият е една стара лекция от TED Talks, на която попаднах наскоро. Говори се за &#8222;математиката на войната&#8220;. Накратко &#8211; анализирали са данни за броя атаки, мястото и жервите на всяка тях по времето на различни конфликти в последните години. В лекцията се разглежда Афганистан, Иран и Сиера Леон. Данните, за жалост, не са взети от военните, а са събрани от съобщения в медиите. Аз правя нещо подобно за <a href="http://lipsva.com/" target="_blank" rel="noopener noreferrer">Lipsva.com</a>. </p>
<p>Това, което са открили, са интересни математически зависимости в хода на войната. Станало е ясно, че само с броя атаки и разпределението на загиналите могат да научат доста за фрагментацията и целенасочеността на месните военни групировки и ефективността на кампаниите на ООН и американците през времето. Това са неподозирани ползи от иначе прост масив от данни.<span id="more-13807"></span></p>
<p style="text-align:right;"><iframe loading="lazy" width="450" height="253" src="http://www.youtube.com/embed/emn28FrJ6CI" frameborder="0" allowfullscreen></iframe><small>Виж в <a href="http://www.youtube.com/watch?feature=player_embedded&#038;v=emn28FrJ6CI" target="_blank" rel="noopener noreferrer">YouTube</a>.</small></p>
<p>Представете си сега, че приложим на подобен анализ данните за престъпленията, катастрофите или размера на администрацията. За катастрофите в София вече съм направил <a href="http://opendata.yurukov.net/kat/" target="_blank" rel="noopener noreferrer">проект</a>, който до сега е събрал значителна база данни. Ще се опитам скоро да разширя графиките и да направя изводи от тях. За администрацията &#8211; снощи пуснах заявление за достъп до информация, за да получа точно онези оригинални данни, за важността на които говоря горе. Има ги, публични са и смисълът на закона диктува, че трябва да имаме достъп до тях.</p>
<p>Други примери в тази насока ще видите и в този семинар за отворени данни в Betahaus, в които участва Пейо, Иван Бедров, Нели Огнянова и Антоанета Цонева.</p>
<p style="text-align:right;"><small>Виж в <a href="http://www.youtube.com/watch?feature=player_embedded&#038;list=PLPo5tOaFvwFTWQSkhFZA80LZStU5RRYjg&#038;v=W5WPEQrqWVA" target="_blank" rel="noopener noreferrer">YouTube</a>.</small></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/originalni-danni/feed/</wfw:commentRss>
			<slash:comments>10</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">13807</post-id>	</item>
		<item>
		<title>Възпоменание в Twitter на загиналите през Балканските войни</title>
		<link>https://yurukov.net/blog/2013/twitter-vazpomenanie/</link>
					<comments>https://yurukov.net/blog/2013/twitter-vazpomenanie/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Thu, 14 Mar 2013 16:28:36 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[1913]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[twitter]]></category>
		<category><![CDATA[архиви]]></category>
		<category><![CDATA[балкански войни]]></category>
		<category><![CDATA[българия]]></category>
		<category><![CDATA[войници]]></category>
		<category><![CDATA[данни]]></category>
		<category><![CDATA[загинали]]></category>
		<category><![CDATA[отворени данни]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=13687</guid>

					<description><![CDATA[Снимка: LostBulgaria.com През октомври миналата година пуснах свободно данните за загиналите в Балканските войни. Идеята ми беше да поставя на картата на полуострова родните и лобните места на 47657 български войни загубили живота си през 1912-1913 година. Така ще проследим пътя им до смъртта, движението на ротите, къде има най-големи загуби, от къде са войниците...]]></description>
										<content:encoded><![CDATA[<p style="text-align:right;"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/03/image-6826-0-0-sto-godini-ot-pobednata-balkanska-voina.jpg" width="450" height="271"/><small>Снимка: LostBulgaria.com</small></p>
<p>През октомври миналата година <a href="http://opendata.yurukov.net/balkanwars/" target="_blank" rel="noopener noreferrer">пуснах свободно данните</a> за загиналите в Балканските войни. Идеята ми беше да поставя на картата на полуострова родните и лобните места на 47657 български войни загубили живота си през 1912-1913 година. Така ще проследим пътя им до смъртта, движението на ротите, къде има най-големи загуби, от къде са войниците в определена рота, къде са родени жертвите от дадена битка. Бихме могли да проследим всичко с удобен интерактивен инструмент. Не ми остана време обаче да събера географските координати на всички 8000 места. Около 3000 от тях са вписани със старите си имена или не се намират.</p>
<p>Вчера обаче ме осени още една идея. Един познат отбеляза със статус във Facebook 100 години превземането на Одрин на 13 март 1913 (26 март по стар стил). На този ден са загинали 940 души. На предишния ден &#8211; 1028. Това е просто статистика, но някак ме накара да се замисля за измеренията на жертвата, която е дал народа ни преди толкова време. </p>
<p>Затова днес написах един кратък скрипт. Всеки ден в 15:00 ще пуска съобщение в Twitter с броя загинали на тази дата преди 100 години. Всички tweet-ове ще са с таг  <strong><a href="https://twitter.com/search/realtime?q=%23%D0%91%D0%B0%D0%BB%D0%BA%D0%B0%D0%BD%D1%81%D0%BA%D0%B8%D1%82%D0%B5%D0%92%D0%BE%D0%B9%D0%BD%D0%B8&#038;src=hash" target="_blank" rel="noopener noreferrer">#БалканскитеВойни</a></strong>. В някои дни връзката в tweet-а ще сочи към страницата на <a href="http://wars.archives.bg/bv" target="_blank" rel="noopener noreferrer">Държавна агенция &#8222;Архиви&#8220;</a>, от където взех данните, а в други &#8211; към отворените данни на моя сайт. Географските координати на тези tweet-ове ще водят към Националния военноисторически музей в София.<br />
<span id="more-13687"></span></p>
<p style="text-align:right; padding:15px 0;"><a href="http://yurukov.net/blog/wp-content/uploads/2013/03/ZPd1-1.png" rel="lightbox[balkanwars]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/03/ZPd11-1.png" width="220" height="147" style="margin-right:5px; border:1px solid gray;"/></a><a href="http://yurukov.net/blog/wp-content/uploads/2013/03/ZPdf-1.png" rel="lightbox[balkanwars]"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/03/ZPdf1-1.png" width="220" height="147" style="border:1px solid gray;"/></a><small>Натиснете снимките за по-голяма графика</small></p>
<p>Макар интерактивния инструмент споменат горе да не е готов, извадих две предварителни графики от данните. Натиснете снимките горе, за да ги видите в по-голям размер. Тази вляво ще ви покаже и колко ще са жертвите споменати в бъдещите tweet-ове. В този панел може да следите съобщенията:</p>
<p style="padding:20px 0;"><a class="twitter-timeline" href="https://twitter.com/search?q=%23%D0%91%D0%B0%D0%BB%D0%BA%D0%B0%D0%BD%D1%81%D0%BA%D0%B8%D1%82%D0%B5%D0%92%D0%BE%D0%B9%D0%BD%D0%B8" data-widget-id="312221454689239041">Tweets за &#8222;#БалканскитеВойни&#8220;</a> <script>!function(d,s,id){var js,fjs=d.getElementsByTagName(s)[0];if(!d.getElementById(id)){js=d.createElement(s);js.id=id;js.src="//platform.twitter.com/widgets.js";fjs.parentNode.insertBefore(js,fjs);}}(document,"script","twitter-wjs");</script></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/twitter-vazpomenanie/feed/</wfw:commentRss>
			<slash:comments>12</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">13687</post-id>	</item>
		<item>
		<title>Питай, за да ти се каже</title>
		<link>https://yurukov.net/blog/2013/pitai/</link>
					<comments>https://yurukov.net/blog/2013/pitai/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Wed, 13 Mar 2013 06:20:20 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Политика]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[egov]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[българия]]></category>
		<category><![CDATA[данни]]></category>
		<category><![CDATA[достъп до информация]]></category>
		<category><![CDATA[отворени]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[парвителство]]></category>
		<category><![CDATA[прозрачност]]></category>
		<category><![CDATA[служебен кабинет]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=13654</guid>

					<description><![CDATA[В последния си доклад Програма Достъп до Информация посочва, че почти 70% от заявленията за данни са удовлетворени от институциите. Това не е чак толкова ниско, но аз съм на мнение, че този механизъм на публичност се използва твърде малко. Причините са две. Първо, хората си мислят, че няма смисъл да питат и за жалост...]]></description>
										<content:encoded><![CDATA[<p><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/03/freedomofinformation1-1.jpg" /></p>
<p>В последния си <a href="http://www.aip-bg.org/surveys/db/2013ii/stats.php" target="_blank">доклад</a> Програма Достъп до Информация посочва, че почти 70% от заявленията за данни са удовлетворени от институциите. Това не е чак толкова ниско, но аз съм на мнение, че този механизъм на публичност се използва твърде малко. Причините са две. Първо, хората си мислят, че няма смисъл да питат и за жалост твърде често са прави. И в местната, и в държавната администрация винаги е имало хора, които не искат да излязат на светло. Второ, за да получим какъвто и да е отговор, трябва да задаваме тясно специализирани въпроси. Така много ценна информация остава скрита.</p>
<p>От утре друг е на кормилото. Както писах в последната си статия, прозрачността <a href="http://yurukov.net/blog/2013/03/12/matov-s-nadejdi-za-prozrachno/">беше посочена като основна цел</a> на служебния кабинет и има индикации, че наистина ще се постараят. Чиновниците надолу по веригата са си същите, но министрите отгоре може да натискат да се отговаря на заявления. Надеждите на всички са, че служебните министри са независими от партии и политика. Може да го проверим.<br />
<span id="more-13654"></span><br />
Нека обаче не задаваме конкретни и тясно специализирани въпроси. Да не питаме и глупости като <em>&#8222;Кои са престъпниците в България?&#8220;</em>. Никой не може да отговори на това. Не трябва да забравяме и че има доста информация, която представлява лични данни или оперативни документи. Нека не искаме прости отговори, а цели бази данни или подробни справки. При това в лесен за обработка и достъпен вид. Така ще можем сами да ги анализираме. Има куп публични регистри, които са почти неизвестни, защото сайтовете им са неизползваеми. </p>
<p>Затова ви питам:</p>
<p style="padding:0px 23px"><strong>Какво искате да знаете?<br />
Какви графики и карти искате да видите?<br />
Как да комбинираме регистрите на министерства?</strong></p>
<p>Информацията сама по себе си е трудна за преглеждане, ако не я визуализираме. Затова можем да направим интерактивни инструменти като тези, за които писах тук и в twitter:</p>
<li><a href="http://opendata.yurukov.net/vei/" target="_blank">ВЕИ централите и продаденият ток от тях</a></li>
<li><a href="http://opendata.yurukov.net/eu/" target="_blank">Еврофондовете</a></li>
<li><a href="http://opendata.yurukov.net/business" target="_blank">Фирмите регистрирани за ДДС</a></li>
<li><a href="http://opendata.yurukov.net/energy/" target="_blank">Използвания и изнесен ток  в България</a></li>
<li><a href="http://opendata.yurukov.net/birth" target="_blank">Регистъра за ражданията</a></li>
<li><a href="http://opendata.yurukov.net/kat" target="_blank">Катастрофите в София</a></li>
<p>Ако имате такава идея за нещо интересно и полезно, моля пишете в коментарите. Ще ги обсъдим, ще изпратим заявления, а получените данни ще бъдат отворени. Знам, че всичко това може да ви се струва твърде оптимистично, ако нищо не пречи да опитаме и сега точно е моментът.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/pitai/feed/</wfw:commentRss>
			<slash:comments>22</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">13654</post-id>	</item>
		<item>
		<title>Инфографика: Арести на българи в Лондон</title>
		<link>https://yurukov.net/blog/2013/aresti-angliq/</link>
					<comments>https://yurukov.net/blog/2013/aresti-angliq/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Fri, 01 Mar 2013 16:39:39 +0000</pubDate>
				<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[арести]]></category>
		<category><![CDATA[българи]]></category>
		<category><![CDATA[данни]]></category>
		<category><![CDATA[емиграция]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[инфографика]]></category>
		<category><![CDATA[лондон]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[полиция]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=13604</guid>

					<description><![CDATA[Наскоро открих един много удобен инструмент за правене на инфографики &#8211; Infogr.am. Не е толкова мощен, колкото ми се иска, но за по-прости неща става. За останалото използвам библиотеките Crossfilter.js и Leaflet, както ще видите на страницата ми за отворени данни. Интересното е, че при Infogr.am графиките са интерактивни до някаква степен, което позволява показването...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/03/infographic1-1.png" width="450" height="450" /></p>
<p>Наскоро открих един много удобен инструмент за правене на инфографики &#8211; <a href="http://infogr.am/" target="_blank">Infogr.am</a>. Не е толкова мощен, колкото ми се иска, но за по-прости неща става. За останалото използвам библиотеките Crossfilter.js и Leaflet, както ще видите на <a href="http://opendata.yurukov.net/" target="_blank">страницата ми за отворени данни</a>. Интересното е, че при Infogr.am графиките са интерактивни до някаква степен, което позволява показването на значителни масиви от данни.</p>
<p>Първата графика, която публикувах, показва данни за <a href="http://infogr.am/BGarestiUK-054680" target="_blank">арестите на българи в Лондон</a>. Информацията идва от доклад на полицията там предоставен след искане за достъп до информация от <a href="http://fullfact.org/factchecks/romanian_criminals_UK_Britain-28799" target="_blank">Fullfact.org</a>. Данните показват броя арести, а не този на арестуваните хора или престъпленията. Това е важно уточнение, защото напълно възможно е малка група от хора да са арестувани по много пъти, a i доста престъпления да остават неразкрити. Не се уточнява какво попада в &#8222;други нарушения&#8220; &#8211; възможно да включват и преспиване в парка.<br />
<span id="more-13604"></span><br />
Интересно ще бъде да се направи карта с честотата арести по държави и отнесено към броят емигранти. Предупредиха ме обаче, че този доклад има специален лиценз, който забранява използването на данните като масив. Това е доста странно, тъй като на практика затваря информацията. </p>
<p>Тук ще видите инфографиката, която все пак подготвих с малка част от доклада. Може да погледнете <a href="http://infogr.am/BGarestiUK-054680" target="_blank">интерактивната версия тук</a>.</p>
<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/03/infographic2-1.png" width="450" height="1409" /></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/aresti-angliq/feed/</wfw:commentRss>
			<slash:comments>2</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">13604</post-id>	</item>
		<item>
		<title>Ядрената и възобновяемата енергия в цифри</title>
		<link>https://yurukov.net/blog/2013/qdrena-vei-energiq/</link>
					<comments>https://yurukov.net/blog/2013/qdrena-vei-energiq/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Thu, 24 Jan 2013 15:42:48 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Политика]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[аец]]></category>
		<category><![CDATA[белене]]></category>
		<category><![CDATA[веи]]></category>
		<category><![CDATA[козлодуй]]></category>
		<category><![CDATA[референдум]]></category>
		<category><![CDATA[ток]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=13106</guid>

					<description><![CDATA[Въпросът дали да се строи АЕЦ Белене е наистина изключително сложен. Има икономически, финансови, екологически, технологични и геополитически аспекти. Аз също съм на мнение, че с така зададения на референдума въпрос, вотът в неделя е на практика безсмислен. Но тъй като така или иначе ще гласуваме, нека поне общите въпроси да бъдат ясни. Затова направих...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/01/smiley-nuclear.jpg" width="450" height="343" /></p>
<p>Въпросът дали да се строи АЕЦ Белене е наистина изключително сложен. Има икономически, финансови, екологически, технологични и геополитически аспекти. Аз също съм на мнение, че с така зададения на референдума въпрос, вотът в неделя е на практика безсмислен. Но тъй като така или иначе ще гласуваме, нека поне общите въпроси да бъдат ясни. <a href="http://yurukov.net/blog/2013/01/09/test_referendu/" target="_blank" rel="noopener noreferrer">Затова направих и въпросник</a>, който на изясни как ще повлияе гласът ДА и НЕ в неделя. Разбира се, той не покрива всички аспекти, а само общи заблуди &#8211; че гласуваме за затварянето на Козлодуй, че с бойкот ще се спре референдума и прочие.</p>
<p>До този момент 1264 души са попълнили въпросника. 57% искат да използваме Козлодуй, но да инвестираме основно във възобновяеми източници. 9% искат да спрем реакторите веднага, а 26% да строим още такива. 37% смятат, че решението за Белене е експертно. 38% са твърдо против. 81% заявяват, че ще формират мнението си сами, а не според политическите си пристрастия. На базата на отговорите, 68% ще гласуват <em>против</em> изграждането на нова централа, 29% &#8211; с <em>ДА</em>, а 3% все още не са решили.</p>
<p><a href="http://opendata.yurukov.net/vei/" target="_blank" rel="noopener noreferrer"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/01/vei_data-1.png" width="160" height="182" style="float:right; margin:4px 0 4px 10px;" /></a> Паралелно с това, искам да стане ясно в цифри колко ток реално произвеждат Козлодуй и ВЕИ-тата. Затова наскоро пуснах <a href="http://opendata.yurukov.net/vei/" target="_blank" rel="noopener noreferrer">интерактивна графика показваща данни за енергията от възобновяеми източници</a> в България. Данните са от 2012 и липсва малка част от информацията за ноември и декември. На графиката може да избирате типове ВЕИ-та, година на създаване, мощност, период, в който е продаван ток, разпределително дружество, което е изкупувало тока и отделна централа.<br />
<span id="more-13106"></span></p>
<div style="margin:20px 8px; padding:10px 16px; border:1px dashed gray;">
<strong>Накратко за ВЕИ централите:</strong></p>
<li>Само през 2012-та са инсталирани почти толкова мощности, колкото 5-ти блок на Козлодуй и то само с частни инвестиции</li>
<li>Ефективността им е 4-4.5 пъти по-малка АЕЦ-а</li>
<li>Инвестициите за MW са 2 до 4 пъти по-ниски</li>
<li>Цената на MW се понижава, а ефективността се покачва всяка година</li>
<li>До 5 години може да имаме същата ефективна мощност като АЕЦ Белене, но във ВЕИ-та при близка цена</li>
</div>
<p>С тези данни може да видим няколко интересни тенденции. Само през 2012-та са били създадени и включени в мрежата <em>900MW</em> ВЕИ-та. Повечето са били соларни, следвани от вятърни и микровецове. За сравнение, всеки от блоковете на Козлодуй и планираните блокове на Белене е по <em>1000MW</em>. Важното тук обаче е ефективността. Данните сочат, че ВЕИ-та у нас са работили със средно около <em>20%</em> ефективност през миналата година. Това е произведеният ток спрямо теоретичния максимум <em>(мощност * 24 часа * 365 дни)</em>. Разпределението по видове е както следва: микро ВЕЦ-ове &#8211; 35%, ВЕЦ-ове 27%, ветрени &#8211; 15%, соларни 17%. И тук обаче не всички са равни &#8211; соларните паркове над 5MW имат ефективност над <em>23%</em>. Същото важи и за ветрените паркове &#8211; над 2MW скача на <em>21%</em>. Забелязва се и по-висока ефективност при по-новите мощности спрямо тези построени преди няколко години. </p>
<p>За да имат смисъл тези показатели, трябва да ги сравним с ефективността на АЕЦ-а. Козлодуй има два блока по <em>1000MW</em> и за 2012-та те са работили средно с малко над <em>90%</em> ефективност. Това означава, че за всеки MW инсталирана мощност, ВЕИ-тата са произвеждали 4-4.5 пъти по-малко енергия. Това е полезна информация, защото научаваме, че ни трябват <em>8-9000MW</em>, за да заместим АЕЦ Белене. Тази цифра въобще не е невероятна &#8211; само за последните 3 години са построени 2000MW и то изцяло с частни средства. Тенденцията е към ускоряване на инвестициите в тази сфера, което значи, че до 5 години може да имаме същата ефективна мощност във ВЕИ, както планираната за Белене. Напомням, че строежът на една ядрена централа отнема около 10-15 години.</p>
<p>Цената, разбира се, също е важна. Колко ще струва новият АЕЦ е доста спорна тема. Чухме оценки за 4, 6.5, 10 и дори 22 милиарда. Ако сравним с други реактори от този тип, първоначалната инвестиция излиза грубо около 3000 хиляди евро на kW мощност. Аналогично, цената на kW при фотоволтиците и ветрените генератори е в доста широк спектър. От това, което намерих, сега е около 1500-2000 евро на kW за соларните и 1000-1500 &#8211; за ветрените. Разбира се, разходите падат рязко при по-големите ВЕИ централи. Също така, в последните години с подобряването на технологията, увеличаване на търсенето и конкуренцията, цената и на последните две пада сериозно. </p>
<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2013/01/energy-efficiency_background.jpg"  width="450" height="259" /></p>
<p>От всичко това може да си направим извода, че в най-лошия случай ни трябва двойно повече първоначална инвестиция във ВЕИ-та, за да получим същата енергия, както от един нов АЕЦ. Ако обаче сметнем неизменното оскъпяване на големи продължителни проекти като Белене и падащата цена на ВЕИ техниката, тази разлика може да се стопи до 50%. Важното в случая обаче е друго &#8211; дори да приемем, че и двете имат аналогични разходи за поддръжка, при АЕЦ-а се плаща много за гориво и безопасното му съхранение след обработка. Освен допълнителните разходи, то създава екологични проблеми и икономическа зависимост от други страни. ВЕИ-тата по този показател печелят убедително, защото нямат разходи за гориво и са напълно независими от международната обстановка.</p>
<p>Важно е също така, че ВЕИ мощностите се строят изключително бързо и не са концентрирани в един регион. Това означава, както по-голяма сигурност за енергийната мрежа при бедствия и атаки, така и много по-голяма гъвкавост при промяна на пазара. Виждаме, че с частни инвестиции могат да се изгради добър заместител на централа като Белене. С покачването на потреблението и търсенето на ток от други страни, самият пазар ще предразположи да се инвестира във ВЕИ мощности. Така няма да си задаваме въпроса дали след 30 години Белене ще е рентабилен.</p>
<p>Отдавна знам, че токът от Белене ще е единствено за износ тъй като имаме достатъчно мощности за потреблението в страната. Преди да видя ВЕИ данните обаче бях много скептичен към алтернативите. Сега вече смятам, че с комбинация на ВЕИ и съществуващите блокове на АЕЦ-а, ще си осигурим не само стабилно производство, но и изгоден ток за износ. </p>
<p>Като допълнително четиво ви препоръчвам статиите на <a href="http://www.capital.bg/politika_i_ikonomika/bulgaria/2013/01/16/1985486_izbrani_luji_ot_teatura_nova_iadrena_elektrocentrala/" target="_blank" rel="noopener noreferrer">Капитал</a> и <a href="http://www.dariknews.bg/view_article.php?article_id=1028568" target="_blank" rel="noopener noreferrer">Дарик</a>. Ако забележите нарушения до и по време на референдума, не забравяйте да подавате сигнали на Fairelection.eu.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2013/qdrena-vei-energiq/feed/</wfw:commentRss>
			<slash:comments>37</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">13106</post-id>	</item>
		<item>
		<title>Интервю с PiaNews за отворените данни и директивата на Еврокомисията</title>
		<link>https://yurukov.net/blog/2012/interview_pia/</link>
					<comments>https://yurukov.net/blog/2012/interview_pia/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Sat, 03 Nov 2012 15:50:34 +0000</pubDate>
				<category><![CDATA[Аз и Боян]]></category>
		<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[pianews]]></category>
		<category><![CDATA[pressclub]]></category>
		<category><![CDATA[интервю]]></category>
		<category><![CDATA[информация]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[прозтачност]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=12620</guid>

					<description><![CDATA[Това интервю беше публикувано днес в PiaNews под заглавието &#8222;Интервю с Боян #Юруков за силата на Отворените данни&#8220;. На сайта може да намерите и съкратена версия. В този блог ще намерите повече статии по темата, а тук може да разгледате и свалите различни данни. Да започнем с понятията. Бихте ли обяснили накратко какво представляват Отворените...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/11/Boyan-Yurukov-FB-2.jpg" width="450" height="281" /></p>
<p><i>Това интервю беше публикувано днес в PiaNews под заглавието &#8222;Интервю с Боян #Юруков за силата на Отворените данни&#8220;. На сайта може да намерите и съкратена версия. В този блог ще намерите <a href="http://yurukov.net/blog/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8" target="_blank">повече статии</a> по темата, а тук може да разгледате и <a href="http://opendata.yurukov.net/" target="_blank">свалите различни данни</a>.</i></p>
<hr>
<li><strong>Да започнем с понятията. Бихте ли обяснили накратко какво представляват Отворените данни?</strong></li>
<p>Има много начини да бъде представена една информация – като обширни доклади цитиращи цифри, като електронни таблици, като графики или вече сдъвкани изводи. Когато говорим за публично достъпна информация, не става дума за формата. Той обаче е от критично значение, за да може тази публичност да има реален ефект. Ако поискате от парламента информация за всички изказвания на депутати в последната година, той може да ви ги предостави като хиляди разпечатки. Това не е въобще полезно, защото ще трябва със седмици да търсите нужните ви цитати и статистика. Сега може да намерим тези изказвания в електронен формат в мрежата, но ситуацията не е много по-добра. Причината е, че те не са в структуриран вид. Това означава, че не може да търсите отделни изказвания, да ги свързвате със обсъжданите теми и депутата. Отново ще се наложи да изчетете всички документи ред по ред, за да откриете кой и за какво говори.<br />
<span id="more-12620"></span><br />
Структурираният вид, за който говоря, стои в основата на принципа за повторно използване на данните. Това означава, че форматът, в който се подава дадена информация е такъв, че да може да се обработва автоматично извън контекста на сайта публикувал информацията. С други думи – изказванията на депутатите да са в табличен вид с име, времетраене, процедура, обсъждан закон и прочие. Това различава публичната информация от отворените данни. Примери за неотворени данни са търговския регистър, административния регистър, порталът на държавните поръчки и много други.</p>
<p>Колкото повече публична информация получаваме, толкова по-важно е тя да може да се използва повторно, да е отворена и в структуриран вид. Сега сме залети с милиони PDF, Excel или текстови документи без контекст или възможност да автоматична обработка. Това реално е псевдо-публичност, защото информацията не се предава в пълния си вид и не ни позволява да си правим изводи от данните. Създава се просто шум, от който можем да видим отделни щрихи, а не цялата картина.</p>
<li><strong>За обществото каква е ползата от отворените данни?</strong></li>
<p>Отворените данни показват различни аспекти от света ни – таблица с престъпленията по категории и време в даден регион, нарушенията засечени от ХЕИ, собствеността и историята на фирмите, държавни поръчки и еврофондове. Всеки от тези елементи ни позволява да видим същността на даден проблем или ефикасността на решение – например какво отражение върху престъпността в един квартал има увеличаването на полицейското присъствие. Истинската сила на отворените данни обаче е в комбинирането и визуализирането им. Фактът, че са в структуриран и лесен за обработка формат предразполага да ги използваме по неподозирани начини. Например, може да вземем данните за активността и сътрудниците на депутатите ни, да ги свържем автоматично с фирми от търговския регистър, да свържем собствеността на последните с други фирми и всички тях да сравним със спечелени обществени поръчки. Това на теория и сега е възможно, но една справка ще отнеме седмици работа на цял екип. В същото време ако имахме отворени данни от ТР и обществените поръчки, всичко ще отнема минути.</p>
<p>Така ще откриваме не само неефективност и корупция в администрацията, но и ще виждаме положителните практики. В много случаи добрите решения и работа остават скрити между цифрите и не остават забелязани. Виждаме само скандалите, корупцията и наглостта. С добра визуализация можем да виждаме добри тенденции и да проверяваме изказванията и нападките на политици, НПО-та и бизнесмени.</p>
<p>Ползите от отворените данни не са само в публичната сфера. Комисар Круз нарече отворените данни “петролът на 21 век”. Информацията в наши дни наистина е безценна и бизнесът може да печели най-много от нея. Отворените данни на публичните институции означават лесен, евтин и бърз достъп до информация, стандартизация на данните и документацията и предвидимост на отчетите на институциите. Анализ на данните могат да помогнат на бизнеса да открие ниши в производството и услугите, които други са пропуснали. Самият анализ и визуализация всъщност е една голяма ниша, защото е сложна тема с бързо растящ пазар в световен мащаб. Това само по себе си ще донесе множество високотехнологични работни места.</p>
<li><strong>Мислите ли, че има голямо неразбиране за силата на Отворените данни в България?</strong></li>
<p>Мисля си, че по-скоро има непознаване и цинизъм към тази концепция. Повечето чиновници, журналисти и дори активни граждани не познават възможностите на отворените данни и дори, че вече има такива. Доста от тези, които знаят за тях, не вярват, че можем въобще да получим такива. Вярвам, че с положителни примери за ползите им можем да информираме и да обърнем повече хора във вярващи. Наистина и сега имаме проблем с достъпа до каквато и да е информация, но това нито е нещо специфично за нашата държава, нито е причина да отхвърлим идеята за пълната прозрачност. Влагайки изисквания в закона за отворени данни, ние ще въведем изискване всичко да се публикува редовно, коректно и в структуриран разбираем вид.</p>
<p>От друга страна, разбира се, най-вероятно има и такива, които не искат такива данни да бъдат предоставяни. Такъв според мен е случая с Търговския регистър, където информацията е твърде опасна за някои и твърде ценна за други. Затова достъпа до нея е максимално затруднен. В повечето случаи обаче не можем да говорим за някаква конспирация, а по-скоро за некадърно написани изисквания и още по-лошо изпълнение на информационните системи. Без конкретни дефиниции как трябва да се предоставя публичната информация, всеки чиновник или администратор в институциите взима това решение. Това обаче не е устойчиво, защото дори форматът да е добър и сайтът разбираем, при смяна на кадрите спира и поддръжката за тези данни. Такива примери можем да намерим във всяка институция и показват още по-ясно, че трябва да има ясна концепция за това какви данни, в какъв формат да се публикуват и кой да отговаря за качеството им.</p>
<li><strong>Вие сте един от пионерите и голям радетел на отварянето на данните в България. От къде срещате най-сериозната съпротива и неразбиране – институциите, журналистите, хората?</strong></li>
<p>В България има много хора, които работят по темата за прозрачността, а тя има много аспекти. Аз се фокусирам конкретно върху отворените данни и целта ми е повече хора да разберат защо са полезни. Съпротива не бих казал, че срещам. Дори има ентусиазъм. Проблемът е, че този ентусиазъм остава само на хартия без реални резултати. Най-често отворените данни остават в сферата на “нещата, които би било хубаво някой ден да въведем”. Писал съм на почти всички медии с идеи как могат да използват отворени данни. Почти никой не ми е отговорил. Вестници като The Guardian и Economist инвестират в специалисти и визуализация на данни, за да покажат на читателите си една различна гледна точка неподвластна от политическо говорене и спекулации. У нас за жалост никой от големите медии не е толкова смел и прозорлив, за да го направи.</p>
<li><strong>Как си обяснявате тази съпротива?</strong></li>
<p>Отчасти може да се каже, че медиите ни се движат по линията на най-малкото съпротивление. Разследващата ни журналистика, доколкото я има, гони само темите гравитиращи около последните скандали. Останалите новини са препечатани изказвания на политици и други медии. В този начин на работа и мислене не се вписва нещо толкова иновативно като отворените данни. Техническата грамотност също е голям проблем. Журналистите разбираемо не могат сами да направят интерактивни графики и сложни анализи над големи масиви от данни. Трябва обаче да имат разбиране и да могат да разчитат таблици и графики. Трябва да знаят какво е технически възможно, къде да го намерят и до кого да се допитат. Това е разследващата журналистика на 21 век.</p>
<li><strong>Миналата година България се присъедини към глобалната инициатива Open Government. Вие сякаш бяхте единственият представител на гражданското общество, който изпрати голям набор от препоръки към работната програма на правителството. До къде стигна правителството с отварянето на данните и съобразиха ли се с Вашите препоръки и аргументи?</strong></li>
<p>Не знам дали съм единствения, защото не видях останалите аргументи. Знам, че е имало консултации с доста НПО-та и компании. В крайния план за действие обаче забелязах доста от препоръките ми. Изпратих и подробни ръководства как да се идентифицират данни подходящи за отваряне и изисквания за форматите. Наскоро изпратих и предложение за формат на данните за бюджетните плащания, защото в момента документите на министерствата са по-шарени от карнавал, което практически обезсмисля идеята. Надявам се предложенията ми или поне принципите в тях да залегнат в нормативните изисквания. Като цяло около този план не се шуми много. Освен плащанията не съм чул за развитие по другите 32 теми. Има нужда от промени в няколко закона – включително в Закона за достъп до информация. Трябваше да излезе подробна версия на плана с указания, стъпки и прочие, но се забави. Скоро ще трябва да отчитаме свършеното пред партньорите в OGP и не знам какво ще им кажем.</p>
<li><strong>Миналата седмица участвахте в конференция в Европейският парламент, организирана от българския евродепутат Ивайло Калфин по повод резолюцията на ЕК за публичен достъп и повторна употреба на данните. Какви са резултатите от конференцията и какъв ефект очаквате да има в България?</strong></li>
<p>Конференцията имаше за цел да представи резолюция предложена от Европейската Комисия. Тя поставя изисквания към страните членки да предоставят данните във формат позволяващ повторна употреба. На панела предоставихме както анализи на ефективността на данните върху бизнеса и икономиката, така и практически примери за конкретни проекти. Забелязах, че присъстващите, сред които имаше и хора от Комисията, бяха доста заинтригувани. В България конференцията нямаше голям отзвук и го отдавам на това, че темата не е във фокуса на камерите.</p>
<li><strong>Как оценявате факта, че в света набира скорост един качествено нов тип журналистика – тази на данните?</strong></li>
<p>DDJ или журналистика водена от данните е нова сфера, която става популярна в цял свят. Отворените данни обещават неизчерпаем източник за пикантни истории и сериозни анализи от всеки аспект на обществото. Визуализациите помагат на медиите да се включат в интерактивността на мрежата и дори да черпят знания от читателите си – т.н. crowdsourcing. Данните обаче са просто суровина и журналистите са тези, които ги интерпретират. При недобросъвестен прочит всяка информация може да бъде обърната с краката нагоре. Отворените данни ни помагат да проверяваме истинността на твърденията в медиите, но това не винаги е възможно или лесно.</p>
<li><strong>Какви са рисковете от “неправилното” отваряне на данните и “неправилната” им употреба? Конкретен пример – бюджетните плащания (ежестевните справки за разходите, които Министерство на финансите започна да публикува от лятото на 2012 г.)</strong></li>
<p>Има два проблема с отварянето на данни. Първият е както споменах по-горе с формата, който е решаващ за това дали данните ще са въобще използваеми. Вторият проблем е рискът да се предостави секретна или лична информация. Това е аргумент, който много хора използват срещу отворените данни и е в центъра на дебата. Истината обаче е, че отворените данни всъщност подобряват сигурността на информацията в дългосрочен план.</p>
<p>Причината за това е, че се създава ясно разграничение кои данни са публични и кои не. Процесът на публикуване се автоматизира и заедно с него – изчистването на личната информация. Сега ужасно много лична и секретна информация е достъпна – било то заради изоставени папки из офисите или забравени документи в мрежата. Това не е толкова голям проблем заради трудния им анализ и използване. Трудният достъп обаче не е решение, защото не спира всеки. Отварянето на данните не означава, че ще пуснем всичко, а само това, което разпознаем като полезно за обществото. Така, например, можем да получим справка от НАП за всички плащания на касови апарати за страната. За да се запази фирмената тайна, данните могат да бъдат усреднени по общини и седмици. Така хем ще имаме безценен източник на данни за икономическата активност по сфери и региони, хем информацията ще е защитена.</p>
<li><strong>Това правилно разбиране за принципите на отворените данни ли е или по-скоро умишлено, според Вас? (за плащанията по СЕБРА, публикувани от МФ)</strong></li>
<p>Причината е в липса на указания за формата. Говорих с IT шефа в министерството и той ми каза, че няма проблем да ги предоставят в какъвто и да е формат. Просто им трябва заповед от МС. Изпратих предложение за конкретен формат и чакаме. В много случаи точно това е причината – при липса на конкретни изисквания някой чиновник взима решение според това на него как му е най-лесно или как той смята, че е правилно. Това води до липса на стандартизация, несъвместими формати и софтуерни решения.</p>
<p>Това впрочем е проблем не само за отворените данни. Една от основните пречки пред електронното управление, които напоследък кабинета изтъква, е невъзможността да се свържат съществуващите информационни системи. Доста хора, включително и аз, предупреждавахме отдавна за това. Интернет стандарти и принципите на отвореност не са просто “нещо хубаво за бъдещето” – те гарантират съвместимост и спестяват десетки милиони евро на държавата</p>
<li><strong>Вашите проекти не са непознати у нас – нито за медиите, нито за институциите, още по-малко за хората. Какво ново подготвяте в момента?</strong></li>
<p>Познати са най-вече сред хората четящи блога ми и следящи по-старите ми проекти като <a href="http://lipsva.com/" target="_blank">Lipsva.com</a>. Наскоро завърших проект за отваряне на данните за <a href="http://opendata.yurukov.net/kat" target="_blank">катастрофи в София</a>. Twitter обществото ми помага да поставям официално обявените тежки катастрофи на карта. Всичко е направено с графики и свободно за сваляне. Преди седмица пуснах и <a href="http://opendata.yurukov.net/business" target="_blank">интересна карта</a> с всички фирми регистрирани по ДДС и промените ден за ден. През октомври отворих данните за <a href="http://opendata.yurukov.net/balkanwars" target="_blank">загиналите в Балканската война</a>, но не ми е останало време да поставя всички 8000 родни и лобни места на картата. Това ще е прекрасен поглед над развоя на войните. Сега работя по интерактивен инструмент за представяне на всички европроекти по региони, теми, суми и фирми. Мисля, че ще стане доста интересно. Имам свалени и данните на административния регистър и на обществените поръчки, но не ми е останало време да се заема с тях. Като цяло правя всичко в свободното си време, а то е доста разпокъсанo.</p>
<li><strong>Оптимист ли сте за бъдещето на Отворените данни в България като инструмент за граждански контрол над управлението?</strong></li>
<p>Определено. Има разбиране у хора в управлението както са отворени данни и защо са полезни. Има ентусиасти в България, които работят по въпроса. От Европейската Комисия в близко бъдеще ще дойдат нормативни изисквания, а участието ни в OGP вече носи резултати. Отворените данни не са само технически въпрос, а най-вече психологически. Повечето чиновници и взимащи важните решения не се чувстват удобно с такава отвореност. Това е факт по цял свят и в известен смисъл България дори е леко напред в развитието си. Положението може обаче бързо да се обърне, ако не настояваме за повече прозрачност и възможност за проверка. Власт без контрол бързо се превръща в привилегия. Отворените данни са най-добрият способ за ефективен контрол, който съществува в момента.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/interview_pia/feed/</wfw:commentRss>
			<slash:comments>4</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">12620</post-id>	</item>
		<item>
		<title>Резолюция на Европейската Комисия за отворени данни и конференцията в Брюксел</title>
		<link>https://yurukov.net/blog/2012/ec-resolution/</link>
					<comments>https://yurukov.net/blog/2012/ec-resolution/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Sun, 21 Oct 2012 06:48:38 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[kalfin]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[opengov]]></category>
		<category><![CDATA[OpenGovPartnership]]></category>
		<category><![CDATA[parliament]]></category>
		<category><![CDATA[европарламент]]></category>
		<category><![CDATA[европейска комисия]]></category>
		<category><![CDATA[калфин]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[резолюция]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=12562</guid>

					<description><![CDATA[Снимката е взета от блога на Ивайло Калфин В сряда бях в Брюксел по покана на Ивайло Калфин, за да говоря за отворените данни в България. Конференцията беше по повод резолюция на Европейската Комисия за публично достъпни данни, които могат да бъдат използвани повторно. Повече за резолюцията може да прочетете в блога на Калфин, който...]]></description>
										<content:encoded><![CDATA[<p style="text-align:right;"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/10/orig_331b5d81909a4271357d5bf1dc069365.jpg" width="450" height="276"/><small>Снимката е взета от блога на Ивайло Калфин</small></p>
<p>В сряда бях в Брюксел по покана на Ивайло Калфин, за да говоря за отворените данни в България. Конференцията беше по повод резолюция на Европейската Комисия за публично достъпни данни, които могат да бъдат използвани повторно. Повече за резолюцията може да прочетете в блога на Калфин, който е докладчик към Европарламента, на <a href="http://europa.eu/rapid/press-release_IP-11-1524_bg.htm" target="_blank" rel="noopener">страницата</a> на Комисията и в <a href="http://blog.okfn.org/2011/12/12/european-commission-launches-open-data-strategy-for-europe/" target="_blank" rel="noopener">блога</a> на OKFN. </p>
<p>В панела участваха още Amelia Andersdotter &#8211; евродепутатка от шведските Пирати, Thibaut Kleiner от кабинета на Комисар Круз, който говори за самата резолюция, Marc de Vries от ePSI Platform &#8211; за икономиката на отворените данни, Chris Taggart от <a href="http://opencorporates.com/" target="_blank" rel="noopener">OpenCorporates</a> &#8211; за данните на 49 милиона компании в проекта му и opendata усилията на Великобритания; Martin Kliehm от общинският съвет на Франкфурт &#8211; за отворените данни в Германия; Erich Möchel &#8211; за данните в медиите и Австрия; Ben White от Британската национална библиотека &#8211; за това как отваряйки данните и архивите си им е донесло приходи.<br />
<span id="more-12562"></span><br />
Аз представих проектите в <strong><a href="http://opendata.yurukov.net/" target="_blank" rel="noopener">Opendata.yurukov.net</a></strong> и проблемите свързани с тях. Опитах се да илюстрирам с практически примери три аспекта на отварянето на данни. Първият е, че има разлика между публични и отворени данни. Публична информация имаме и сега в България и то в големи количества. Може да погледнете например списъка с публични регистри изготвен от Програма Достъп до Информация. Проблемът с всички до един е, че практически данните не могат да се използват повторно. Ограничението идва от формата им &#8211; налага се загуба на много време, за да се направят прости справки. Затова трябва да ги &#8222;отворим&#8220; както при <a href="http://opendata.yurukov.net/legalsystem" target="_blank" rel="noopener">съдебните актове</a> (заедно с Пейо Попов), данните от <a href="http://opendata.yurukov.net/balkanwars/" target="_blank" rel="noopener">Балканската война</a> и <a href="http://opendata.yurukov.net/spending" target="_blank" rel="noopener">бюджетните плащания</a>. Вторият проблем е в нормативната база. Повторното използване и свалянето на тази информация на практика не е регламентирано от институциите. Повечето от тях посочват, че имат запазени права над тях и имат ценоразпис за продажбата й. Съществуват и неясноти около личните данни. Такъв е случаят с <a href="http://yurukov.net/blog/2012/01/24/koi-ima-pylen-dostyp-do-tr/" target="_blank" rel="noopener">Търговския регистър</a> и данните на <a href="http://opendata.yurukov.net/statesecurity" target="_blank" rel="noopener">Държавна сигурност</a>. Друг важен проблем е качеството на данните. Нямаме информация за това кой ги поддържа и кой отговаря за точността им. При свалянето и обработка неизменно се губи информация, което създава проблеми. Липсата на документация и познания за контекста и термините &#8211; също. В тази насока могат да помогнат <a href="http://yurukov.net/blog/2012/09/09/katastrofite-v-sofiq/" target="_blank" rel="noopener">crowdsourcing проекти</a> като този за <a href="http://opendata.yurukov.net/kat" target="_blank" rel="noopener">катастрофите</a> в София. Събиране на информация в структуриран формат от обществото е полезен и в други сфери. Затова споменах и проектите <a href="http://lipsva.com" target="_blank" rel="noopener">Lipsva.com</a>, Crime.bg и Fairelections.eu.</p>
<p>Сред поканените бяха и представители на БАИТ, АПИС и Мусала софт, Програма Достъп до информация, Фондация за Отворено Знание, Института за модерна политика, Центъра за публични политики и застъпничество, Националната библиотека „Св. св. Кирил и Методий”, СУ „Св. Климент Охридски”, УНСС и т.н. С шефката на Програма Достъп до информация говорихме доста за данните в България и участието ни в <a href="http://yurukov.net/blog/2012/04/03/ogp-novini/" target="_blank" rel="noopener">Open Government Partnership</a>.</p>
<p>Повече за отворените данни може да прочетете в <a href="http://yurukov.net/blog/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8" target="_blank" rel="noopener">предишните ми статии</a>, в това <a href="http://yurukov.net/blog/2012/10/04/interview-opendata-duma/" target="_blank" rel="noopener">интервю за в. Дума</a>, българската версия на <a href="https://okfn.org/" target="_blank" rel="noopener">блога OKFN</a>. Все още няма публикуван запис на срещата, но ще го пусна ако намеря.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/ec-resolution/feed/</wfw:commentRss>
			<slash:comments>8</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">12562</post-id>	</item>
		<item>
		<title>За в. Дума: Свободната информация показва колко прозрачно е управлението</title>
		<link>https://yurukov.net/blog/2012/interview-opendata-duma/</link>
					<comments>https://yurukov.net/blog/2012/interview-opendata-duma/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Thu, 04 Oct 2012 08:57:22 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[egov]]></category>
		<category><![CDATA[ogp]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[opengov]]></category>
		<category><![CDATA[бюждет]]></category>
		<category><![CDATA[данни]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[открито управление]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=12522</guid>

					<description><![CDATA[Това интервю беше публикувано в днещния брой на в. Дума. Данните, които съм отворил с други opendata ентусиасти, ще намерите на тази страница. Погледнете също блога на OKFN-BG и предишните ми статии по темата. Горе виждате графика, която използвах в статията си за блога на OpenGovPartnership и показва ражданията в България в периода януари-юли т.г....]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/10/opengov_bulgaria_births-1.png" width="450" height="324"/></p>
<p><em>Това интервю беше публикувано в днещния брой на в. Дума. Данните, които съм отворил с други opendata ентусиасти, ще намерите на <a href="http://opendata.yurukov.net/" target="_blank">тази страница</a>. Погледнете също блога на <a href="https://okfn.org/" target="_blank">OKFN-BG</a> и предишните ми <a href="http://yurukov.net/blog/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8" target="_blank">статии по темата</a>.</p>
<p>Горе виждате графика, която използвах в статията си за блога на OpenGovPartnership и показва ражданията в България в периода януари-юли т.г. Тук ще намерите <a href="http://opendata.yurukov.net/birth/" target="_blank">данните</a> и сравнение с минали години в съотношение с населението на областите.</em></p>
<hr/>
<p style="text-align:left; font-weight:bold;">Как ви хрумна идеята за отворените данни?</p>
<p style="padding-left:10px;">Концепцията за отворените данни съществува отдавна. Запознах се с нея преди две години покрай други мои проекти и видях потенциала й.</p>
<p style="text-align:left; font-weight:bold;">Българското правителство се присъедини към инициативата &#8222;Партньорство за открито управление&#8220;. Вие обаче правите разлика между &#8222;открито управление&#8220; и &#8222;отворени данни&#8220;.</p>
<p style="padding-left:10px;">Отворени данни са всяка информация, която се предоставя свободно, структурирано, редовно и качествено. Това означава, че всеки може да намери сурови данни за работата на публична или частна организация, да ги използва свободно и да разчита на точността им. Откритото управление, от друга страна, е предпоставка за публичност на взети решения, разходи, обществени поръчки и прочие. Тази прозрачност обаче не гарантира непременно последващ контрол. И сега имаме открито управление &#8211; стенограмите са публични, някои разходи, регистри и обществени поръчки. Един активен гражданин или журналист обаче не може да получи поглед над всички неща.</p>
<p style="padding-left:10px;">Откритото управление е начин на работа на една администрация и комуникация с обществото. Отворените данни са инструмент, който позволява да проверим дали тази комуникация е искрена и да открием нови възможности за работа.</p>
<p><span id="more-12522"></span></p>
<p style="text-align:left; font-weight:bold;">Каква е ползата за обществото, за обикновения човек от отворените данни?</p>
<p style="padding-left:10px;">Еврокомисар Нели Круз каза, че информацията е новият петрол. По подобие на него обаче данните са само ресурс, който трябва да се разработи. Грешка на много проекти за отваряне на данни е, че не се популяризират и използват от гражданите.<br />
Истината е, че обикновеният човек в наши дни не е достатъчно технически грамотен, за да свързва, анализира и обработва такива данни. За целта журналисти и opendata-ентусиасти могат да създадат инструменти, които да помогнат да се вникне в огромни и сложни масиви от информация. The Guardian е светило в тази област &#8211; на сайта му можем например да намерим карта на Лондон на енергията, която се използва за отопление на частни и правителствени сгради по региони. Така лесно може да се види енергийната ефективност и как работят различни мерки за повишаването й. Аналогично в Канада има няколко карти, на които всеки може да намери нарушенията на хигиената в любимите си ресторанти и да сравни кулинарната оценка в други сайтове. Това действа дисциплиниращо за ресторантите и помага за ограничаване на случаите на хранителни натравяния. Трети пример са множеството сайтове за анализ на бюджетите и бюджетните разходи по света. С тяхна помощ могат да се открият проблеми с публичността и неефективни харчове.</p>
<p style="text-align:left; font-weight:bold;">Виждате ли връзка между отворените данни и растежа, конкурентоспособността?</p>
<p style="padding-left:10px;">Данните имат потенциала да разкрият бизнес ниши &#8211; примерно в сферата на услугите, полезните изкопаеми или анализа на информация за бизнеса. Когато са пълни и се използват правилно, те помагат на свободния пазар и така &#8211; на растежа. Това обаче може да е и нож с две отриета. В Индия, например, тази повишена прозрачност е била от полза предимно за многонационалните корпорации и технически развитите фирми. С тяхна помощ те са успели да надделеят над местния бизнес с познания за локалната култура и навици. Отворените данни водят със себе си стандартизация, която помага за растежа, но за да помогне и на конкурентоспособността, трябва да има инвестиции в техническа грамотност и в инструменти за оползотворяване на този ресурс.</p>
<p style="text-align:left; font-weight:bold;">Какво е вашето обяснение за съпротивата на институциите за &#8222;отваряне&#8220; на данните?</p>
<p style="padding-left:10px;">Има два вида съпротива &#8211; пасивна и активна. Активна съпротива срещаме в онези институции, които търгуват с информация. Пример за това е Агенцията по вписванията, където множество регистри са практически заключени и са толкова неизползвами във вида, в който ги предоставят, че държавата се налага да плаща милиони за частен софтуер, през който да гледа същата информация, за която вече сме платили с данъците си.</p>
<p style="padding-left:10px;">Пасивна съпротива срещаме при полицията, обласните управи и министерствата. Публикуването на отворени данни изисква разбиране защо са нужни те и усилие за поддържането им. Това е много трудно, когато в работата на самите чиновници принципите на отвореност не са залегнали и използването на този тип информация не се насърчава.</p>
<p style="text-align:left; font-weight:bold;">Вие живеете от дълги години в Германия и може да сравните ситуацията там и в България по отношение на отворените данни. Какъв е вашият коментар?</p>
<p style="padding-left:10px;">В световен мащаб има подем на отворените данни едва в последните две-три години. Великобритания дръпна много напред през това време и начинът на мислене на управниците им е пример за цяла Европа. Германия е близко до България в това отношение &#8211; има много разпокъсани ресурси и липсва единна цялостна стратегия. Силната местна власт в Германия обаче позволява да се създават изключително добри проекти за отворени данни, които за жалост не виждаме в България. У нас почти всичко е централизирано и без заповед от София всички се притесняват да направят каквото и да било.</p>
<p style="text-align:left; font-weight:bold;">Очевидно институциите нямат интерес да ни &#8222;допускат&#8220; до тайните си. Кой според вас трябва да се заеме с &#8222;отварянето&#8220; на данните?</p>
<p style="padding-left:10px;">Институциите искат да отворят данните си, но само някои. Често става дума за информация, която искат да се види, от която ще проличат успехите им или пък такава, която ще покаже привидна публичност, но на практика няма да помогне за истинска прозрачност. Публикуването на хиляди документи в свободен текст не е прозрачност, защото никой няма да седне да ги чете. Затова например искаме да получим идексирани и подредени стенограмите на парламента. И сега ги получаваме, но е практически невъзможно да се изкарат всички изказвания на даден депутат по дадена тема. В системите на парламента има възможност да се публикуват стенограмите като отворени данни, но вече година това не се случва.</p>
<p style="text-align:left; font-weight:bold;">Освен вас има ли други ентусиасти, които работят в тази насока?</p>
<p style="padding-left:10px;">Ентусиасти има много &#8211; включително в рамките на институциите. Говорил съм както с хора в кабинета, така и с чиновници &#8222;в окопите&#8220;, които искат да използват и публикуват отворена информация. Откритото управление не е просто услуга за гражданите &#8211; това е принцип на работа и на реформи в самата администрация. Отворените данни помагат както за по-добра хоризонтална и вертикална видимост в работата на администрацията, така и за по-добра сигурност на оперативните и защитените данни. Всичко това се вижда от хора в държавния апарат и има желание за промяна. Не липсва дори воля от горните етажи. Това, което липсва и спира развитието обаче, е обща визия за легалните и техническите аспекти, липсва ефективен натиск към отделните институции нещата да се случат. Така отворените данни остават просто &#8222;нещо, което &#8222;би било хубаво да имаме&#8220;.</p>
<p style="text-align:left; font-weight:bold;">Кои данни вече са отворени и къде могат да се намерят.</p>
<p style="padding-left:10px;">Учудващо много информация е публична, но за жалост е трудна за обработка. НАП, НСИ и финансовото министерство публикуват редовно таблици с отчети и анализи. Често намираме подобни отчети и в други институции. Има регистри като търговския или кадастъра, където можем да намерим доста информация, макар да е трудно да се търси. Подобен е и случаят с актовете на съдебната система, с административния регистър и бюлетините на МВР. Навсякъде е проблем качеството &#8211; няма яснота как се поддържат, каква информация липсва и кой гарантира качеството на наличните данни.</p>
<p style="text-align:left; font-weight:bold;">Кои са данните, които предстои да отваряте?</p>
<p style="padding-left:10px;">В момента работя конкретно по данните за бюджетните плащания. Отворил съм тези на финансовото министерство и търся начин да отворя плащанията за всички второстепенни бюджетни разпоредители. Паралелно отварям данните за обществените поръчки и административния регистър.</p>
<p style="text-align:left; font-weight:bold;">Кое е най-голямото предизвикателство в работата ви по отварянето на данни?</p>
<p style="padding-left:10px;">Най-голямото предизвикателство си остава използването на данните. За мен техническата част е лесна, проблем обаче остават качеството, поддържането и оползотворяването на информацията. Често данните трябва да се свалят и проверяват на ръка (пример за това е регистърът на ражданията). В някои регистри има сериозни въпроси около точността и пълнотата на данните (пример &#8211; актовете на съдебната система, където много документи не са качени или са нечетими). Най-вече обаче цялата тази информация трябва да влезе в употреба &#8211; от журналисти, графични дизайнери, блогъри и ентусиасти. Трябва да се изготвят интерактивни приложения, инфографики, да се вадят изводи, да се поставят в различен контекст и да се комбинират с други данни. За да се стимулира този процес, има нужда от семинари и състезания. Такива се организират в други държави и помагат не само да се създадат полезни приложения, но и да се осъществи контакт между разработчици, дизайнери и журналисти. Точно тези контакти помагат да се създадат истински приложения, полезни както за обикновения човек, така и за самите политици и чиновници.</p>
<p style="padding-left:10px;">Дали съм оптимист? Защо не? Проблемите ни с прозрачността не са уникални за България, но трябва да намерим наш начин да ги решим. Има достатъчно хора, които искат да действат в тази насока, и реално няма значение кой е на власт &#8211; просто трябва да натискаме достатъчно дълго и на правилните места, за да се случат нещата. В никакъв случай няма да е лесно и в никакъв случай напредъкът няма е линеен. За да има устойчив успех, трябва първо да накараме обществото да разбере какво в действителност е открито управление, защо отворените данни са полезни и как то да разпознава кога политиците използват псевдопрозрачността за свои цели.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/interview-opendata-duma/feed/</wfw:commentRss>
			<slash:comments>13</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">12522</post-id>	</item>
		<item>
		<title>Катастрофите в София</title>
		<link>https://yurukov.net/blog/2012/katastrofite-v-sofiq/</link>
					<comments>https://yurukov.net/blog/2012/katastrofite-v-sofiq/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Sun, 09 Sep 2012 20:31:53 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[кат]]></category>
		<category><![CDATA[катастрофи]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[софия]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=12474</guid>

					<description><![CDATA[На всички е известно, че има проблемни кръстовища и отсечки в София и всички градове в България. На тях редовно стават катастрофи и докато не се случи най-лошото и медиите ги забележат, тези проблеми потъват в общата статистика. Тук можем да обвиняваме държавата, полицията или общините, но истината е, че хората трябва да натискат тези...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/09/1234561.jpg" width="450" height="269" /></p>
<p>На всички е известно, че има проблемни кръстовища и отсечки в София и всички градове в България. На тях редовно стават катастрофи и докато не се случи най-лошото и медиите ги забележат, тези проблеми потъват в общата статистика. Тук можем да обвиняваме държавата, полицията или общините, но истината е, че хората трябва да натискат тези неща да се оправят.</p>
<p>Един начин това да стане е като имаме добър поглед над всички проблеми точки по пътищата. За целта трябва да знаем за всички катастрофи, къде се намират и какви са причините за тях. За жалост тази информация не е достъпна в отворен вид, т.е. няма място където да си я свалите като карта или Excel таблица. Преди няколко дни в интервю за в. Дума споменах, че съм открил начин. </p>
<p>Забелязах, че КАТ София имат страница, в която всеки ден пускат статистика за катастрофите, пострадалите и местата, на които са станали. Най-хубавото е, че страницата има еднаква структура всеки ден и сравнително лесно изкарах данните от нея. Така вече имам следните показатели по дни:</p>
<li>Брой тежки и леки пътни инциденти </li>
<li>Причини за тежките инциденти</li>
<li>Местоположение на тежките инциденти</li>
<li>Брой тежко и леко пострадали</li>
<li>Тип пострадали &#8211; водачи, пешеходци и т.н.</li>
<p>Заедно с тях има и текст, с който се описват някои от тежките инциденти. Всички тези данни вече се събират автоматично на сайта ми в база данни. Този начин на събиране обаче има ограничения.<br />
<span id="more-12474"></span><br />
Първият проблем е, че не можем да видим статистиката със задна дата &#8211; обновява се на ръка в работни дни. Така научаваме и сумарно катастрофите през почивните дни плюс петъка преди тях. Друг проблем е, че не знаем къде колко са пострадалите &#8211; само общата бройка за деня. Още преди да направя анализа на данните, пуснах един скрипт да сваля информация от 24-ти нататък. Броят катастрофи може да видите обобщени на следната графика:</p>
<p><a href="http://yurukov.net/blog/wp-content/uploads/2012/09/kat.png" rel="lightbox"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/09/kat1.png" width="450" height="272" style="border:1px solid gray; margin-bottom:40px;"/></a></p>
<p>По-особен проблем представляват адресите. Често те са във формата &#8222;ул. Суходолска в района на № 22&#8220; или &#8222;ул. Галилео Галилей на кръстовището с ул. Н. Коперник&#8220;, а понякога са изпуснати букви от имената на адресите. Така най-често е невъзможно да се намерят точните географски координати на тежките инциденти и трябва да се търсят на ръка. Затова вчера написах набързо <a href="http://opendata.yurukov.net/kat/crowdsource.php" target="_blank">инструмент</a>, в който <strong>всеки ще може да помага</strong> с тази задача.</p>
<p><a href="http://opendata.yurukov.net/kat/crowdsource.php" target="_blank"><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/09/tool-1.png" width="450" height="329" style="border:1px solid gray" /></p>
<p>Инструментът</a> използва принципа на crowdsourcing-а, за който <a href="http://yurukov.net/blog/?s=crowdsourcing" target="_blank">писах преди</a> и който използваме в Crime.bg и FairElections.eu. Представлява страница, на която може да въведете Twitter името си или собственото си име (<em>за обратна връзка и за списъка с помогнали</em>), след което ще видите карта с последните адреси без координати. Когато натиснете адрес, Google ще се опита да познае мястото. След това местейки маркера на картата може да го сложите на правилното място. Има проста търсачка, а списъка вдясно ще показва адресите, с които сте готови. Накрая изпращате събраните данни и след като се съберат достатъчно предложения, сървърът ще изчисли най-вероятното местоположение. Ако предложенията се разминават с повече от 50 метра, получавам мейл в края на седмицата и избирам мястото, което смятам, че е вярно. Данните и адресите се обновяват всеки ден в 18 часа и тогава системата ще пуска tweet с броя нови неизвестни адреси и линк, където може да помогнете. </p>
<p>Цялата информация се пази в база данни. Изчаквам да се съберат повече, за да уеднаквя етикетите и категориите. След около седмица ще пусна всичко да може да се сваля като SQL база данни, като KML файл и като Excel таблици. Ще направя и карта с графики, която ще показва катастрофите от изминалите дни.</p>
<p>Ще повторя, че данните имат доста условности. Най-голямата е, че тази информация не трябва да се събира така. Тя трябва да се предоставя от КАТ в отворен формат лесен за анализ. Соломон Паси <a href="http://twitter.com/PassySolomon" target="_blank">писа</a> в Twitter, че в разговор с Мат Бритин &#8211; вицепрезидент на Google &#8211; е станало ясно, че много градове и държави им предоставят такива данни свободно. Така помагат на потребителите си да избягват задръствания и проблеми кръстовища. Добре ще е да имаме нещо такова не само за София, но и за другите градове. С този проект и вашата помощ можем да покажем ползата и да убедим КАТ да направи същото.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/katastrofite-v-sofiq/feed/</wfw:commentRss>
			<slash:comments>41</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">12474</post-id>	</item>
		<item>
		<title>Всички актове на съдебната власт &#8211; отворени и достъпни</title>
		<link>https://yurukov.net/blog/2012/sadebni-aktove/</link>
					<comments>https://yurukov.net/blog/2012/sadebni-aktove/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Fri, 10 Aug 2012 18:09:11 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[okfn]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[opengov]]></category>
		<category><![CDATA[мотиви]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[решения]]></category>
		<category><![CDATA[съд]]></category>
		<category><![CDATA[съдебна система]]></category>
		<category><![CDATA[съдебни актове]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=12344</guid>

					<description><![CDATA[След поредицата от скандали в съдебната система, решихме да вмесем поне частица яснота. Всеки ден в съдилищата из страната се водят хиляди дела. За жалост данните за тези дела не са достъпни в мрежата, но се оказва, че актовете от тях са публични за повечето съдилища. Затова решихме да свалим всички и да ги предоставим...]]></description>
										<content:encoded><![CDATA[<p><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/08/syd1.jpg" alt="" /></p>
<p>След поредицата от скандали в съдебната система, решихме да вмесем поне частица яснота. Всеки ден в съдилищата из страната се водят хиляди дела. За жалост данните за тези дела не са достъпни в мрежата, но се оказва, че актовете от тях са публични за повечето съдилища. Затова решихме да свалим всички и да ги предоставим свободно в мрежата за анализ.</p>
<p>Макар повечето актове да могат да се намерят на сайта на <a href="http://legalacts.justice.bg/">justice.bg</a>, там може да се намират само по 1000 акта наведнъж и възможността за сложни справки почти липсва. За целта ни трябват всички актове като отворени данни. Към 5-ти август 2012 имаме вече <strong>580049</strong> акта и <strong>607656</strong> документа (някои от тях мотиви). Свалянето на актовете се правеше автоматично, но с такава честота, че да наподобява работа на обикновен потребител. Целта беше да не претоварим сървърите на съдебната система. Така свалянето отне около 3 седмици.</p>
<p>На <a href="http://opendata.yurukov.net/legalsystem/" target="_blank">този сайт ще намерите данните</a> в  две части – мета данни и документи. Мета данните съдържат номер и тип на делото, съдия и съдебен състав, тип и дати на актове и мотиви, дали делото е предадено на горна истанция, дали има свързани дела и прочие. Тази информация се съдържа в SQL база данни. В таблици са отделени имената и местоработата на съдии и съдебни състави (общо 3789), като всеки от тях е свързан с издадените актове (общо 1152969 връзки). Тази структура позволява по-лесно изготвяне на справки.<br />
<span id="more-12344"></span><br />
Втората част от данните са самите документи. На сървърда на justice.bg те са предимно HTML и DOC файлове с общ размер 21Gb. За да се намали размера им и да са по-лесни за анализ, само текстовата информация беше извлечена като параграфите бяха запазени. Това намали размерът на документите до 10G (~ 2.1Gb zip). В този си вид те са говори за text mining. В архива те са подредени по години и месеци на издаване. Имената им се състоят от номера на акта и <em>a/m</em> в зависимост дали става въпрос за акт или мотив. Например, файлът в <em>2000/12/430449_a.txt</em> е издаден през <em>декември 2000</em>, отнася се до акт с номер<em>430449</em>. Тъй като размерът на архива с документи е доста голям, моля пишете ни, за да ви пратим линк.</p>
<p>Качеството на данните е друг важен въпрос. Открихме, че някои актове липсват е системата. Пример за това е, че има само два акта на ВАС и ВКС. При ВАС може да се намерят актовете на техния сайт (където е много трудно да се извлекат), но не и в централната система. Мета данните имаха очевидни грешки при 19 акта – предимно дати на издаване. При 80 други акта документите са развалени. Възможно е да има още от тези 600000 документа, при които автоматичният анализ да не е хванал грешки, но нямаме възможност да прегледаме всички. Ако откриете такива, моля пишете ни, за да ги оправим.</p>
<p>Данните са актуални към края на юли 2012. Подготвяме механизъм за автоматично ежеседмично обновяване на последните качени актове. В тези случаи ще предоставяме само обновления на базата данни и архива с документи. Ако имате интерес към обновления или искате да анализирате данните, моля пишете ни. На <a href="http://opendata.yurukov.net/legalsystem/" target="_blank">страницата на данните</a> ще намерите няколко графики изготвени от бързи справки.</p>
<p><em>Тази статия беше публикувана по-рано в българската версия на блога на OKFN.<em></em></em></p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/sadebni-aktove/feed/</wfw:commentRss>
			<slash:comments>3</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">12344</post-id>	</item>
		<item>
		<title>Още прозрачност в България</title>
		<link>https://yurukov.net/blog/2012/prozrachnost-v-balgari/</link>
					<comments>https://yurukov.net/blog/2012/prozrachnost-v-balgari/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Wed, 27 Jun 2012 14:35:28 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Политика]]></category>
		<category><![CDATA[ogp]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[доклад]]></category>
		<category><![CDATA[закон за достъп]]></category>
		<category><![CDATA[кабинет]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[открито управление]]></category>
		<category><![CDATA[партньорство]]></category>
		<category><![CDATA[предложения]]></category>
		<category><![CDATA[прозрачност]]></category>
		<category><![CDATA[публични данни]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=12135</guid>

					<description><![CDATA[На днешното заседание на кабинета е бил приет оперативен план за ангажиментите (оригинал) към Партньорство за Открито Управление (OGP). Писах доста по темата през последната година, а преди месец пуснах в Twitter доклад с предложения за данни, които да се отворят, както и за техническите изисквания. Обощих ги в блога на EPSI. Някои от идеите...]]></description>
										<content:encoded><![CDATA[<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/02/header_logo.png" width="150" height="151" style="float:right;margin:4px 0 4px 10px;"> На днешното заседание на кабинета е бил приет <a class="pdf_link" href="http://yurukov.net/blog/wp-content/uploads/2012/06/operstiven_planOGP.pdf" target="_blank">оперативен план за ангажиментите</a> <em>(оригинал)</em> към Партньорство за Открито Управление (<a href="http://www.opengovpartnership.org/countries/bulgaria" target="_blank">OGP</a>). Писах доста по темата през последната година, а преди месец пуснах в Twitter <a href="http://yurukov.net/blog/wp-content/uploads/2012/06/opengov_predlojeniq.pdf" class="pdf_link" target="_blank">доклад с предложения</a> за данни, които да се отворят, както и за техническите изисквания. Обощих ги в блога на EPSI. Някои от идеите са наложени практики в други държави и се споделят и от други в рамките на консултациите от началото на годината. Сега виждаме, че са залегнали и в плана на кабинета. </p>
<h3>Какви са обещаните мерки?</h3>
<p>Планът се състои от 33 точки, които можем да разделим на няколко групи &#8211; финансова прозрачност, подобряване и отваряне на регистри, публични консултации и корпоративна социална отговорност. Всяка от тях цели да подобри прозрачността при взимането на решения и даде възможност на гражданите да работят и взимат решения с актуална и отворена информация.</p>
<p>Най-важната точка при финансовите мерки е публичността на бюджетите и бюджетните разходи. Това означава, че всяко министерство ще разяснява не само разпределението на бюджетите си, но и ежедневно ще публикува всички плащания, които е правила. В <a href="http://www.capital.bg/politika_i_ikonomika/2012/06/27/1854753_ministerstva_shte_otchitat_vseki_den_plashtaniiata_si" target="_blank">Капитал ще намерите</a> добро описание на тази точка. Друга изключително важна мярка е публикуване на информация за ревизиите на фирми при открити нарушения. Това, разбира се, ще се прави при защита на данъчна и осигурителна информация. Ще се регламентира и създаде концепция за финансирането на НПО-та и ще се създадат инструменти за по-добро разбиране на бюджета и разходите от страна на гражданите.</p>
<p>Друга много важна точка е достъп до всички данни и отчети на лекари и болници. Това означава, че ще можем да получим информация за дейността, нарушенията, натовареността и всичко свързано с предоставянето на здравни услуги. Това ще става през новата здравно-информационна система и за жалост &#8211; само с електронен подпис. Все пак обаче данните ще са полезни и се надявам да са в отворен формат за по-лесен анализ. Самата здравно-информационна система е също е част от плана.<br />
<span id="more-12135"></span><br />
Следващият важен момент е поставен последен като точка, но има най-много общо с отворените данни. Планира се промяна в Закона за достъп до обществени данни като се създадат изисквания за предоставянето и публикуването на данни от страна на институциите. Няма много подробности в този документ, но това, което обсъждахме с кабинета, е да се въведат ясни технически изисквания и задължение за институциите да публикуват част от данните си в отворен формат. Това означава, че ще може да изискваме всички данни свързани с въпроса ни към дадена институция. Разбира се, те ще бъдат изчиствани всякакви лични и секретни данни. При създаването на всички нови информационни системи ще има възможност за свободен достъп до отворени данни, а при старите &#8211; може да се изгради такава. Разбира се, не знам дали тези предложения ще залегнат в закона, но бяха централна част от разговорите. Предвиден е също така контрол от страна на кабинета на изпълнението на тези мерки за прозрачност и отворени данни, както и публикуването на доклади по темата.</p>
<p>В планът се говори също така за публичен регистър на всички природни богатства &#8211; местоположение, експлоатация, концесии и прочие. Ще бъдат създадени и отворени доста други регистри. Включени са точки за корпоративната социална отговорност и информираността на гражданите за тях. Планира се и анализ на въздействието на нормативните актове върху бизнеса, по-добър диалог с гражданите и организирането на форуми и консултации.</p>
<h3>Какво липсва?</h3>
<p>От мерките, които предложих липсва най-вече отварянето на регистрите на Агенцията по вписванията. Както писах по-рано, в <a href="http://yurukov.net/blog/2012/01/24/koi-ima-pylen-dostyp-do-tr/" target="_blank">сегашният си вид са почти неизползваеми</a> и на практика работят само в полза на 3-4 фирми. В рамките на Стратегията за Електронното Управление обаче те трябва да се интегрират, което може би ще означава отварянето им и навън. </p>
<p>В планът не се говори също така директно за отворени данни, което е нормално предвид вида на документа, това може би е нормално. Предполага се, че при изпълнението на заложените мерки ще залегнат принципите на отвореност на информацията, какъвто е духът на OGP, но това не е дефинирано изрично. Припомням, че <a href="http://yurukov.net/blog/2011/10/28/prozrachnost-instruktsiq-za-upoteba/" target="_blank">не е достатъчно просто да се публикува някаква информация</a> &#8211; трябва тя да е достъпна както за сваляне, така и за лесна обработка и анализ. Не става дума и за изграждането на централен портал за отворени данни, какъвто заявиха или вече са създали другите участници в инициативата. Говори се за разширяване на сайта на правителството и предполагам, че точно това имат предвид.</p>
<p>В предложенията ми включих и данни в реално време от събраните данъци и такси от НАП, както и обобщени ежеседмични данни по общини от касовите апарати, които и сега са свързани с тях. Тези данни ще са безценни за създаването на ясна картина на икономическата ситуация у нас. Призовавам и за повече прозрачност в МВР &#8211; данни за регистрираните престъпления, катастрофи и издирвания с категоризация, местоположение и време. Същото важи и за обществените поръчки и евро-фондовете &#8211; макар там данните да са публични, те далеч не са отворени. Така можем да свалим всичките 177000 документа за обществени поръчки, но няма да можем да ги анализираме и направим важни изводи от тях. </p>
<p>Подобна е ситуацията с доста институции и регистри, където информацията е публична, но не може да се свали. В момента работя по отварянето на Административния регистър. Междинните резултати <a href="http://opendata.yurukov.net/pubadminreg/" target="_blank">ще намерите тук</a>. Отворих <a href="http://opendata.yurukov.net/statesecurity/" target="_blank">данните</a> на Комисията за Държавна сигурност, защото в този си вид са невъзможни за анализ. Започнах да изграждам структура на връзките между агентите. Тук ще намерите <a href="http://opendata.yurukov.net/statesecurity/graph.html" target="_blank">предварителна графика</a> с част от данните и то само с известните 5140 сътрудници. Работя по алгоритъм за извеждане на тези, които са споменати само по име и тогава ще има много повече връзки.</p>
<h3>Къде да намеря повече информация?</h3>
<p>Най-доброто място за новини и информация за отворените данни у нас е mailinglist-а на Open Knowledge Foundation за България. В събота се събрахме виртуално няколко души и решихме да създадем родна структура на тази организация. Първата стъпка е <a href="https://okfn.org/" target="_blank">блог</a>, където ще пускаме новини, ресурси и информация за събития. За повече на принципите на отворените данни и прозрачността може да прочетете и в <a href="http://yurukov.net/blog/page/2/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8" target="_blank">предишните ми статии</a>.</p>
<h3>Допълнение 5 юни</h3>
<p><img loading="lazy" decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/06/g2-130x130.gif" alt="" title="g2" width="130" height="130" style="float:left;margin:4px 10px 4px 0;" />Министерството на финансите вече публикува данни за ежедневните бюджетни плащания към всички ведмоства. Докладите са разбити по цели на плащанията и брой преводи. Очаква се от началото на август всички министерства да публикуват такива доклади. Това цели прозрачност и е част от точките, които съм описал по-горе.  Повече за това ще намерите в българския раздел на блога на OKFN:</p>
<p>Всички бюджетни плащания се публикуват вече ежедневно в интернет</p>
<p>Примерни графики на потока от парични средства може да намерите в <a href="http://yurukov.net/blog/2012/06/27/prozrachnost-v-balgari/#comment-22120" target="_blank">коментарите по-долу</a>. Това са само начини на визуализиране и нямат реални данни от споменатите доклади.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/prozrachnost-v-balgari/feed/</wfw:commentRss>
			<slash:comments>12</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">12135</post-id>	</item>
		<item>
		<title>Планът за открито управление на кабинета &#8211; може би добра новина</title>
		<link>https://yurukov.net/blog/2012/ogp-plan/</link>
					<comments>https://yurukov.net/blog/2012/ogp-plan/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Tue, 17 Apr 2012 08:51:15 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Политика]]></category>
		<category><![CDATA[ogp]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[opengov]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[открито управление]]></category>
		<category><![CDATA[план]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=11756</guid>

					<description><![CDATA[Преди седмица писах в Twitter, че днес трябва да излезе план на кабинета за открито управление. Той се изготвя във връзка с Партньорството за открито управление, за който пиша в последните месеци и цели да отвори повече информация от институциите за обществото. Идеята на тези данни е да помогне на журналисти, графични дизайнери и ентусиасти...]]></description>
										<content:encoded><![CDATA[<p><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/01/head1_bg.jpg" style="float:right;margin:4px 0 0 10px;"/> Преди седмица писах в Twitter, че днес трябва да излезе план на кабинета за открито управление. Той се изготвя във връзка с Партньорството за открито управление, за който пиша в последните месеци и цели да отвори повече информация от институциите за обществото. Идеята на тези данни е да помогне на журналисти, графични дизайнери и ентусиасти да търсят проблеми, корупция, възможности за подобрение, напредък, неочаквани изводи и дори бизнес ниши в огромните масиви от данни генерирани от държавния апарат. Тези данни по подразбиране са публични и сега, но са полезни единствено и тогава, когато са лесно достъпни, добре описани и структурирани, свободни за промяна и с добро качество.</p>
<p>Оказа се, че планът е бил пуснат на сайта още на 11-ти, но никой не го е забелязал. Заедно с него има и прес съобщение, че представител на кабинета ще участва днес на срещата на OGP в Бразилия и ще говори за нашия план. Може да го свалите в PDF версия по-долу. </p>
<h3>Добрите новини</h3>
<p>Планът започва с увод за целите на откритото управление и изброява нещата, които са свършени вече. Споменават се мерките за публичност на изготвянето на бюджета, стенограмите и решенията на кабинета, развитието на електронното правителство, регистрите, порталът Strategy.bg и този за обществените поръчки. Сред тях е намерил място и гражданският проект <a href="http://openparliament.net/" target="_blank">OpenParliament.net</a> на Института за развитие на публичната среда. Този сайт в момента представлява блог, но съвсем скоро ще комбинира на данните на парламент, които отворих през декември заедно с такива от търговския регистър и сметната палата. Така ще дава добра представа кой какво прави сред управляващите ни. В плана са включени също законът за достъп до публични данни и свързването на касовите апарати.<br />
<span id="more-11756"></span><br />
Има няколко положителни точки, които се заявяват в плана. Четири от тях са сред <a href="http://yurukov.net/blog/2012/04/03/ogp-novini/" target="_blank">предложенията, които изпратих на кабинета</a> &#8211; изготвяне на единни отворени стандарти за електронни системи услуги, публикуване на подробна бюджетна информация, прозрачност и отчетност на здравните заведения и по-голяма ефективност на законът за достъп до обществени данни. Включени са и доста законодателни мерки свързани с подземните богатства, работата с НПО-та и отчетността на фирмите. За всички тях ще бъдат изготвени стратегии и конкретни регистри с публична информация. Конкретизирани са мерки свързани с електронното управление, които не бяхме виждали по-рано.</p>
<h3>Открито управление или отворени данни</h3>
<p>Това разграничение е много важно. Отворено управление означава <a href="http://yurukov.net/blog/2011/10/28/prozrachnost-instruktsiq-za-upoteba/" target="_blank">прозрачност</a> и отчетност, но не непременно <a href="http://yurukov.net/blog/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8" target="_blank">отворени данни</a>. Открито управление имаме и сега до известна степен &#8211; публикуват се стенограми, тонове документи, статистика, има доста публични регистри и сравнително добър закон за достъп до обществени данни. Това е откритото управление &#8211; предоставяне на някаква информация. Но за да е полезна тази информация на гражданите, тя трябва да е отворена. Това означава, че вместо да имаме достъп до тонове документи в свободен текст, анализите трябва да са в единен структуриран формат. Вместо статистика за работата на МВР и НАП, трябва да получаваме сурови данни, които сами да анализираме. Вместо разпокъсани регистри с почти <a href="http://yurukov.net/blog/2012/01/24/koi-ima-pylen-dostyp-do-tr/" target="_blank">неизползваем интерфейс</a> допълнително блокиран с captcha <em>(анти-спам)</em>, трябва да имаме интегрирани, свободни за сваляне и пълни данни. Едва тогава публичната информация на откритото управление става отворена. За подробен поглед над разминаването между <em>OpenGov</em> и <em>OpenData</em> <a href="http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2012489" target="_blank">препоръчвам труда</a> на Харлан Юу и Дейвид Робинсън. Говорих с тях във Варшава миналата година и описват доста добре разликите и генезиса на проблема. </p>
<p>Пример, който илюстрира това, е Народното Събрание. На сайта им ще намерите може би <a href="http://yurukov.net/blog/2011/12/12/publichni-danni-bylgarskiq-parlament/" target="_blank">най-добрите отворени данни</a> предоставени от институциите ни. Въпреки това, дори те чисто технически не стават за работа. Затова се наложи да ги изчистя, смеся и трансформирам. Ще откриете поправените данни на <a href="http://parliament.yurukov.net/" target="_blank">тази страница</a>. Съвсем скоро на OpenParliament.net ще заработи визуализация на тези и други данни. Тогава чак информацията публикувана от парламента ще стане истински полезна &#8211; когато обикновените хора имат интуитивен инструмент за анализ на работата на избраниците си. Гигабайтите стенограми в свободен текст, таблици с гласуване и законопроекти не помагат много.</p>
<h3>&#8222;Може би&#8220; добра новина</h3>
<p>Говоря уклончиво, защото планът има два сериозни недостатъка. Първия е, че е изготвен на базата на неформални разговори със заинтересовани лица. Това е добър подход за придобиване на начална представа, но практически липсва публичният процес на консултации, който се забелязваше в други държави. Струва ми се, че повечето от участвалите във въпросните <a href="http://yurukov.net/blog/2012/02/20/poseshtenieto-na-klintyn/" target="_blank">неформални разговори</a> сме учудени, че това е крайният вариант и няма да подлежи на обсъждане. </p>
<p>Вторият недостатък е, че липсва конкретика. Макар това да е все пак просто план, много напомня на стратегията за електронно управление. Тя съдържаше много добри решения и идеи, повечето от тях обаче останаха на хартия. В прес-съобщението на кабинета се споменава, че в рамките на месец ще бъде изготвен списък с конкретни задачи. Те ще се базират на въпросния план и ще ни позволят да следим ангажиментите на управляващите в рамките на инициативата OGP. Остават обаче няколко важни въпроса:</p>
<li>Ще бъдат ли подложени на обсъждане тези задачи?</li>
<li>Ще бъдат ли включени истински отворени данни в тях?</li>
<li>Как ще участва неправителствения сектор в изпълнението, какви срокове и отчетност ще има за изпълнението им?</li>
<p>Надявам се, че след днешната среща в Бразилия ще получим повече информация и планът за открито управление няма да бъде подритнат от медиите като поредната политическа клюка. Качествените журналисти ще спечелят най-много от тези данни, защото ще се натъкнат на златна мина от новини и поглед над нещата. Според разбирането им при отразяването на тематиката ще разпознаете едните от другите. </p>
<p>Може да погледнете <a  class="pdf_link" href="http://yurukov.net/blog/wp-content/uploads/2012/04/PLAN-BGlast-10.04.2012.pdf" target="_blank">целия документ</a> на плана тук или на сайта на кабинета.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/ogp-plan/feed/</wfw:commentRss>
			<slash:comments>5</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">11756</post-id>	</item>
		<item>
		<title>Open Gov Partnership  &#8211; консултации</title>
		<link>https://yurukov.net/blog/2012/ogp-novini/</link>
					<comments>https://yurukov.net/blog/2012/ogp-novini/#comments</comments>
		
		<dc:creator><![CDATA[Боян Юруков]]></dc:creator>
		<pubDate>Tue, 03 Apr 2012 09:56:45 +0000</pubDate>
				<category><![CDATA[България]]></category>
		<category><![CDATA[Идеи]]></category>
		<category><![CDATA[Технологии и Интернет]]></category>
		<category><![CDATA[ogp]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[opengov]]></category>
		<category><![CDATA[бюджет]]></category>
		<category><![CDATA[министерски съвет]]></category>
		<category><![CDATA[отворени данни]]></category>
		<category><![CDATA[отворено]]></category>
		<category><![CDATA[открито]]></category>
		<category><![CDATA[управление]]></category>
		<guid isPermaLink="false">http://yurukov.net/blog/?p=11696</guid>

					<description><![CDATA[Миналата седмица открих нещо интересно &#8211; OpenGov си има вече специална страница в Strategy.bg. Публикували са няколко кратки новини през последния месец. Ще ги намерите и във Facebook, където впрочем отговарят на лични съобщения към страницата. Предполагам, че присъствието в социалната мрежа донякъде се дължи на подхвърлянето на Клинтън, че доста българи са вече там....]]></description>
										<content:encoded><![CDATA[<p><img decoding="async" src="http://yurukov.net/blog/wp-content/uploads/2012/01/head1_bg.jpg" style="float:right;margin:4px 0 0 10px;"/> Миналата седмица открих нещо интересно &#8211; OpenGov си има вече специална страница в Strategy.bg. Публикували са няколко кратки новини през последния месец. Ще ги намерите и във <a href="https://www.facebook.com/pages/%D0%9F%D0%B0%D1%80%D1%82%D0%BD%D1%8C%D0%BE%D1%80%D1%81%D1%82%D0%B2%D0%BE-%D0%B7%D0%B0-%D0%BE%D1%82%D0%BA%D1%80%D0%B8%D1%82%D0%BE-%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5/260225677393242" target="_blank">Facebook</a>, където впрочем отговарят на лични съобщения към страницата. Предполагам, че присъствието в социалната мрежа донякъде се дължи на подхвърлянето на Клинтън, че доста българи са вече там.</p>
<p>Втората новина около <a href="http://yurukov.net/blog/2011/10/28/prozrachnost-instruktsiq-za-upoteba/">Open Gov Partnership</a> е, че на 1-ви март сме предали отговор какъв е напредъка на България. През целия февруари предупреждавах многократно, че е повече от препоръчително да изпратим няколко кратки параграфа. Сега на <a href="http://www.opengovpartnership.org/countries/bulgaria" target="_blank">сайта</a> на OGP може да се види линк към Strategy.bg и кратко обяснение, че у нас тече дебат. </p>
<p>В интерес на истината е имало неформални срещи с НПО-та. Вероятно от типа на разговора ми с Бъчварова през януари. На 28-ми март имаше среща на Съвета за развитие към Министерски съвет, където са били обсъдени отворените данни. Преди тази среща изпратих на посочения от тях мейл <a class="pdf_link" href="http://yurukov.net/blog/wp-content/uploads/2012/04/OGP_predlojeniq_mart12.pdf" target="_blank">обобщение на предложенията ми по темата</a>. Изпратих и линк към тези, които <a href="http://yurukov.net/blog/2012/01/06/kakvi-danni-iskate-ot-dyrjavata/">вие дадохте през януари</a>. За техническите предложения и другите ми идеи <a href="http://yurukov.net/blog/2012/02/20/poseshtenieto-na-klintyn/">писах по-рано</a>. Надявам се поне тези за бюджета, престъпността и регистрите да бъдат взети под внимание &#8211; това са най-важните данни на първо време.<span id="more-11696"></span></p>
<p>От информацията, която имам, срещата е минала добре и в средата на април може да очакваме план. Надявам се да не е окончателен вариант, а да бъде подложен на допълнителна дискусия. Консултационният процес не е задължително да става с официални срещи с НПО-тата, кръгли маси и конференции. Достатъчно е да има платформа като споменатия горе сайт. Процесът обаче трябва да е <strong>прозрачен</strong> и всички предложения да се публикуват, за да e ясно какво е взето под внимание, какво &#8211; не и защо. Ако този елемент на прозрачност не бъде налице, всичко след това ще се опорочи. Така, например, може да погледнете резултатите от консултациите в Канада и Словения. В Дания ще излязат до края на месеца.</p>
<p>Тъй като вероятно сте забелязали, че напоследък пиша все повече по темата за отворените данни, мисля, че вече е време да се отдели всичко в нов блог. За целта ми трябват обаче още автори, така че ако някой е навит &#8211; пишете. Спомням си, че Бого беше направил такъв сайт преди време, но тогава не бях толкова запален. Сега мога да отделя <a href="http://yurukov.net/blog/?s=%D0%BE%D1%82%D0%B2%D0%BE%D1%80%D0%B5%D0%BD%D0%B8+%D0%B4%D0%B0%D0%BD%D0%BD%D0%B8">всички статии за open data</a>, да споделяме повече линкове и кратки новини. Ще пиша по-късно в BrainstormMonk за идеята ми да видим дали някой ще се навие. </p>
]]></content:encoded>
					
					<wfw:commentRss>https://yurukov.net/blog/2012/ogp-novini/feed/</wfw:commentRss>
			<slash:comments>7</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">11696</post-id>	</item>
	</channel>
</rss>

<!--
Performance optimized by W3 Total Cache. Learn more: https://www.boldgrid.com/w3-total-cache/?utm_source=w3tc&utm_medium=footer_comment&utm_campaign=free_plugin

Page Caching using Disk: Enhanced 
Minified using Disk

Served from: yurukov.net @ 2026-07-03 15:57:44 by W3 Total Cache
-->