Опасността от отворените данни

В този блог съм писал много за отворените данни – технологиите, ползите, конкретни проекти, напредъка в България и критика за липсата на такъв. Малко обаче се говори за опасността от отворените данни. Както многократно съм изтъквал, те са нищо повече от технологичен инструмент, а почти всеки инструмент може да се използва двояко. Те може да гарантират възможно най-голяма прозрачност, но дяволът винаги е в детайлите.

Тук ще срещнете някои от аргументите, които критиците на open data използват в старанието си да спрат реформите. С риск да им помогна с още такива, реших да събера всичко тук. Към всеки обаче съм добавил как може да се реши или защо значението му се преекспонира. Винаги ще има съпротива и неразбиране към нуждата за прозрачност и в никакъв случай едно решение не може да е перфектно. Още повече технологично решение като отворените данни. Важно е и да разберем какво значат те в сегашния контекст в България.

Риск за лични данни и корпоративна информация

Проблем

Това е едно от най-честите притеснения, когато се обсъжда темата за отворените данни. Когато се „отварят“ масиви от информация, част от тях може да съдържат лични данни или търговска информация. Ако не се внимава, чиновниците може да публикуват всичко и да създадат предпоставка за кражба на самоличност или смяна на собственост на фирма чрез измама.

Анализ

Такива коментари имаше след обсъждането на промяната на тарифата за достъп до базата данни на Търговския регистър. Тя обещава истинско отваряне на данните и възможност обикновени граждани и НПО-та да анализират информацията. В същото време обаче критиците на мярката изтъкват, че автоматичният анализ на данните ще позволи на т.н. „крадци на компании“ да идентифицират по-лесно потенциални жертви.

Има две важни точки, с които трябва да започнем. Първо, кражби на компании са се случвали доста преди публикуването на Търговския регистър. Второ, в описаната мярка не се дава достъп до повече информация, а само улеснява достъпа до вече съществуващ автоматичен интерфейс. В този смисъл потенциалните измамници няма да получат повече информация. Наистина, има вероятност да автоматизират търсенето си, но това е възможно и чрез платените сега системи за търговска информация. По-достъпните отворени данни до Търговския регистър обаче ще позволят на много други организации да следят и анализират за такива измами, което ще помогне за решаването и дори предотвратяването им.

В по-широкия смисъл, риск за личните данни съдържани в държавните информационни системи има и сега. Прилагането на принципа за отворени данни може да има само положителен ефект върху един съществуващ проблем. Всяка такава промяна изисква анализ кое може да е публично и кое не. Автоматизацията на отварянето на данни ще елиминира човешките грешки, като например забравена колона с лични адреси в Excel таблица.

Решение

Отварянето на обществени данни няма да създаде повече проблеми, но ще даде инструменти за решаването на съществуващите. Заради липсата на ясни процедури и протоколи за сигурност, досега сме ставали често свидетели на течове на лични данни. Проблемът тук не е в новата технология, а в начинът на работа до сега. Процесът на отваряне на данни може да промени това.

Друг метод за скриване на лична и служебна информация е агрегирането. Пример за това има в становището ми за новия Административен регистър, където предложих да се публикува сумата от натрупаните отпуски на служителите във всяко ведомство. При достатъчно добре избрано групиране се гарантира неприкосновеността на личността, но и че няма да има загуба на полезна публично достъпна информация.

Потенциална уязвимост в сигурността

Проблем

Тази опасност е вариация на предишната точка. Рискът е, че при автоматичните интерфейси, които предоставят възможност за справки в публична информация, може да има уязвимости. Тази възможност съществува и сега, но аргументът е, че при повече такива интерфейси, рискът за пропуски е по-голям.

Анализ

Пример за такъв пропуск е регистъра за позволенията за сеч на Агенцията по горите. Това е прекрасен пример за прозрачност въведен от последния служебен кабинет, макар и да не може да се квалифицира като отворени данни. Докато го разглеждах, забелязах определена уязвимост с базата данни. След сигнал до администраторите тя беше оправена.

Такива проблеми има винаги във всяка система и изчистването им е продължителен процес. Това обаче не може да бъде аргумент срещу автоматизирането на достъпа до обществена информация. Точно обратното – когато има хора, които се занимават точно с това и използват ресурсите активно, грешките се намират по-бързо. Това всъщност е дори аргумент в ползва на отворения код в администрацията.

Решение

За да се подобри сигурността, трябва повече прозрачност при създаването, тестването и поддържането на информационните системи. Подходът към сигурността на софтуерът сега е подобен на този на цялата администрация – крием всичко с надеждата, че никой няма да забележи дупките. Това очевидно далеч не е достатъчно с днешните технологии.

Манипулация на официалните данни

Проблем

Публикуваните справки може да бъдат манипулирани от съответните ведомства с цел прикриване на злоупотреби. Доверието в отворените данни и автоматизацията на анализа и визуализацията ще скрие тези манипулации.

Анализ

Подмяната на данни е сериозен проблем, който забелязваме и сега. Засичането ѝ е сравнително трудно, освен, ако не знаеш какво търсиш. Тук добър пример е системата за случайно разпределение на дела в съдебната система. Всички резултати от нея са публични, но отдавна се знае колко лесна за манипулиране е.

Решение

В света на отворените данни вече има решение на това и за него се изисква просто повече данни от различни източници. Автоматичната проверка ще покаже грешки в данните, но и проблеми в дефинициите и интерпретацията. Друго решение тук е автоматизирането на справките. При липсата на човешка намеса подмяната на публичните данни ще стане изключително трудна.

Манипулация на интерпретацията на данните

Проблем

Отворените данни са просто инструмент, но като такъв имат нужда от история или графика, която да изведе истинската им стойност. Основавайки се на реални данни, журналисти и НПО-та може да показват грешни интерпретации подменящи значението на информацията.

Анализ

Отново, този проблем съществува и сега. Виждаме го ясно с данните за раждаемостта. Когато псевдо-експерти, журналисти и политици искат да манипулират общественото мнение на база реални данни, то единствената надежда е отговор изтъкващ фактите. За това обаче няма нужда от реални данни – при липсата им първите винаги са си измисляли статистика.

Решение

Достъпа до повече публична информация би дал още инструменти за оборване на подобни подвеждащи изказвания. Не може да има технологично решение за липсата на етика при експерти и журналисти.

Технологична изолация на местния бизнес

Проблем

Това е опасност, която не е толкова очевидна. Информацията е сила, а отворените данни дават възможност за откриване на нови ниши и оптимизация на бизнеса. Големи корпорации със сериозен ресурс може да се възползват по-добре от публичната информация и стандартизирани egov услуги и да надделеят над местния бизнес с локалните му знания и опит.

Анализ

Този проблем може да се илюстрира със създаването и отварянето на кадастър в някои провинции на Индия. Силно фрагментираната и неформално дефинирана собственост на земята там е била пречка за големия бизнес и въпросния регистър е извадил от бизнеса много локални посредници. В България може да се направи подобен аналог с множеството фирми, които се изхранват с попълване на документи и изпълнение на конкретни задачи заради проблемите в администрацията. Друг пример у нас биха били обществените поръчки, ако и когато уведомяването и кандидатстването за тях станат изцяло електронни.

По-добрият и стандартизиран достъп до информация наистина може да помогне на компаниите с повече опит в анализа. Това е аргумент в привличането на чуждестранни инвестиции. Инструментите за анализ обаче са широко достъпни в наши дни и няма пречка за малките компании да ги използват. Точно обратното – това създава огромна технологична ниша на местно ниво. Далеч сме от универсален анализ и интеграция на данни, затова знанията и опита на местно ниво винаги ще бъде нужен. Нещо повече – малкият бизнес дори може да спечели за сметка на големите международни компании, защото ще има достъп до повече инструменти и анализи, които досега са стрували скъпи. Пример за това отново е отварянето на данните на Търговския регистър, постановлението за което все още престоява в Министерски съвет.

Улеснение за корпоративните лобисти

Проблем

Лобистки организации могат да използват същите тези инструменти за прозрачност, за да оптимизират отпорът си срещу регулаторни мерки.

Анализ

Отворените данни могат да се използват за идентифициране на проблеми в администрацията, изобличаване на корупция и проблеми при поръчки. Граждански организации могат да идентифицират рано проекти и наредби и да участват в дебатите. Аналогично обаче лобистките организации и НПО-та с непрозрачно финансиране могат да използват тези инструменти, за да оптимизират натиска си.

Пример за това може да бъдат проектите за закони и нормативни актове. Публикуването им на сайта на НС и Strategy.bg ни помага да реагираме по-рано, да задаваме правилните въпроси и да се организираме срещу корупционни практики и спорни текстове. Същото може да се направи обаче и срещу реформи заложени в тези проекти. Засичайки ги рано, тези организации може да организират кампании на дезинформация създавайки изкуствени скандали.

Решение

Отново този проблем съществува и сега. За жалост не малка част от медиите се използват като пощенски кутии за такива изкуствени скандали. Лобистки поправки и влияние се забелязват отдавана и каналите, по които получават информация за подготвени проекти, далеч не се ограничава до публично публикуваната информация. Отворените данни биха били решение именно на този проблем, защото биха автоматизирали публичността на редица процеси. Пример затова е случайното разпределение на делата, публичните консултации и обществените поръчки.

Обръщането на същия този механизъм срещу прозрачността и в полза на лобиските практики е теоретична възможност. Това само по себе си обаче няма да остане скрито, което до голяма степен ще го обезсмисли. Негативните кампании в медиите съществуват и сега и няма да се преборим с тях чрез повече публичност. Те са въпрос на медийна етика и обществено съзнание – въпроси, които не могат да се решат с технологии.

14 коментара

  1. На 10 места си написал Граждански оргизации НПО-та..

    Граждански оргизации НПО-та са инфраструктура на окупатора САЩ и ЕС.
    ЦРУ и Циониситите.

    Всичко се финансират от подобни структури които не мислят доброто на българите..

    Граждански оргизации НПО-та са форма на задкулистно управление да може ЦРУ да управлява без никой да гласува за ЦРУ..

    Подобни тайни общества са вредни са всякаква демокрация и свобда.. САЩ и Запада превърнаха демокрацията в мръсна дума , като комунизма.

  2. Бояне отново показваш завидна енергия и оптимизъм, които са повхални, но няма как да се съглася с повечето от твоите решения:
    Риск за лични данни и корпоративна информация – оповаваш се твърде много, че има хора и организации, които ще са готови безплатно да и ежедневно да наблюдават подаваните данни и ще сигнализират на силовите органи. Дали това е възможно за България, аз не се смея да залагам, по-скоро ще се улесни работата на хората, които имат материални интереси, отколкото ще доведе до нещо положително. В подобни случаи, не трябва да се действа без стабилен анализ, защото рисковете са наистина много големи. Това за отпуските не искам да го коментирам, едва ли има човек, който да бъде следен колко и кога е почивал.
    Потенциална уязвимост в сигурността – наистина контрол трябва да има, на запад имат практиката след внедряване на система, да се плаща на външни одитори да извършват анализ на кода. Подобна практика при нас, за съжаление ще генерира само повече възможности за корупция, нямаме организации, които да са доказали, че са достатъчно отговорни и честни да извършват тази дейност. При това положение външен контрол, може да доведе до положителни резултати, но все пак едва ли това е достатъчно.
    Манипулация на официалните данни – по тази тема напълно ме загуби, даденият от теб пример не защита въобще анализа ти. Излиза, че хората нарочно са оставили широко отворени врати, че да се създаде възможност от манипулация и от всеки потребител. Всички системи могат да се манипулират, все пак програмистите са подчинени на шефовете и са поставени в много деликатна ситуация. Отварянето на системите тук няма как да помогне, при липсата на цялостна стратегия за развитието на ит в администрацията. Не може да оставиш контрола над ключови системи на хора, които са поставени в зависимост от желанията на ръководителите, проблемът тук е повече организационнен.
    Манипулация на интерпретацията на данните – това винаги ще бъде правено, данните никога не са спирали и няма да спрат жълтата журналистика.
    Технологична изолация на местния бизнес – в България малките фирми нямат ресурсите, времето и експертизата да правят анализи. Все още сме доста зелени в тази област, за в бъдеще кой знае.
    Улеснение за корпоративните лобисти – примерът ти отново не е добър, нали ги накараха държавните да поддържат сайтове да качват данните от поръчките, това въобще не възпря корупцията. Моделът с обществените поръчки е грешен и трябва да се смени, за да се подобрят резултатите. Точно това е отличен пример, как само публичността въобще не е достатъчна да разреши проблема.

    Според мен целият хаус извира от липсата на ясна изразена стратегия и липсата на ангажименти и координация между отделните звена. Някакви хора пускат някакви проекти на колограм, които не са заимо свързан. Имам чуството, че администрацията се наводни с ненужни софтуери, които въобще не се използват.

  3. Боян е заблудена Офца.. Ако иска да хаби енергията и е голям програмист да се хване да блъска с хакерите Опен Сорс по някой проект..

    Не знам за какво се бори този политик ще става или слуга на Сорос в някоя фондация..

    Не Сорос и ЦРУ , Бил Гейт движат света .. Света се движи от Linux и FreeBSD хакерите промениха света и създадоха интернет..

    Хакери като Едуард Сноудън , Аснанж нанесоха най-големия удар на империята на Злото САЩ..
    Хакери ще унищожат САЩ , ЕС и Ционистите.

  4. Боян приема аплодисменти от не човеци , биороботи -роби на матрицата на ЦРУ и Ционистите..

    Каква демокрация и свобода може да има в държава колония където ДДС деклрация може да се подаде само от Windows..

    Държавата , дори Университетите са изнудвани да работят с Windows за да се плаща пари на ционистите и да се грантира вечно робство и окупация , подслушване и тормоз.


    Всеки тези биороботи зане , че е пдслушван във Фесбук , Гоогле но не търси алтернативи , и казва „Е голяма работа аз няма какво да крия“

    И вместо това Соросоидите проклети обсъждат някакви си измислени отваряне на данни ..

    Какво отваряне какви 5лв. , всичко се управлява от Окупатора САЩ..


    Корупцията и престъпността я създадоха колонизаторите Запада и САЩ за да грабят.. Нека видим къде живеят наследните на Мултигруп , в САЩ и държат парите си в американски банки и отгоре на това се управляват от американски кантори.. С една дума парите не са техни..

  5. Боко, прегледай си главата. Струва ми се, че имаш недостиг на желязо, и дъските ти яко хлопат.

  6. Вие може ди си пишете колко искате , това е моето мнение и не сте в състояние да го промените .. Знам че всеки който е против и САЩ и Соросоидите го изкарват Луд по форумите и медиите..

    Но нека да се върнем на темата ..които нямат и електронен подпис даже , т.е. никога не са ползвали електронни услуги..

    Дават се безбожни на Майкрософт за Държавната администрация.. Няма нито едно минисатерство или община която да е на Linux.. Боян сигурно взема примери от Германия но там има по някоя друга служба която е Линукс.. Като общината Мюнехен..

    Тука нека да напише за скандала на Майкрософт в Румъния , чиста корупция в която е замесена и Сименс..

    Отново пиша че голяма част от услугите дори да се през web не можеш да подадеш данни защото иска Windows.. ДДС при подаването изискава Active X контроли.. Статистиката може да се ползва само с windows и то 32 битов.. Защото системата не потдържа 64 битов акробат pdf..

  7. @Boko Glavara

    90% от потребители използват winows, въпреки това доста едвам се справят с него, linux-a е като цяло непознат и продължава да се ползва предимно от ентусиасти. Познавам няколко добри linux специалисти, но и те държат по една виртуалка с window, защото не могат да свършат всичко под linux. Въпреки това ще те кажа, че имаше една община, която мина изцяло на линукс, обаче предполагам, че общината тогава не разполагаха с много системи и рализирането на подобна промяна най-вероятно е било доста по-лесно. Подобна промяна обаче сигурно е била стартирана, от липсата на бюджет за закупуване на лицензи. За нещастие в момента повечето държавните са се набалбукали със софтуери, които работят само под windows. Админите знаят как се администрира windows среда и нямат знанията да въведат успешно linux. Лобито на Майкрософт също е силно и повечето ведомства получават някакви лицензи, естествено се ползват значително повече, но Майкрософт си затварят очите, за да не иниацират някаква промяна. Все пак е по добре да вземеш 60-100 милиона, отколкото от лакомия да вземеш 200 да загубиш всичко. При положение, че поддръжката за linux също не е безплатна, произлиза и основната причина, защо държавните нямат интерес да вкарват linux. Просто за тях си е излишна работа, за която няма да получат нищо, а и ще изисква допълнителни пари от бюджета на ведомството.

  8. В момента Бизнес потребителя , общината и банките могат да бъдат изцяло независими от операционната система всичко през Web..

    Аз работя със SAAS услуга Заплати tereza.bg , на счетоводство ползвам една ERP sistema със rdp протокол , но има и през web – Колибри..

    Когато отидеш в НАП , Бюро по труда казвам тези защото съм ги виждал в монитора всичко е през WEB единствено документите си пишат на Word..

    Така че държавната администрация никога не била толкова свободна да се откаже лесно от windows. Понеже всички се отказват от декстоп приложения .. По лесно е да потдържаш един сървър отколкото хиляди декстопи PC.

    Ползвам само Linux ползвам windows единствено по принуда от държавната администрация..

    Един добър пример Банка ЦКБ ползва OpenOffice..

    Майкрософт и ЦРУ са купили университетите в България , само соросоиди .
    Двама студенти един Нюрмберг Германия първото което правят го въвеждат да работи на Линукс .. А България в Техническия всичко на Windos .. дори и Си-то учат visual studio..

  9. @Boko Glavara

    За съжаление, не всички системи се правят по начин в който могат да работат лесно с линукс, сигурно ще намериш доста, които са съвместими предимно с една ОС. Преди години съм виждал, че Уникредит ползват Windows, все пак централата си има нужните договори и налага на клоновете да използват същия ОС за съвместимост. Най-вероятно те не плащат луди пари за лицензи, а никой голям не може да си позволи да поддръжа важна система без поддръжка. Особенно в държавните, при които няма кой да поеме риска, най-малкото защото няма кой да го стимулира, ако се спестят пари.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *