През февруари една новина обиколи медиите – БАН разработва система за ранно предупреждаване за замърсен въздух в София. Беше обявено дори, че суперкомпютър ще бъде използван в симулациите. Наскоро пък стана ясно, че системата е била вече готова, но от община София не пускали информацията. По думите на Фандъкова – за да не задаваме много въпроси за мерките.
Притесненията ѝ са основателни. Мерките се оказаха добри на хартия, но умишлено разписани така, че да не се прилагат. Изискванията за това кога следва да реагира общината нямат много общо със ситуацията в града и динамиката на замърсяването. Изглежда ключова роля ще изиграе и въпросното ранно предупреждаване на БАН.
Що се отнася до самата система, по всичко личи, че е „като по поръчка“. Всъщност точно за нея Фандъкова надали може да има някакви притеснения. Първите данни излязоха на 14-ти и съдейки по тези няколко дни, на общината няма въобще да им се наложи да изтупат (метафорично) прахта от папката с гласувани мерки.
Първият проблем със системата е, че дава прогноза на база ден – от 0:00 до 23:59. Преценяват колко ще е средната стойност и показват цвят. Виждате я горе. Не знам какъв суперкомпютър използват, но така създадена системата има шанс около 50 на 50 да познае. Причината е, че средно за който и да е ден рядко нивата надвишават 100. Обикновено са около 40-80 през зимата. Сутрин и вечерно време превишават за няколко часа между 3 и 10 пъти критичната граница, а през останалото време падат под нея.
Всъщност, ето ви алгоритъм, с който ще постигнете абсолютно същия резултат като системата на БАН
- Ако на даденото място температурата ще е под 5°, покажи жълто
- Ако температурата ще е под 5° и има шанс за мъгла през по-голямата част от деня, покажи оранжево
- В противен случай покажи зелено
Това е. Други възможности няма. Всеки може да ги разбере по прогнозата на времето. Тази система за предупреждаване щеше да е полезна, ако имаше разбивка по часове или поне на 4-6 часови интервали. Приложения като Plume го правят вече и то доста успешно.
Друг проблем с тази система е, че дори цветовете бърка. Поне за първият ден, за който резултатите са публични. Тъй като от две години свалям по часове данните за замърсяването на София, извадих стойностите за 15-ти. Горе се вижда, че според БАН само в Хиподрума нивата ще са над 50. Не казват колко. От станциите на ИАОС обаче виждаме друго – в Надежда и Павлово нивата са също над границата от 50 и дори по-високи от тези в Хиподрума. В Младост ситуацията в същата, но БАН не ги включва в прогнозите.
Ето тук съм показал движението на нивата през деня. Вижда се, че през почти цялата светла част от деня, когато хората са навън и (предимно) дишат, нивата са над критичната норма. За няколко часа в Надежда и Павлово нивата са били два и три пъти отгоре. Ето такава прогноза би била полезна, а не цветове показващи нещо, което всеки може да си предвиди за следващия ден от прогнозата за времето.
В първия ден са познали за Дружба, Хиподрума и Копитото. Последното обаче не се брои, защото там нивата никога не минават 15. Значи 50% успеваемост или колкото, ако хвърляте монета. Е, да не споменавам, че Дружба е на границата с 45, но както и да е. Ще свалям и тези данни за в бъдеще, за да направим по-добра съпоставка доколко има смисъл от системата. До тук обаче нищо не ни вдъхва доверие, че в неделя и понеделник всичко ще е чисто, както твърдят.
Данните ми от станциите за последните две години ще намерите тук. На airsofia.info ще намерите информация от лични станции. В графиката горе липсват данни от станцията на Надежда, защото не подава такива от 17 часа вчера до 8 часа днес.
Доста наивно си сметнал алгоритъма. Не смяташ релеф, микроклимат, вятър, налягане, влажност… Именно поради тия фактори прогнозите за времето са толкова сложни.
На времето – да. На праховото замърсяване средно за квартал или град – не. Особено като вече имаш прогнозата на времето и историческите данни за същите тези сензори и можеш да направиш доста добра корелация между температура, влажност, атмосферно налягане и образували се мъгли. Само на база тези параметри може да се тренира алгоритъм да предвижда нивата по часове и някои вече го правят. Тук БАН показват просто дали сензорът ще е под или над квартала средно за целия ден, което може да се познае повече от лесно.
Да обобщим – има един таблица в jpg заровена дълбоко в страница на общината, която показва някакви цветове за един от факторите за мръсен въздух за два дни напред за четири 4! квартала в София. Това е.
Ако в общината ползват чужд език и интернет да отворят страниците на две-три столици в Европа и ще видят:
– Интерактивни карти с възможност за търсене по пощенски код
– Информация за различни замърсители на въздуха
– Състоянието на въздуха в интервали от няколо часа, за да могат хората да вземат мерки веднага
– Визуализация спрямо опасни нива на замърсяване, примерно чрез графики
– Мобилно приложение за лесен достъп
– Абонамент за предупреждение по имейл, СМС, през браузъра, и активно публикуване в социални мрежи тъй като хората нямат време да отварят некадърната страница на общината
– Съвети и препоръки какво да се прави
– Историческа информация
– Отворен API, за да може който желае да работи с данните.
Аз бих се срамувал да публикувам такава информация, освен ако не исках да хвърлям прах в …гърлата на хората.
Това е парадокс! В София вече няма индустриални предприятия : Кремиковци, Балканкар, Химимпорт, БДЖ…, но въздухът е мръсен защото има 2 милиона европейски возила по норма Евро 2-6, и 2000 открити басейни, отопляеми на дърва , още 30 хиляди братски ромски къщи отопляващи се чрез горене на стари авто гуми…. Вижте защо гр. София се нарича София и защо за около 100 години се превръща в помийна яма. Защо е столица на държавата и в същност столица на какво е, престъпност, корупция, селяндурщина, място, където пошлостта се обезличава в полза на малограмотните политици .
На всичкото отгоре, снимките на „системата“ видимо се правят на ръка.