Иван Бегтин о том, зачем всем нужны открытые данные

Общественный деятель
Директор Некоммерческого партнерства "Информационная культура"

Иван Бегтин - учредитель и директор АНО «Информационная культура», один из ведущих российских экспертов в области открытых данных (OpenData) и открытого государства (OpenGovernment).

АНО «Информационная Культура» занимается развитием и популяризацией концепции открытых данных и открытого государства; предоставлением методологической, технической и институциональной поддержки государственным структурам и обществу по внедрению эффективных инструментов разработки и использования открытых данных для открытого государства; вовлечением общества в процесс принятия решений государственными структурами на муниципальном, национальном и международных уровнях; повышением гражданской информированности и информационной культуры общества.

Что такое открытые данные?

Открытые данные – это такая, я бы сказал, специальная форма представления информации, когда с ней может работать не только человек – прочитать со страницы, увидеть в виде картинки – но с ней может работать и компьютер. Когда компьютеры подключаются к сети Интернет, когда компьютеры что-либо считают, когда вы что-то делаете в программах типа Exсel, это всё работа с данными, т.е. это всё работа со специальной формой представления информации, которая ещё называется машиночитаемой. И открытые данные – это та форма машиночитаемой информации, которая является общедоступной, т.е. доступной каждому, любой может её использовать.

Я приведу конкретный пример. Предположим, в вашей компании есть бухгалтерия или кадры, это тоже машиночитаемая информация, о каждом человеке заведена карточка. Но это не общедоступная информация, это не общедоступные данные, потому что они классифицированы как персональные, как личные, они содержат информацию коммерческой тайны, они не публикуются. Это не открытые данные, но это данные.

А если, например, государство финансирует измерение погоды, финансирует мониторинг экологической обстановки, финансирует какой-либо большой крупный общественный проект или создаёт что-либо ещё, например, ведёт реестр больниц, реестр аптек, то эта информация создаётся на государственные деньги, а значит на деньги налогоплательщиков. Эти данные считаются открытыми, они должны быть общедоступны, потому что они созданы на наши с вами деньги, не содержат коммерческой тайны, не содержат личной информации, гостайны или чего-либо другого. Открытые данные – ровно тот тип данных, которые я приводил в пример, то, что создано на общественные деньги, либо кем-то волевым образом опубликовано и сделано общедоступным.

Почему вы стали заниматься открытыми данными?

Одной из важных причин для меня было то, что этим никто не занимался. Я уже начал заниматься этой темой, когда уже было определение открытых данных, где-то с года 2009. Тогда в мире стали появляться порталы открытых данных, государственные американские, британские – Data.gov, Data.gov.uk. А в России этим не только никто не занимался, все были уверены, что в России это невозможно делать. И поскольку я изначально с данными работал довольно давно, только с данными, которые не были открытыми, то мне тогда показалось, что это просто полезно. Я сделал первый такой проект Opengovdata.ru, увидел довольно много скепсиса, довольно много сопротивления со стороны чиновников и людей, считавших, что в России это невозможно. Думаю, что мой первоначальный интерес эти сомнения и подстегнули. Если ты считаешь, что что-то невозможно, то это повод сделать.

Сейчас у открытых данных есть большое сообщество, есть компании, заинтересованные в открытых данных, большие группы общественников, активистов, журналистов. Сейчас это часть экосистемы. Конечно, мои интересы за эти годы значительно расширились, помимо открытых данных я занимаюсь многими другими темами. Но открытые данные остаются корневой (темой), потому что если мы делаем, например, проект по открытости некоммерческого сектора, мы не можем его сделать, не имея данных Министерства юстиции, Налоговой службы, данных по госконтрактам, по субсидиям, по грантам. Если мы делаем проект по открытости образования, мы не можем его делать, не имея данных по качеству каждого вуза, каждой школы, каждого детского сада. Если мы делаем общественный проект по мониторингу медиа или по мониторингу качества здравоохранения и многого другого, это всё не возможно без открытых данных. Да, коммерческий проект сложнее, его можно делать без открытости, общественные невозможно. И поскольку все эти годы общественными проектами я тоже занимаюсь, то открытые данные были и остаются одной из ключевых тем, без которой они просто невозможны.

Какие проекты невозможны без открытых данных?

В России это наш проект «ГосЗатраты» - проект Комитета гражданских инициатив по раскрытию информации о всех госконтрактах. Это такой тип проектов, которые есть не только в России. Например, похожий проект есть в Словакии, есть проект в Соединённых Штатах, есть международный проект Openspending.org. Есть много локальных страновых проектов и даже проектов на уровне городов, которые повышают прозрачность расходования государственных средств. Безусловно, это важная ценностная история про то, как государство расходует деньги. Это должно быть понятно и доступно каждому гражданину, из чьих налогов, из чьих прямых или косвенных трат формируется государственный бюджет. Это один из важнейших проектов.

Я бы выделил проект порталов по открытым данным, потому что они довольно сильно расширяют аудиторию, с которой работают журналисты, активисты, общественники. В России есть федеральные порталы, региональные, есть наш общественный портал «Хаб открытых данных» ( hub.opengovdata.ru ). В мире таких проектов больше двух тысяч, и многие из них вообще существуют не на уровне страны, а на уровне университета, на уровне конкретной организации.

Есть порталы, созданные некоммерческими организациями, публикующие данные о раскрытии их деятельности. Очень много исследовательских ресурсов.

Третьим я бы назвал целевые проекты, созданные, порождённые от самой экосистемы. Это не конкретный проект, а некоторая плеяда проектов, можно сказать, отраслевых взглядов – проекты по открытости школ, в России ли, в Мексике ли, похожие проекты есть в Великобритании, в Соединённых Штатах; проекты по визуализации муниципальной статистики, муниципальных данных; проекты по открытости НКО, открытости медиа, их огромное количество. Это целая плеяда, я бы сказал, тип проектов, когда мы берём конкретную тему и из разрозненных источников собираем о ней всю доступную информацию, всё, что по ней есть.

О влиянии открытых данных на жизнь обычных людей

Каждого простого человека открытые данные затрагивают не напрямую. Они являются некоторым косвенным отчасти инструментом, который создает экосистему для возникновения новых проектов. Я приведу пример. Каждого человека затронет проект, который касается качества школ. Есть проект «Открытые школы», это один из финалистов конкурса BudgetApps, в котором ровно эта задача решалась. Были собраны школы по Москве, Калининграду, Барнаулу, ещё многим другим городам. Есть похожие проекты в Саратове, которые тоже анализируют школы. Есть похожие проекты в других областях. Это проекты для конечного пользователя. Вы можете зайти (на сайт), посмотреть профиль школы, сравнить с другими, понять, стоит ли вам отправлять вашего ребёнка или нет. Это проект, который несёт действительно некую финальную пользу, повышает вашу грамотность, понимание, повышает доступность информации, на основе которой формируется качество вашей жизни. Но при этом все эти проекты возможны только благодаря тому, что есть открытые данные. Проект «Открытые школы» использует данные реестра бюджетных учреждений, данные по госконтрактам, по средним баллам ЕГЭ и многих другим факторам. Он был бы невозможен при отсутствии этих данных. Безусловно, рядовой гражданин не пойдёт на портал открытых данных, не будет выкачивать эту информацию, потому что она не сконвертируется, не превратится в то, что изменит его жизнь. Но он будет потребителем тех проектов, которые на основе этого возникают.

И здесь вопрос открытости данных, вопрос того, что для подобных проектов порог входа значительно снижается. Например, есть проекты по мониторингу погоды. Почему мы сейчас считаем, что можем узнать состояние погоды в любой момент? Вам не нужно заходить на специальный сайт, платить несколько сотен рублей, чтобы узнать, какая температура у вас за окном. Это является абсолютной нормой, я могу это узнать, потому что есть много государственных агентств, которые мониторят погоду по всему миру и предоставляют эту информацию, она является общедоступной.

Как измерить пользу от доступности? Вы узнаете информацию в любой момент, вам не надо платить за это деньги. И это касается всех открытых данных. Вы получаете информацию не напрямую из госоргана, а через огромное количество организаций, которые вам её доставляют, но приобретают свою выгоду каким-то иным образом.

Аналогичным образом можно привести в пример то, что мы считаем естественным знать курсы валют. Мы заходим на сайт Центрального банка и всё это узнаём, или на сотнях сайтов, разбросанных в сети Интернет. Аналогично здесь мы считаем нормой, что эта информация открыта. Это и есть открытые данные, которые в специальном формате передаются из системы, где они фиксируются, соответственно это биржа или Центральный банк, и транслируются по огромному количеству других ресурсов. Это тоже напрямую влияет на качество вашей жизни. Если бы вы курсы валют не знали, если бы вам пришлось за них платить, то вы бы теряли намного больше денег по сравнению с теми, кто знал бы это наверняка.

Нужна ли специальная подготовка для работы с открытыми данными?

Есть несколько способов вовлечения во всю эту тему и один из них – это, безусловно, наличие технических компетенций, т.е. возможность работать с базами данных. Но ими не ограничивается. Дело в том, что появляется всё большее количество инструментов, особенно инструментов визуализации, которые требуют от вас навыков владения Excel и некоторых базовых навыков работы в интернете, когда вы пользуетесь специальным сервисом визуализации для отображения информации. Это тоже использование открытых данных.

Например, мы таким образом учим дата-журналистов. Есть магистерская программа в Высшей школе экономики, которая готовит таких людей. Их всё же обучают небольшим техническим навыкам, но главное не это, а главное – понимание, как данные устроены. Поэтому одно из очевидных применений - это те области, которые этих навыков не требуют. Но, безусловно, открытые данные можно использовать и иначе. Отсутствие технических навыков можно компенсировать наличием понимания, что вы хотите получить. Большая часть проектов в открытых данных сформирована людьми, которые сочетают в команде компетенции понимания предметной области и владение технологическими инструментами. Поэтому, если вы хотите что-то делать, чтобы было более-менее технологично, для вас даже важнее не навык делать это самостоятельно, а уметь ставить задачу, объяснять, коммуницировать с теми, кто непосредственно это реализует.

Могут ли открытые данные помочь в профилактике инсультов или в зоозащите?

Да, безусловно. При этом надо понимать, что открытые данные для принятия решений, для понимания ситуации пригодны всегда, а для изменения ситуации они пригодны вместе с какими-либо дополнительными мерами. Если мы говорим про профилактику инсультов, то, например, в Великобритании была практика публикации департаментом здравоохранения информации об успешности операций на сердце по всем больницам. Многие люди действительно стали принимать решения о том, куда госпитализироваться, на основе этой информации. Это был один из успешных примеров внедрения открытых данных. Здесь данные влияли непосредственно на принятие решения. Но это было возможно благодаря тому, что департамент раскрывал фактически не собственные данные, большая часть клиник были частными. Между тем в России получить медицинскую статистику по заболеваемости или чему-либо ещё даже на уровне региона довольно трудно. Эта проблема порождена другой проблемой – тем, что вся медицина в России государственная, и при раскрытии этой информации министерством здравоохранения либо департаментами субъектов считается, что они измеряют не качество больниц, а как бы измеряют качество своей работы, потому что они же этим управляют. Отсюда у нас возникают проблемы с доступностью ряда данных и возможностью принятия решений, подменой статистики.

С другой стороны, если, например, картина, формируемая на данных, приводит к принятию каких-либо решений, опять же на их основе, тогда, безусловно, история с зоозащитой может быть разная. Например, данных сейчас нет, но они могут формироваться через Интернет вещей, который активно внедряется в сельском хозяйстве, активно подключается к домашним питомцам, через это получить информацию о состоянии животного, что с ним происходит. Безусловно, это некоторое сочетание данных, которые частично могут быть открытыми, и современных технологий, которые позволяют внедрять датчики, сенсоры в жизнь животных, людей, кого угодно ещё.

Я хочу сказать, что открытые данные – это не панацея, они не могут быть решением всех проблем. Это маленькая, по сути, часть трансформации общества, которая является частью глобальной темы данных в принципе, в том числе данных, которые не могут публиковаться в открытом доступе, но тем не менее затрагивают нашу жизнь, являются очень персональными, личными, какими-либо ещё.

Кто отвечает за открытые данные?

В мире это устроено довольно сложно, немножко по-разному, но есть общие принципы. Общие принципы, например, про государственные данные в том, что там нет понятия «открытые данные» как отдельной темы, отделённой от данных государства в принципе. Открытые данные, по сути, – продолжение государственной дата-политики, потому что она включает, например, кроме открытия данных ещё и закрытие части данных, которые относятся к личной жизни граждан, работе с коммерческими данными, раскрытие части информации только для бизнеса, раскрытие части информации только по требованию заявителя или, наоборот, жёсткое закрытие ряда информационных источников в тех случаях, когда это угрожает интересам общества либо конкретным компаниям. Поэтому в мире есть такая должность, которая называется Chief Data Officer (директор по данным). Это люди, которые отвечают за политику работы с данными в конкретном ведомстве. Например, в Индии такие лица есть в каждом штате и в каждом ведомстве. В Соединённых Штатах они есть во многих ведомствах, но не во всех, это вопрос, скорее, общей госполитики. В других странах это меняется, иногда это те, кто так и называются Chief Data Officer, иногда это Chief Information Officer (CIO), у которого в принципе похожие функции.

В России ничего такого нет, у нас нет Chief Data Officer на уровне страны, нет Chief Data Officer на уровне конкретных ведомств. И, соответственно, вся тема открытых данных, с одной стороны, у нас развита, с другой стороны, не имеет достаточной фундаментальной опоры в виде внутренней госполитики.

Об «Информационной культуре»

Когда мы основали «Информационную культуру» в 2012 году, у нас была основная идея – помогать России как государству и как обществу во всём, что касается открытости государства. И темы, которые мы погружали тогда в себя, их было достаточно много. Это и тема краудсорсинга, и понятности русского языка, его простоты при использовании в официальной речи, и, безусловно, тема открытых данных.

За эти годы так сложилось в ходе развития всего, что мы делали, что тема открытых данных стала одной из основных. Мы продолжили заниматься темой понятности, например, в проекте «Открытая полиция», который тоже проект Комитета гражданских инициатив. Понятность стала одним из векторов его развития, мы поняли, что важно говорить не про открытость полиции, а про то, чтобы люди хотя бы понимали, как устроена правоохранительная система, иначе они не могут защищать свои права.

Кроме того, в «Информационную культуру» у нас погружена тема цифровой архивации всего, что делает наше государство, как минимум, и особо ценных ресурсов, которые в цифровом виде создаются обществом. Поэтому у нас в «Информационной культуре» такая команда единомышленников, где мы занимаемся таким довольно пёстрым спектром проектов, почти все из них основаны на данных.

Мы являемся технологической НКО, это делает нас немного отличными от стандартных некоммерческих организаций. Мы делаем технические проекты, мы публикуем данные, мы раскрываем API – программные интерфейсы, мы помогаем людям, которые используют наши проекты в том, чтобы разбираться технологических вопросах. Поэтому если коротко – мы технологическое НКО.

О проектах «Информационной культуры» для обычного человека

Безусловно, «Госзатраты», которые я уже упоминал; безусловно, «Открытая полиция», и безусловно, вот сейчас всё более набирающий обороты проект «Открытые НКО».

О сотрудничестве с «Информационной культурой»

Мы заинтересованы во всех, кто использует данные из наших проектов в своих. Т.е. если вы хотите сделать проект «Открытые школы Саратовской области» или «Открытые больницы Челябинска», или что-либо ещё, мы можем вам помочь в том, чтобы это реализовать, предоставив данные, интерфейс и описание, как это всё реализуется.

Безусловно, мы заинтересованы во всех партнёрах, которые заинтересованы опубликовать свои данные, особенно некоммерческие. У нас есть проект, который называется «Data NGO». Мы поощряем, помогаем, выступаем в роли ресурсного центра для всех некоммерческих организаций, готовых раскрывать собственные данные и рассказывать, как с ними работать, мы помогаем им в этой работе также.

Мы заинтересованы во всех партнёрах, которых интересует реформа правоохранительной системы, обеспечение понятности, открытости. Мы готовы к сотрудничеству. У нас на сайте есть раздел «Проекты», где их довольно много перечислено. По каждому из проектов мы готовы к взаимодействию.

Книга для повышения личной эффективности

Я боюсь, что мои предпочтения по книгам довольно своеобразны. Но я рекомендую почитать Джона Фаулза «Аристос», но желательно после Библии.

Девиз Ивана Бегтина

Лучше проверенный чёрт, чем непроверенный ангел.

Самый полезный совет в жизни

Никогда не сдавайся! Если надо сдаваться, притворись, что сдаёшься, а на самом деле продолжай дальше.