Реестр субсидий: качество данных о распределении 16 трлн руб.

Распределение субсидий происходит без объявления аукциона или тендера — госорганы решением Правительства или самостоятельно определяют, кто сколько средств получит и на что их сможет потратить. На федеральном уровне “Реестр соглашений о предоставлении субсидий федерального бюджета” (реестр субсидий) публикуется на Едином портале бюджетной системы (ЕПБС). Он содержит сведения о субсидиях, субвенциях и иных межбюджетных трансфертах бюджетам субъектов РФ, юрлицам и ИП.

Мы изучили структуру реестра и представленные данные и выявили ряд особенностей, которые нужно учитывать при подготовке аналитики. Впрочем, сразу нужно отметить, что благодаря Федеральному Казначейству и Минфину России на федеральном уровне данные о субсидиях машиночитаемые и регулярно обновляются, в то время как на региональном уровне они публикуются не в полном объеме и фрагментарно.

Как публикуется реестр на портале ЕПБС?

Реестр федеральных субсидий публикуется на портале ЕПБС (budget.gov.ru/rs) в виде веб-интерфейса, предоставляющего возможность просматривать карточки субсидий,  осуществлять поиск по ним и скачивать файлы по сформированным выборкам. Помимо этого для разработчиков доступен API и подробная документация о структуре данных (которая была актуализирована менее чем за 10 дней после запроса в Казначейство России).

Данные о субсидиях обновляются ежедневно и дополняются прикрепленными файлами с сканами или текстами договоров или соглашений о предоставлении субсидий, дополнительных соглашений и платежных поручений. В некоторых субсидиях файлы с текстами соглашений отсутствуют или могут быть пустыми.

Всего на момент подготовки статьи были доступны данные о 94 125 субсидиях, выданных 189 «распределителями». В них входят ГРБС, главные управления МЧС, суды, относящиеся к Судебному департаменту при Верховном Суде РФ, аппараты Государственной Думы и Совета Федерации Федерального собрания. Сумма всех субсидий, доступных в реестре, — 15,89 трлн руб. Период, за который доступны данные, не очевиден – реестр субсидий публикуется с 2015 года, но некоторые опубликованные субсидии были заключены раньше, например в 1995 году, и по ним до сих пор могут выделяться средства регионам.

Мы агрегировали данные до ГРБС и собрали статистику о сумме и количестве распределенных субсидий. Выяснилось, например, что 6 ГРБС распределили 41% от суммы всех субсидий, а количество субсидий, распределенных Минобрнауки России (включая Министерство науки и высшего образования РФ) и Минпросвещения России составляет 21%. Подробные данные доступны в таблице. При их анализе нужно учитывать, что субсидии могут быть многолетними, то есть если в соглашении о субсидии указана определенная сумма, нельзя автоматически считать, что она вся уже поступила к получателю, например, сумма субсидии с реестровым номером 32118P01000005 составляет 25 млрд руб., но только 8,9 млрд руб. должны быть перечислены в 2018 году (из них 7 млрд руб. перечислены на момент подготовки статьи).

Правила ведения реестра субсидий, его размещение на портале ЕПБС, а также состав размещаемой информации регулируются Приказом Минфина России от 27.12.2017 № 263н, поэтому оперативно (например, по предложениям разработчиков) его структура не может быть изменена.

Особенности структуры данных

Основной задачей, которую мы ставили при работе с реестром субсидий, было создание базы данных субсидий и профилей распределителей и получателей. Несмотря на структурированный формат публикации данных, решение этой задачи было трудоемким (и частично невозможным) в связи с следующими особенностями данных:

1. Отсутствие в Реестре субсидий унифицированых кодов организаций (в данном случае ГРБС) из Сводного реестра (Реестра участников и неучастников бюджетного процесса). Этот код является основными идентификатором для данных, опубликованных на портале ЕПБС, и его использование предполагается для интеграции данных реестра субсидий, сводного реестра и реестра госзаданий. Согласно документации Сводного реестра, код организации должен состоять из 8 символов, хотя у ~48 тысяч субсидий этот код пятизначный. Например, при запросе по коду “00100092” API выдает 393 субсидий, а по запросу “00092” — 527. Всего субсидий у Минфина России на момент исследования было 920.

2. Субсидии могут быть многолетними, но восстановить суммы перечислений по годам является нетривиальной задачей. Связано это с тем, что данные в реестр соглашений передаются из двух подсистем с разными структурами графиков перечислений и сохраняются в двух блоках, один из которых долгое время использовался, но не был задокументирован. Кроме того, реестр оперирует относительным понятием ”текущий год”, установление которого затруднительно, особенно в случае с соглашениями, действие которых уже закончилось.

3. В субсидиях, также как и в госконтрактах, может быть несколько получателей средств, но машиночитаемые данные ни в том ни в другом случае не содержат информацию о том, как были распределены средства между получателями одной субсидии (или контракта). Единственный способ узнать об объемах финансирования каждой организации — это проанализировать номера лицевых счетов организаций в прикрепленных сканах платежных документов, но, например, для субсидии с реестровым номером 33317003001Я99 это сделать непросто, т.к. она содержит более 2500 файлов.

4. В данных о распределителях и получателях субсидий используются коды и наименования регионов, которые не всегда соответствуют общероссийским классификаторам, например, в субсидии с номером 07416200000046 в регионе получателя указана “Новосибирская область” с кодом “51”, а в регионе ГРБС — “Москва” с кодом “73”. Верными в подобных случаях являются наименования, которые, к тому же, не унифицированы. Впрочем, наименования бюджетов, встречающиеся в данных о межбюджетных трансфертах, также не привязаны к классификаторам и не унифицированы.

5. В реестре субсидий также содержатся данные о предоставлении межбюджетных трансфертов субъектам РФ. В некоторых случаях в соглашениях указано, что субсидия выдается не конкретному региональному органу власти, а региональному правительству. В таких субсидиях часто указывается два получателя — региональное правительство, и, например, региональное министерство финансов (или любое другое, в зависимости от назначения субсидии). Данные о региональном министерстве обычно указываются корректно, а вот в реквизитах региональных правительств, не являющихся юрлицами, может быть указано все что угодно — например, в субсидии 09218P4E000001 ИНН и КПП Правительства Алтайского края заполнены нулями, в других случаях в реквизитах Правительств могут дублироваться реквизиты министерств. Таким образом, на сегодняшний день структура реестра субсидий не позволяет без ручной обработки определить количество получателей, составить их реестр или посчитать полученные получателями средства.

Раздел “Субсидии” на сайте проекта “Госзатраты”

Данные реестра федеральных субсидий и Сводный реестр были использованы для разработки раздела “Субсидии” (sub.clearspending.ru) на сайте проекта КГИ “Госзатраты”. По сравнению с веб-интерфейсом реестра, опубликованным на портале ЕПБС, были добавлены следующие функции:

  • Сформированы профили получателей и распределителей (с возможностью поиска по ним и с добавлением агрегированных данных соответственно о получателях и субсидиях);
  • добавлены связи между организациями, представленными в Реестре субсидий с организациями, представленными в реестре контрактов (ЕИС в сфере закупок) в виде ссылок на карточки заказчиков на сайте “Госзатраты”;
  • добавлена возможность формировать ссылки на карточки субсидий;
  • добавлены дополнительные поля, содержащие исправленные значения о перечислениях;
  • генерация открытых данных по получателям, распределителям и субсидиям.

Рекомендации по публикации данных о субсидиях

При публикации данных о субсидиях (как и других данных о государственных финансах) необходимо:

  • обеспечить заполнение атрибутов распределителей и получателей (реквизиты: ИНН, КПП, ОГРН, адреса) во всех случаях, где эти атрибуты предполагаются структурой;
  • в целях унификации значений и избегания ошибок обеспечить валидацию данных об организациях через реестры ЕГРЮЛ и Сводный реестр или интеграцию базы с этими реестрами;
  • усовершенствовать механизмы обратной связи по техническим вопросам о качестве и структуре данных в целях повышения оперативности реагирования;
  • изменить порядок формирования реестров таким образом, чтобы он предоставлял информацию о субсидиях в разрезе получателей;
  • пересмотреть структуру хранения и представления данных, чтобы сделать ее более ясной и прозрачной;
  • своевременно актуализировать документацию к данным API (и делать это не по запросу, а по мере изменения структуры и полей).

Наличие данных о субсидиях (и в целом о госфинансах) — это отправная точка для их тестирования, использования и внесения предложений, что мы и делаем. Все особенности данных, которые были выявлены, не сравнятся с теми проблемами, с которыми мы сталкиваемся при работе с некоторыми другими государственными информационными системами (не говоря уже о том, что в отдельных отраслях, например, образовании, экологии и здравоохранении, многие данные не публикуются), поэтому мы хотим поблагодарить Федеральное Казначейство и Минфин России, а также их сотрудников, ответственных за указанные реестры, не только за данные, которые позволяют создавать проекты и проводить исследования, но и за кооперацию и готовность реагировать на обратную связь (в том числе и при подготовке данной статьи).

Авторы: Иван Бегтин, Ольга Пархимович, Анна Сакоян

Источник: Статья подготовлена для февральского номера журнала «Бюджет», http://bujet.ru/article/367299.php