Новости

Открытое государство в цифровой реальности: данные или статистика

8 июня на Петербургском международном экономическом форуме прошли публичные дебаты на тему «Открытое государство в цифровой реальности: мониторинг национальных целей». Представители госслужбы, академического сообщества и общественных организаций обсудили такую сторону цифровизации государства, как открытость информации, данных и их понятность для граждан. Что такое открытость государства и как она влияет на эффективность работы? Где взять открытые данные, чтобы измерить достижимость национальных целей и нацпроектов? Какие данные нужны экономике и гражданам: статистика или большие данные? Как принимать решения на основе данных, если их качество не вызывает доверия?   Председатель Счетной Палаты РФ Алексей Кудрин считает, что внедрение лучших международных практик по открытым данным…

«Инерционная открытость»: эксперты Счетной палаты подготовили рейтинг, посвященный открытости госструктур

Только четыре российских министерства можно назвать полностью открытыми. К такому выводу пришли эксперты из АНО «Инфокультура» и Центра перспективных управленческих решений в докладе «Открытость государства в России», подготовленном для Счетной палаты. Результатом исследования стал рейтинг министерств и ведомств. Эксперты разработали методологию, которая позволяет оценить уровень взаимодействия ведомств и граждан по трем показателям: Открытость информации – это широкий спектр правовых и коммуникационных инструментов, которыми должны располагать граждане для получения информации, находящейся в ведении государственных органов; Открытые данные – механизм получения информации (данных) от государства в проактивном режиме. Это означает, что государство публикует данные независимо от наличия запросов, то есть в автономном и регулярном режиме; Открытый…

Семантический анализ текста в неевклидовой геометрии. Видео

24 апреля состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, рассказал о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Сравнил стандартные методы нахождения векторных представлений текстов с методом, основанным на неевклидовых геометриях. Эксперт показал, как решение таких задач, как машинный перевод или анализ тональности текстов становится более точным, если сохраняется контекстное значение омонимов. Будучи математическими по своей природе, методы машинного обучения и анализа данных требуют численные величины…

Дискриминатон: большие маленькие люди

В прошедшие выходные команда Инфокультуры участвовала во II хакатоне «Новой газеты» по дата-журналистике. Заглавная тема — дискриминация по разным признакам. Участники исследовали проблемы маленьких людей с помощью больших данных.   Мы предложили задачу «Меньшинство решает за большинство: люди, которые предлагают законы — кто они», в рамках которой можно было изучить, как устроен законотворческий процесс в России, и выявить факторы, влияющие на принятие того или иного законопроекта. Открытые данные по законотворческой деятельности доступны по ссылке.   — Команда «Рубильник» представила проект «Ядерный щит Рунета» с результатами исследования того, как общество и СМИ реагировали на принятие закона о «суверенном интернете». Авторы: Ксения…

Архив Дня открытых данных-2019

2-3 марта 2019 года Информационная культура совместно с Фондом развития интернет-инициатив, Ассоциацией участников рынка данных и Комитетом гражданских инициатив провели День открытых данных в Москве. В этой публикации мы собрали презентации и видеозаписи выступлений спикеров и отдельных мастер-классов. Диалог: Открытость государства Видео Спикеры: Алексей Кудрин, председатель Счетной Палаты Российской Федерации. Кирилл Варламов, директор ФРИИ. Государство и бизнес: участники рынка данных Видео-плейлист направления Дискуссия о Национальной системе управления данными Видео. Участники: Иван Фост, руководитель направления в Аналитическом центре при Правительстве РФ; Иван Бегтин, директор Ассоциации участников рынка данных; Сергей Алимбеков, зам.директора по технологическому развитию ФРИИ. Модератор — Василий Буров, член экспертного…

Реестр субсидий: качество данных о распределении 16 трлн руб.

Распределение субсидий происходит без объявления аукциона или тендера — госорганы решением Правительства или самостоятельно определяют, кто сколько средств получит и на что их сможет потратить. На федеральном уровне “Реестр соглашений о предоставлении субсидий федерального бюджета” (реестр субсидий) публикуется на Едином портале бюджетной системы (ЕПБС). Он содержит сведения о субсидиях, субвенциях и иных межбюджетных трансфертах бюджетам субъектов РФ, юрлицам и ИП. Мы изучили структуру реестра и представленные данные и выявили ряд особенностей, которые нужно учитывать при подготовке аналитики. Впрочем, сразу нужно отметить, что благодаря Федеральному Казначейству и Минфину России на федеральном уровне данные о субсидиях машиночитаемые и регулярно обновляются, в то…

Открытые НКО: перезапуск проекта

«Открытые НКО» — это портал, где собраны в удобном виде различные данные о деятельности российских некоммерческих организаций (НКО) и их государственном финансировании. В обновленной версии проекта мы значительно расширили состав источников данных. Нам удалось сопоставить данные из Единого государственного реестра юридических лиц (ЕГРЮЛ) с реестром Минюста России, сравнение их баз данных по некоммерческому сектору тянет на отдельное аналитическое исследование. Теперь база данных проекта учитывает также данные бухгалтерских балансов Росстата, данные об арбитражах и исполнительных производствах, контракты, федеральные субсидии и гранты. Также мы улучшили интерфейс поиска, так как обогащение базы данных дало нам возможность добавить новые фильтры. Иван Бегтин, директор АНО «Информационная культура»:…

Инфокультура подводит итоги и поздравляет с наступающим Новым 2019 годом

Инфокультура подводит итоги 2018 года. Мы составили для вас дайджест с полезными ссылками, где представили все основные результаты проектов. Госфинансы Проект КГИ “Госзатраты” запустил бета-тестирование раздела “Субсидии”, в котором можно получить данные о всех федеральных субсидиях, их распределителях и получателях. Мы разработали несколько новых аналитических инструментов: расширение для браузера Google Chrome для получения данных о госзаказчиках в один клик; телеграм-бот (@csDownloaderBot) и скрипт для выгрузки контрактов по заданным параметрам, телеграм-бот для получения статистики об участнике госзаказа по ИНН; телеграм-канал с самыми дорогими контрактами по отраслям (@clearspending); а также “научили” читателей, как “быстро разбогатеть на госзакупках”, выпустив перевод англоязычного руководства; подготовили…

5 самых популярных лекций Инфокультуры в 2018 году

В 2018 году Информационная культура провела большое количество просветительских лекций и мастер-классов, посвященных различным аспектам работы с открытыми данными. Мы продолжили наш цикл дата-сред, организовали лекторий для некоммерческих организаций, провели различные мероприятия в рамках Дня открытых данных и проектов КГИ «Госзатраты» и «Открытая полиция». Специально для тех, кто не успел посетить наши мероприятия очно, мы сделали подборку 5 лекций 2018 года, которые стали самыми просматриваемыми на нашем youtube-канале. Дата-среда «Город и пространственные данные» Егор Котов, научный сотрудник ВШУ, провел мастер-класс по предобработке пространственных данных адресного реестра с портала data.mos.ru. На мастер-классе подробно разбираются следующие вопросы: где скачать предобработанные данные портала…

Госзатраты: Телеграм-бот для получения данных о госконтрактах

Проект КГИ «Госзатраты» разработал телеграм-бота и скрипт для быстрой выгрузки контрактов по заданным параметрам. Чаще всего к нам поступают запросы исследователей и журналистов на подготовку разных выборок данных. Например, “прислать все контракты Ленинградской области за 2017 год”, “найти все контракты на закупку молока по 44-ФЗ” или “выгрузить контракты дороже 1 млрд рублей”. Теперь нужные вам данные вы можете выгружать самостоятельно, используя телеграм-бот или запуская скрипт в командной строке. Для получения интересующих данных нужно заполнить файл-шаблон параметрами (можно указать, например, регион, ФЗ, диапазон суммы, диапазон дат заключения контрактов и т.д.), отправить его телеграм-боту @csdownloaderbot и указать почту, на которую будут отправлены…