Новости

Приглашаем на хакатон DataAudit

19-20 октября 2019 года Счетная палата Российской Федерации,  Сбербанк России и АНО «Инфокультура» проведут хакатон по созданию цифровых продуктов и современных инструментов в области анализа и визуализации данных. Приглашаем к участию разработчиков, аналитиков, дизайнеров, дата-журналистов, всех неравнодушных к идеям открытого технологичного государства и управления, основанного на данных.   Участие в хакатоне дает возможность не только выиграть денежный приз, но и получить опыт решения реальных задач и создания востребованных аналитических продуктов в области государственного управления. За два дня хакатона его участники смогут создать проекты самого разного рода: расширения для браузеров, веб-сервисы, боты, аналитические модели, инфографику и медиа-проекты и проч. Подробные описания задач…

Имеет ли робот те же права на информацию, что и человек?

Публикуем видео-запись дата-среды «Сбор данных и методология парирования блокировки роботов» из цикла «Большие данные в экономике». Спикер Сергей Бершадский работал в качестве backend-разработчика и системного архитектора с такими проектами, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др. Выступление посвящено особенностям извлечения данных из сайтов, их очистке и структуризации. Сергей поделился собственным опытом веб-скрейпинга с использованием библиотек python scrapy, beautiful soup, asyncio. Сергей также разобрал методы break-the-wall на примере запросов в Yandex и Google. Это подходы, которые позволяют имитировать браузер и автоматически его использовать. Презентация опубликована по ссылке. Смотрите запись дата-среды: Организаторами дата-среды выступили АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Всем…

Онлайн-курс «Основы цифровой экономики»

Рекомендуем бесплатный онлайн-курс «Основы цифровой экономики» от Ассоциации интернета вещей и Фонда развития интернет-инициатив (ФРИИ). Он специально создан для неспециалистов, чтобы объяснить ценности и способы внедрения высоких технологий в различные сферы общественной жизни. Курс включает в себя 12 лекций, которые последовательно раскрывают теоретические аспекты цифровой экономики, а также кейсы и лучшие практики от партнеров курса. Экспертами курса выступают представители ФРИИ, организации «Цифровая экономика», ООО «ЦРПТ», Ассоциации интернета вещей, ПАО «Микрон», компании StartTrack и др. Среди рассматриваемых тем: управление данными; защита пользовательских и корпоративных данных как приоритет государства в цифровой экономике; государственно-частное партнерство в сфере IT: поправки в закон и перспективы применения;…

«Цифровой рост»: как прошел хакатон для будущих магистрантов РАНХиГС

16-22 июня 2019 года состоялся хакатон «Цифровой рост», организованный РАНХиГС, АНО «Информационная культура» и Ассоциацией участников рынка данных. В хакатоне принимали участие выпускники бакалавриата ИТ-специальностей, а также начинающие специалисты, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники  соревновались в решении задач на машинное обучение и текстовый анализ, а также в создании различных проектов на основе открытых финансовых данных. На открытии хакатона Олег Сенько, ведущий научный сотрудник Федерального исследовательского центра «Информатика и управление» РАН, доктор физико-математических наук, прочитал участникам лекцию об анализе данных и машинном обучении. После чего эксперты и менторы хакатона рассказали подробнее о задачах и…

Компания «Умный архив» поддерживает проект Национальный цифровой архив

Компания «Умный архив» выделила пространство для хранения данных проекта Национальный цифровой архив. Команда «Умного архива» занимается хранением и обработкой больших объемов данных, а также архивами и мультимедийными данными – их преобразованием из бумаги или плёнки в цифровую форму. Выражаем благодарность компании «Умный архив» за поддержку проекта Инфокультуры по интернет-архивации. Зачем это нужно? Суть инициативы – сохранять веб-сайты и цифровые материалы, которые представляют общественную ценность и находятся под риском уничтожения. Мы собираем: Исторические данные: бюджеты и статистические справочники СССР, РСФСР, союзных республик; любые реестры, телефонные справочники и иные исторические базы данных в бумажном виде; Официальные сайты органов государственной власти, официальных лиц, политических…

Счетная палата открывает исходный код своих новых программ

Счетная палата выходит на новый уровень прозрачности и первой из российских государственных органов открывает свои исходные коды. Доступными для общественности станут новые проекты контрольного ведомства по автоматизации работы инспекторов и сотрудников. «Идет работа над данными проектами. Эту работу мы хотим вести открыто, то есть публиковать тот код, который разрабатывается. Открывая репозитории, мы демонстрируем свою открытость, говорим о том, что разработчики могут сообщать об ошибках, участвовать. Это работа сделает Счетную палату более привлекательной для аналитиков и разработчиков», — сообщил эксперт Счетной палаты Иван Бегтин. Основными пользователями кода, как ожидается, станут программисты, дизайнеры и аналитики. Но на первом этапе акцент больше будет…

Данные, истории, инструменты: как работает дата-отдел «Новой газеты»

В связи с делом Ивана Голунова в последние дни много говорят о расследовательской журналистике в России. Мы хотим на кейсах «Новой газеты» рассказать, как работают расследователи и почему сегодня невозможно представить их работу без открытых данных. Этой весной журналисты дата-отдела «Новой газеты» Алеся Мароховская, Ирина Долинина и Алексей Смагин выступили на Дне открытых данных и рассказали, как они работают над своими материалами, используя в основе открытые данные и алгоритмы. — «Госзаказ и тайные холдинги»: https://goszakaz.novayagazeta.ru/, — журналисты на основе данных ЕГРЮЛ и данных о госзакупках проанализировали госконтракты крупнейших государственных компаний, госкорпораций и их дочерних структур с 2011 по 2017 гг. с…

Открытое государство в цифровой реальности: данные или статистика

8 июня на Петербургском международном экономическом форуме прошли публичные дебаты на тему «Открытое государство в цифровой реальности: мониторинг национальных целей». Представители госслужбы, академического сообщества и общественных организаций обсудили такую сторону цифровизации государства, как открытость информации, данных и их понятность для граждан. Что такое открытость государства и как она влияет на эффективность работы? Где взять открытые данные, чтобы измерить достижимость национальных целей и нацпроектов? Какие данные нужны экономике и гражданам: статистика или большие данные? Как принимать решения на основе данных, если их качество не вызывает доверия?   Председатель Счетной Палаты РФ Алексей Кудрин считает, что внедрение лучших международных практик по открытым данным…

«Инерционная открытость»: эксперты Счетной палаты подготовили рейтинг, посвященный открытости госструктур

Только четыре российских министерства можно назвать полностью открытыми. К такому выводу пришли эксперты из АНО «Инфокультура» и Центра перспективных управленческих решений в докладе «Открытость государства в России», подготовленном для Счетной палаты. Результатом исследования стал рейтинг министерств и ведомств. Эксперты разработали методологию, которая позволяет оценить уровень взаимодействия ведомств и граждан по трем показателям: Открытость информации – это широкий спектр правовых и коммуникационных инструментов, которыми должны располагать граждане для получения информации, находящейся в ведении государственных органов; Открытые данные – механизм получения информации (данных) от государства в проактивном режиме. Это означает, что государство публикует данные независимо от наличия запросов, то есть в автономном и регулярном режиме; Открытый…

Семантический анализ текста в неевклидовой геометрии. Видео

24 апреля состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, рассказал о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Сравнил стандартные методы нахождения векторных представлений текстов с методом, основанным на неевклидовых геометриях. Эксперт показал, как решение таких задач, как машинный перевод или анализ тональности текстов становится более точным, если сохраняется контекстное значение омонимов. Будучи математическими по своей природе, методы машинного обучения и анализа данных требуют численные величины…