Отчёты мероприятий

Материалы цикла лекций «Городские данные»

В конце 2018 года Инфокультура и образовательный проект для архитекторов Софт Культура провели цикл из 4 открытых лекций — «Городские данные». Архитекторы, журналисты, урбанисты, антропологи, социологи и программисты поделились своим опытом работы с данными в городских проектах. Какие данные можно использовать в исследованиях и где их взять? Какие инструменты существуют для обработки больших массивов данных? Возможно ли прогнозирование развития города на основе такой аналитики? Как овладеть инструментами и методами анализа данных? Поиску ответов на эти и другие вопросы посвящен цикл лекций. Андрей Дорожный, «Столичный дрейф: откуда чаще всего переезжают в Москву» О чем: О работе над исследованием «Столичный дрейф: из…

Материалы и видео Дня открытых данных 2021

1-6 марта 2021 года Информационная культура и Ассоциация участников рынка данных провели неделю мастер-классов по работе с данными и онлайн-конференцию День открытых данных. В этой публикации мы собрали ссылки на презентации и видеозаписи мастер-классов и дискуссий. 1-5 марта Неделя мастер-классов   Мастер-класс «Вскрываем декларации. Как при помощи регулярных выражений привести Word’овскую табличку к пригодной для анализа форме» Эксперт: Алексей Смагин, дата-журналист в Тинькофф-журнале; приглашённый преподаватель курсов по журналистике данных в ВШЭ Видео: https://youtu.be/R9UTX5mb1dc  Материалы: https://docs.google.com/document/d/1ZXBUC_-RK1vxF6wzylBt3agntpfTfcuRLkfxxlePKuc/edit    Мастер-класс «О чем говорят депутаты Госдумы? Анализ текстовых данных на Python» Эксперт: Дмитрий Сергеев, Senior Data Scientist OURA, руководитель курсов по машинному обучению в Otus.ru…

Итоги премии Moscow Dataviz Awards 2021

В пятницу, 5 марта, прошла церемония награждения победителей Moscow Dataviz Awards — ежегодной международной премии за достижения в области инфографики, визуализации данных и дата-арта. Премия Moscow Dataviz Awards была основана в 2020 году с целью продвижения идеи грамотного и визуально привлекательного представления информации. В конкурсе 2021 года приняли участие около 100 работ, 85 из которых вошли в лонглист премии. Представленные проекты оценивали директор «Информационной культуры» Иван Бегтин, ведущий преподаватель Школы дизайна НИУ ВШЭ Александр Ларцев, арт-директор, основатель и дизайнер в IZO Kunstgrupp Дмитрий Маконнен, дизайн-директор «Газпром нефть» Денис Запорожан и другие члены независимого жюри. Ведущий премии, основатель и один из…

День открытых данных в Москве 2020. Итоги

6-7 марта 2020 года Инфокультура совместно с Ассоциацией участников рынка данных и НИТУ «МИСиС» провели День открытых данных 2020 в Москве. Мероприятие объединило 576 участников и 78 спикеров из разных профессиональных областей, которые обсудили роль открытых данных и преимущества их использования для развития общества.  Темой пленарной сессии стал «перезапуск открытости» в публичной повестке: востребованность, ожидаемый эффект и регулирование раскрытия данных. Открывая мероприятие, Председатель Счетной палаты Российской Федерации Алексей Кудрин подчеркнул: «Есть целый ряд исследований, которые говорят о том, что открытость государства снижает протестную активность, потому что люди живут не догадками, не искаженной информацией, а имеют доступ к информации объективной. Это тоже…

Определены победители хакатона DataAudit

19-20 октября прошел хакатон DataAudit, организованный Счетной палатой Российской Федерации, Сбербанком и АНО «Инфокультура». В соревновании участвовали 36 команд (и еще 4 — дистанционно) – это более 130 аналитиков, программистов, дизайнеров и проектных управленцев. Жюри назвало победителей в трех номинациях, специальные призы представили партнеры Data Audit. Рассказываем подробнее, какие идеи признали лучшими. Лучший программный продукт Команда DMAKI создавала сервис EmployersBanService, который по ИНН или наименованию компании (бюджетного учреждения) позволяет проследить размещает ли этот работодатель вакансии на портале «Работа в России». Команда выявила проблему: на известном рекрутинговом ресурсе hh.ru вакансий больше, чем в обязательной базе (619 тыс. против 487). Чтобы понять, какие…

Имеет ли робот те же права на информацию, что и человек?

Публикуем видео-запись дата-среды «Сбор данных и методология парирования блокировки роботов» из цикла «Большие данные в экономике». Спикер Сергей Бершадский работал в качестве backend-разработчика и системного архитектора с такими проектами, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др. Выступление посвящено особенностям извлечения данных из сайтов, их очистке и структуризации. Сергей поделился собственным опытом веб-скрейпинга с использованием библиотек python scrapy, beautiful soup, asyncio. Сергей также разобрал методы break-the-wall на примере запросов в Yandex и Google. Это подходы, которые позволяют имитировать браузер и автоматически его использовать. Презентация опубликована по ссылке. Смотрите запись дата-среды: Организаторами дата-среды выступили АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Всем…

«Цифровой рост»: как прошел хакатон для будущих магистрантов РАНХиГС

16-22 июня 2019 года состоялся хакатон «Цифровой рост», организованный РАНХиГС, АНО «Информационная культура» и Ассоциацией участников рынка данных. В хакатоне принимали участие выпускники бакалавриата ИТ-специальностей, а также начинающие специалисты, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники  соревновались в решении задач на машинное обучение и текстовый анализ, а также в создании различных проектов на основе открытых финансовых данных. На открытии хакатона Олег Сенько, ведущий научный сотрудник Федерального исследовательского центра «Информатика и управление» РАН, доктор физико-математических наук, прочитал участникам лекцию об анализе данных и машинном обучении. После чего эксперты и менторы хакатона рассказали подробнее о задачах и…

Семантический анализ текста в неевклидовой геометрии. Видео

24 апреля состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, рассказал о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Сравнил стандартные методы нахождения векторных представлений текстов с методом, основанным на неевклидовых геометриях. Эксперт показал, как решение таких задач, как машинный перевод или анализ тональности текстов становится более точным, если сохраняется контекстное значение омонимов. Будучи математическими по своей природе, методы машинного обучения и анализа данных требуют численные величины…

Дискриминатон: большие маленькие люди

В прошедшие выходные команда Инфокультуры участвовала во II хакатоне «Новой газеты» по дата-журналистике. Заглавная тема — дискриминация по разным признакам. Участники исследовали проблемы маленьких людей с помощью больших данных.   Мы предложили задачу «Меньшинство решает за большинство: люди, которые предлагают законы — кто они», в рамках которой можно было изучить, как устроен законотворческий процесс в России, и выявить факторы, влияющие на принятие того или иного законопроекта. Открытые данные по законотворческой деятельности доступны по ссылке.   — Команда «Рубильник» представила проект «Ядерный щит Рунета» с результатами исследования того, как общество и СМИ реагировали на принятие закона о «суверенном интернете». Авторы: Ксения…

Интерактивный data mining: возможности Orange — продукта с открытым исходным кодом

3 апреля 2019 состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Об основах интерактивного data mining рассказал Дмитрий Стефановский, директор «Центра компетенций по цифровой прослеживаемости и консалтингу» РАНХиГС, кандидат технических наук, специалист в области прикладных исследований по цифровой трансформации. Data mining – интеллектуальный анализ данных, совокупность методов обнаружения в данных ранее неизвестных, нетривиальных и практически полезных знаний. Сегодня результаты анализа данных позволяют по-новому взглянуть на процессы, происходящие на предприятии. При этом на практике академический подход часто не может быть внедрен в бизнес-процессы, потому что организации не могут себе позволить,…