Анонсы

ОГФ: «Закрытые открытые данные. Должны ли граждане иметь свободный доступ к данным государственных информационных систем?»

Открытые данные — один из инструментов подотчетности государства перед обществом. Несмотря на открытость данных о культуре, госфинансах, деятельности бюджетных учреждений, данные о качестве жизни населения, такие как экология, образование, здравоохранение, криминальная статистика, остаются крайне закрытыми и недоступными. Мы пригласили представителей НКО, медиа и науки, чтобы обсудить, какие данные должны быть открыты по умолчанию. Что необходимо сделать сейчас, чтобы данные, касающиеся качества и безопасности жизни, стали общедоступными? Как обеспечить качество государственных данных и доверие к ним общества? Своими знаниями и мнением поделятся: Дада Линделл, дата-журналистка РБК, расскажет об исследовании о смертности от ВИЧ в России. Чтобы раскрыть данные о регионах-лидерах по…

Лекция Ивана Бегтина: «Дата-расследования: тысячи иголок с миллионах стогов сена»

Иван Бегтин поделится опытом дата-журналистских расследований. Открытая лекция директора АНО “Инфокультура” состоится 8 октября в библиотеке Шанинки. В программе — три кейса по работе с открытыми данными и электронными документами госучреждений и информационных систем: — «Слепые закупки» — что это? Латиница и другие способы искажения информации о государственных и муниципальных закупках в целях ограничения конкуренции и поиска сведений. — Утечка персональных данных с сайтов государственных информационных систем — как более двух миллионов записей с данными россиян оказались в открытом доступе. — Пиратский софт — использование пиратского программного обеспечения в российских госорганах. На сайте какого органа исполнительной власти не было найдено…

Приглашаем на хакатон DataAudit

19-20 октября 2019 года Счетная палата Российской Федерации,  Сбербанк России и АНО «Инфокультура» проведут хакатон по созданию цифровых продуктов и современных инструментов в области анализа и визуализации данных. Приглашаем к участию разработчиков, аналитиков, дизайнеров, дата-журналистов, всех неравнодушных к идеям открытого технологичного государства и управления, основанного на данных.   Участие в хакатоне дает возможность не только выиграть денежный приз, но и получить опыт решения реальных задач и создания востребованных аналитических продуктов в области государственного управления. За два дня хакатона его участники смогут создать проекты самого разного рода: расширения для браузеров, веб-сервисы, боты, аналитические модели, инфографику и медиа-проекты и проч. Подробные описания задач…

Приглашаем на День открытых дверей в РАНХиГС

Всех, кто планирует в 2019 году продолжить свое обучение и пройти повышение квалификации в сфере экономики и анализа данных, приглашаем 13 июля 2019 на День открытых дверей в РАНХиГС. Информационная культура и Ассоциация участников рынка данных являются партнерами магистерских программ, которые будут представлены на Дне открытых дверей: «Цифровая экономика». Онлайн-магистратура по цифровой экономике позволяет приобрести знания математики, экономики и современных методов анализа данных. Программа организована совместно Московским физико-техническим институтом (МФТИ) и Академией народного хозяйства и государственной службы при Президенте Российской Федерации (РАНХиГС). «Системы больших данных в экономике». Одна из фундаментальных идей магистратуры — участие магистранта в научно-исследовательской деятельности на основе задач из реальной…

Приглашаем на хакатон «Цифровой рост»

16 и 22 июня 2019 года  АНО «Информационная культура», Ассоциация участников рынка данных и РАНХиГС проведут хакатон «Цифровой рост». Приглашаем к участию выпускников бакалавриата ИТ-специальностей, а также начинающих специалистов, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники будут соревноваться в решении задач на машинное обучение, текстовый анализ, маркетинговую аналитику, а также в создании различных типов проектов на основе данных: расширения для веб-браузеров, инфографику, прототипы интернет-сервисов и мобильных приложений, боты. Участники могут решить одну из предложенных задач или разработать свой проект на основе предложенных данных. Хакатон пройдет в несколько этапов: 16 июня состоится распределение задач по командам,…

Дата-среда: «Как извлекать полезную информацию из текста – система PolyAnalyst»

29 мая приглашаем на четвертую дата-среду из цикла «Большие данные в экономике». Тема встречи — «Как извлекать полезную информацию из текста – система PolyAnalyst». Дата-среду проведет Сергей Ананян, генеральный директор компании Мегапьютер (www.megaputer.com), кандидат физмат наук, специалист по решению прикладных задач анализа данных. Надежное извлечение полезной информации из текстовых документов открывает путь к решению многих важнейших бизнес-задач в самых разных областях деятельности. Учитывая сложности, с которыми сталкиваются при попытке извлечения информации системы, основанные только на машинном обучении, мы представим альтернативный подход: использование специального языка запросов, базирующегося на результатах углубленного лингвистического и семантического анализа текста. Мы продемонстрируем практическую реализацию этого подхода…

Хакатон по открытым данным HACKNOWLEDGE

25-26 мая 2019 года  Ассоциация интернет-издателей и НП «Викимедиа РУ» проводят хакатон по использованию свободных данных и свободного контента. «Информационная культура» оказывает информационную поддержку мероприятию. К участию приглашаются программисты, проектировщики, дизайнеры и специалисты по работе с профильными сервисами. Открытие хакатона проведут эксперты проектов «Викимедиа» и Цифровой платформы «Ноосфера». Мероприятие стартует 25 мая в 10:00 в пространстве «Благосфера». В течение всего дня команды будут работать над собственными проектами в рамках номинаций USEthon и CREATEthon. Им предстоит расширение и повышение эффективности использования обществом свободных материалов, таких ресурсов как Викиданные, Википедия и другие проекты Викимедиа, «Ноосфера», «Научный корреспондент», Europeana, OpenAIRE. Образовательную часть составят…

Дата-среда: «Сбор данных и методология парирования блокировки роботов»

22 мая приглашаем на третью дата-среду из цикла «Большие данные в экономике». Тема встречи — «Сбор данных и методология парирования блокировки роботов». Проведет дата-среду Сергей Бершадский, ведущий backend-разработчик и системный архитектор, работал с различными проектами, среди которых медицинский портал ЕМИАС.инфо, Play2Live, toptal.com и др. Эксперт расскажет об особенностях извлечения данных из сайтов, их очистки и структуризации. Во время встречи будет рассмотрен весь процесс извлечения данных: веб-скрейпинг, обработка данных, очистка данных, а также способы break-the-wall на примере Yandex и Google. Предложенные кейсы основаны на использовании библиотек python scrapy, beautiful soup, asyncio. Будут рассмотрены подходы, позволяющие имитировать браузер, автоматическое использование имеющегося браузера,…

Дата-среда: «Семантический анализ текста в неевклидовой геометрии»

24 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике». Тема второй встречи цикла — «Преимущества векторных представлений слов в неевклидовых геометриях». Как аналитики в сфере бизнеса, так и академические исследователи зачастую сталкиваются с необходимостью семантического анализа текста. Он может быть применен в таких задачах, как определение тематики и тональности новостных сообщений или предсказание размера заработной платы по описанию вакансии. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, расскажет о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Лектор сравнит стандартные методы нахождения векторных представлений…

Дата-среда «Интерактивный data mining»

3 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Тема первой встречи цикла — «Интерактивный data mining». Data mining – интеллектуальный анализ данных, совокупность методов обнаружения в данных ранее неизвестных, нетривиальных и практически полезных знаний. Участники дата-среды узнают, как организовать исследования с использованием методов машинного обучения, как поставить задачу и какой результат стоит ждать. Совместно с экспертом участники решат практическую задачу с использованием программного продукта ORANGE3 и проведут кибернетический эксперимент, то есть попытаются заменить систему управления моделью машинного обучения и проанализируют особенности  принятия решения на основе модели.…