Наталья Киссель

Имеет ли робот те же права на информацию, что и человек?

Публикуем видео-запись дата-среды «Сбор данных и методология парирования блокировки роботов» из цикла «Большие данные в экономике». Спикер Сергей Бершадский работал в качестве backend-разработчика и системного архитектора с такими проектами, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др. Выступление посвящено особенностям извлечения данных из сайтов, их очистке и структуризации. Сергей поделился собственным опытом веб-скрейпинга с использованием библиотек python scrapy, beautiful soup, asyncio. Сергей также разобрал методы break-the-wall на примере запросов в Yandex и Google. Это подходы, которые позволяют имитировать браузер и автоматически его использовать. Презентация опубликована по ссылке. Смотрите запись дата-среды: Организаторами дата-среды выступили АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Всем…

Онлайн-курс «Основы цифровой экономики»

Рекомендуем бесплатный онлайн-курс «Основы цифровой экономики» от Ассоциации интернета вещей и Фонда развития интернет-инициатив (ФРИИ). Он специально создан для неспециалистов, чтобы объяснить ценности и способы внедрения высоких технологий в различные сферы общественной жизни. Курс включает в себя 12 лекций, которые последовательно раскрывают теоретические аспекты цифровой экономики, а также кейсы и лучшие практики от партнеров курса. Экспертами курса выступают представители ФРИИ, организации «Цифровая экономика», ООО «ЦРПТ», Ассоциации интернета вещей, ПАО «Микрон», компании StartTrack и др. Среди рассматриваемых тем: управление данными; защита пользовательских и корпоративных данных как приоритет государства в цифровой экономике; государственно-частное партнерство в сфере IT: поправки в закон и перспективы применения;…

Приглашаем на День открытых дверей в РАНХиГС

Всех, кто планирует в 2019 году продолжить свое обучение и пройти повышение квалификации в сфере экономики и анализа данных, приглашаем 13 июля 2019 на День открытых дверей в РАНХиГС. Информационная культура и Ассоциация участников рынка данных являются партнерами магистерских программ, которые будут представлены на Дне открытых дверей: «Цифровая экономика». Онлайн-магистратура по цифровой экономике позволяет приобрести знания математики, экономики и современных методов анализа данных. Программа организована совместно Московским физико-техническим институтом (МФТИ) и Академией народного хозяйства и государственной службы при Президенте Российской Федерации (РАНХиГС). «Системы больших данных в экономике». Одна из фундаментальных идей магистратуры — участие магистранта в научно-исследовательской деятельности на основе задач из реальной…

«Цифровой рост»: как прошел хакатон для будущих магистрантов РАНХиГС

16-22 июня 2019 года состоялся хакатон «Цифровой рост», организованный РАНХиГС, АНО «Информационная культура» и Ассоциацией участников рынка данных. В хакатоне принимали участие выпускники бакалавриата ИТ-специальностей, а также начинающие специалисты, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники  соревновались в решении задач на машинное обучение и текстовый анализ, а также в создании различных проектов на основе открытых финансовых данных. На открытии хакатона Олег Сенько, ведущий научный сотрудник Федерального исследовательского центра «Информатика и управление» РАН, доктор физико-математических наук, прочитал участникам лекцию об анализе данных и машинном обучении. После чего эксперты и менторы хакатона рассказали подробнее о задачах и…

Приглашаем на хакатон «Цифровой рост»

16 и 22 июня 2019 года  АНО «Информационная культура», Ассоциация участников рынка данных и РАНХиГС проведут хакатон «Цифровой рост». Приглашаем к участию выпускников бакалавриата ИТ-специальностей, а также начинающих специалистов, которые хотят продолжить свое обучение, повысить квалификацию и получить востребованное образование. Участники будут соревноваться в решении задач на машинное обучение, текстовый анализ, маркетинговую аналитику, а также в создании различных типов проектов на основе данных: расширения для веб-браузеров, инфографику, прототипы интернет-сервисов и мобильных приложений, боты. Участники могут решить одну из предложенных задач или разработать свой проект на основе предложенных данных. Хакатон пройдет в несколько этапов: 16 июня состоится распределение задач по командам,…

Семантический анализ текста в неевклидовой геометрии. Видео

24 апреля состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, рассказал о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Сравнил стандартные методы нахождения векторных представлений текстов с методом, основанным на неевклидовых геометриях. Эксперт показал, как решение таких задач, как машинный перевод или анализ тональности текстов становится более точным, если сохраняется контекстное значение омонимов. Будучи математическими по своей природе, методы машинного обучения и анализа данных требуют численные величины…

Хакатон по открытым данным HACKNOWLEDGE

25-26 мая 2019 года  Ассоциация интернет-издателей и НП «Викимедиа РУ» проводят хакатон по использованию свободных данных и свободного контента. «Информационная культура» оказывает информационную поддержку мероприятию. К участию приглашаются программисты, проектировщики, дизайнеры и специалисты по работе с профильными сервисами. Открытие хакатона проведут эксперты проектов «Викимедиа» и Цифровой платформы «Ноосфера». Мероприятие стартует 25 мая в 10:00 в пространстве «Благосфера». В течение всего дня команды будут работать над собственными проектами в рамках номинаций USEthon и CREATEthon. Им предстоит расширение и повышение эффективности использования обществом свободных материалов, таких ресурсов как Викиданные, Википедия и другие проекты Викимедиа, «Ноосфера», «Научный корреспондент», Europeana, OpenAIRE. Образовательную часть составят…

Дата-среда: «Семантический анализ текста в неевклидовой геометрии»

24 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике». Тема второй встречи цикла — «Преимущества векторных представлений слов в неевклидовых геометриях». Как аналитики в сфере бизнеса, так и академические исследователи зачастую сталкиваются с необходимостью семантического анализа текста. Он может быть применен в таких задачах, как определение тематики и тональности новостных сообщений или предсказание размера заработной платы по описанию вакансии. На дата-среде Артур Федоров, специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market, расскажет о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Лектор сравнит стандартные методы нахождения векторных представлений…

Интерактивный data mining: возможности Orange — продукта с открытым исходным кодом

3 апреля 2019 состоялась дата-среда из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Об основах интерактивного data mining рассказал Дмитрий Стефановский, директор «Центра компетенций по цифровой прослеживаемости и консалтингу» РАНХиГС, кандидат технических наук, специалист в области прикладных исследований по цифровой трансформации. Data mining – интеллектуальный анализ данных, совокупность методов обнаружения в данных ранее неизвестных, нетривиальных и практически полезных знаний. Сегодня результаты анализа данных позволяют по-новому взглянуть на процессы, происходящие на предприятии. При этом на практике академический подход часто не может быть внедрен в бизнес-процессы, потому что организации не могут себе позволить,…

Дата-среда «Интерактивный data mining»

3 апреля 2019 приглашаем на дата-среду из цикла «Большие данные в экономике», который совместно организуют АНО «Инфокультура», Ассоциация участников рынка данных и РАНХиГС. Тема первой встречи цикла — «Интерактивный data mining». Data mining – интеллектуальный анализ данных, совокупность методов обнаружения в данных ранее неизвестных, нетривиальных и практически полезных знаний. Участники дата-среды узнают, как организовать исследования с использованием методов машинного обучения, как поставить задачу и какой результат стоит ждать. Совместно с экспертом участники решат практическую задачу с использованием программного продукта ORANGE3 и проведут кибернетический эксперимент, то есть попытаются заменить систему управления моделью машинного обучения и проанализируют особенности  принятия решения на основе модели.…