Open source for Opendata

Инфокультура разработала методические рекомендации по использованию решений с открытым кодом при работе с открытыми данными.

Движения за открытый код и открытые данные имеют множество исторических пересечений. Многие из активистов за открытость данных пришли в эту деятельность из других движений за открытость, таких как открытый код, открытое оборудование и открытые знания.

В то же время, не все участники сообществ по открытости данных знают о существовании инструментов с открытым кодом, которые могут помочь им в ежедневной работе. Мы собрали эти рекомендации для того, чтобы описать способы использования различных инструментов и помочь специалистам разного профиля и уровня в работе с данными. Рекомендации будут полезны как пользователям данных, так и публикаторам.

При работе с данными выбор инструмента, в первую очередь, определяется теми задачами, которые предполагается выполнять. Мы сгруппировали инструменты по видам деятельности и подготовили рекомендации по каждому из них, чтобы этот выбор упростить.

Мы определяли виды деятельности, исходя из собственного опыта и с оглядкой на классификацию инструментов в таких сервисах, как Stackshare.io1 и его аналогах. Формируя список инструментов, мы выделили следующие категории:

  • подготовка и упаковка данных;
  • создание порталов и каталогов данных;
  • сбор и извлечение данных;
  • очистка и контроль качества данных;
  • обработка данных;
  • аналитика и Business Intelligence;
  • работа с геоданными;
  • машинное обучение и искусственный интеллект;
  • визуализация данных.

Несмотря на то, что многие инструменты универсальны и используются для многих задач, есть виды деятельности, для которых они применяются в первую очередь. Также в карточке каждого инструмента указываются дополнительные категории, к которым он может быть отнесён.

Мы опубликовали первую версию методических рекомендаций. В последствии мы планируем дорабатывать и расширять это руководство. Если у вас есть идеи, замечания и предложения, присылайте нам их на почту [email protected] с пометкой Open source for Opendata.