Важность Справедливых данных в науках о Земле

Доктор Янс Асман15 октября 2019
Об авторе: Янс Асман - доктор философии. психолог, эксперт в области когнитивных наук и генеральный директор Franz Inc., новатор в области искусственного интеллекта и поставщик AllegroGraph, ведущей базы данных семантических графов.
Об авторе: Янс Асман - доктор философии. психолог, эксперт в области когнитивных наук и генеральный директор Franz Inc., новатор в области искусственного интеллекта и поставщик AllegroGraph, ведущей базы данных семантических графов.

Оценка данных как актива предприятия наиболее остро реализуется с течением времени. При правильном управлении один и тот же набор данных поддерживает множество вариантов использования, становится практически мгновенно доступным по запросу и может быть обменен между департаментами или организациями для систематического увеличения его доходности при каждом развертывании.

Эти преимущества использования данных в качестве корпоративного актива являются основой принципов GO FAIR «Доступный доступный интероперабельный многоразовый доступ» (FAIR), глубоко влияющих на требования к управлению данными геологической науки. Многочисленные организации в этом пространстве приняли эти принципы, чтобы быстро обмениваться информацией между различными дисциплинами, чтобы безопасно руководить управлением Землей.

По словам д-ра Энни Берджесс, директора лаборатории Информационных партнеров по науке о Земле (ESIP), «наиболее острые глобальные проблемы не могут быть решены одной организацией. Ученым требуются данные, собранные по нескольким дисциплинам, которые часто управляются многими различными учреждениями и учреждениями ». Как осознают многочисленные члены сообщества наук о Земле, наиболее эффективным средством управления этими разнородными данными в соответствии с принципами FAIR является использование семантических стандартов. основа графов знаний.

Эти унифицированные подходы к управлению метаданными, моделями данных и терминологией являются основой движения данных FAIR, обеспечивая место данных как ценный актив научного сообщества.

Коммунальная наука
Семантические стандарты, поддерживающие графы знаний, предназначены для уникальной идентификации, немедленного доступа и совместного использования данных в машиночитаемом формате. Это те же стандарты, которые отвечают за использование этих преимуществ во всемирной паутине и чрезвычайно полезны для повторного использования данных в области геологической науки. Эта область является одной из наиболее сложных научных областей, поскольку она настолько обширна, что охватывает морскую жизнь, проблемы с атмосферой, массы суши и подземные разработки. Возможность быстрого обмена данными в этих различных специализациях является неотъемлемым аспектом развития отрасли в целом, равно как и другие преимущества уникальной идентификации данных и быстрого доступа к ним с помощью машиночитаемых методов.

Заметил д-р Льюис МакГиббни, научный сотрудник Лаборатории реактивного движения Калифорнийского технологического института и сопредседатель рабочей группы NASA ESDSWG по поисковой релевантности: «Мы находимся на захватывающей стадии, когда вокруг критической массы экспертов и организаций глобус с аналогичными целями, а также осознание того, что нам нужны наукоемкие приложения. Стек семантических технологий является критически важным компонентом для создания интеллектуальных приложений для наукоемких сценариев использования в области геонауки ». Более того, семантические стандарты позволяют этим организациям публиковать данные и результаты в формате многократного использования, поэтому разные организации напрямую извлекают пользу из труда друг друга.

Соединение людей и машин
Подход FAIR вращается вокруг связывания различных частей данных в графе знаний. Эти графы знаний, в свою очередь, могут быть связаны между различными организациями или «опубликованы» в сети для всеобщего доступа, что имеет решающее значение для взаимодействия. Этот подход требует, чтобы у каждого отдельного элемента данных был свой собственный уникальный идентификатор, а также богатое описание его метаданных, основанное на стандартизированных словарях и таксономиях, которые быстро понимаются и доступны через машины. Семантические модели данных (онтологии) стандартизируют присущие различия в схемах, используемых различными организациями для различных приложений, что дополнительно способствует совместимости ИТ-систем, основанных на принципах FAIR.

Старший инженер-программист Монтерейского залива Карлос Руэда (Carlos Rueda) прокомментировал, что «Проект по взаимодействию морских метаданных разработал Реестр и репозиторий онтологий MMI (ORR), который использует AllegroGraph для предоставления мощных взаимодействующих семантических сервисов, которые делают контент в сети значимым образом взаимосвязанным. как для людей, так и для машин ». Предоставляя возможность различным научным организациям в рамках проекта по взаимодействию морских метаданных регистрировать онтологии своих бесчисленных хранилищ таким стандартизированным способом, ускоряется интеграция данных и доступность.

Единое Разнообразие
Возможно, основным преимуществом применения принципов FAIR с помощью графов знаний в сообществе специалистов по науке о Земле является способность стандартизировать ассортимент данных о дайверах, имеющих отношение к ученым. Огромное количество различных специализаций в этой области требует данных, казалось бы, бесконечных многообразий. Источники включают в себя данные датчиков из водных, воздушных и наземных источников, в дополнение к спутниковым данным и из физических образцов. Кроме того, эти данные характеризуются многими различными пространственными и временными разрешениями, что увеличивает общую сложность однородного управления ими. В этом отношении семантические модели данных значительно помогли единообразным словарям описать данные. Д-р Берджесс упомянул о достоинстве «Репозитория онтологий сообщества ESIP, платформы сообщества для управления и обмена терминами и словарями, которые помогают ученым публиковать, находить и повторно использовать данные».

Долгосрочное распространение
Как показывают многочисленные примеры использования в геологическом научном сообществе, истинная ценность данных основана на их постоянном повторном использовании и немедленном доступе. Эти приоритеты породили движение FAIR, которое зависит от семантических технологий для реализации. Этот подход обеспечивает то же преимущество применительно к современным организациям: повышение ценности данных как актива предприятия.

об авторе
Янс Асман - доктор философии психолог, эксперт в области когнитивных наук и генеральный директор Franz Inc., новатор в области искусственного интеллекта и поставщик AllegroGraph, ведущей базы данных семантических графов. Будучи ученым и генеральным директором, доктор Аасман продолжает прорыв в области графов искусственного интеллекта и знаний, работая рука об руку со многими организациями из списка Fortune 500, а также с правительствами США и других стран. Доктор Аасман провел большую часть своей профессиональной карьеры, специализируясь на прикладных проектах по искусственному интеллекту, интеллектуальных пользовательских интерфейсах и исследованиях в области телекоммуникаций. Он получил патенты в области речевых технологий, мультимодального взаимодействия с пользователем, механизмов рекомендаций при разработке технологии прекурсоров для планшетов и личных помощников. Он был профессором в отделе промышленного дизайна Технического университета Делфта и известным докладчиком на таких мероприятиях, как Smart Data, NoSQL Now, Международная конференция по семантической сети, GeoWeb, AAAI, Enterprise Data World, Global Graph Summit, Text Analytics, и TSI Vanguard.