FacebookTwitter

А ваш научный журнал обладает полными метаданными? Интервью с Патришией Фини (Crossref)

Если Вам важно, чтобы статьи в научном журнале отображались в результатах онлайн-поиска и в науокометрических индексах, то наличие качественных метаданных должно быть одним из ваших главных приоритетов. Метаданные — это данные, хранящиеся в цифровом объекте, например, журнальной статье. Эти данные предоставляют информацию о содержимом объекта. Когда мы говорим о полях метаданных, мы имеем в виду данные, которые можно использовать для организации или поиска определенных статей в Интернете. Основными матаданными являются, например, название журнала, ISSN, название статьи. Примером более специфических метаданных могут служить релевантные ключевые слова и ORCID авторов.

Crossref — одно из регистрационных агентств DOI. Метаданные заносятся в DOI, который, в свою очередь, присваивается контенту, с которым связан DOI. Crossref не может обрабатывать данные статей, если те выпускаются только в текстовом формате. Для регистрации DOI необходимо предоставить метаданные в машиночитаемом формате, который система может «прочитать» и использовать для хранения информацию о статье с помощью DOI. Точно так же, многие научные базы данных и основные онлайн-браузеры, такие как Google и Google Scholar, полностью или частично используют машинно-читаемые метаданные для индексации цифровых объектов и их выдаче в поиске. Поэтому очень важно, чтобы журналы не просто публиковали статьи в Интернет, надеясь на то, что индексы и браузеры смогут их обрабатывать, но и предоставляли полные метаданные ко всем статьям, чтобы сделать их индексируемыми.

Недавно Crossref выпустил бета-версию нового инструмента под названием «Отчеты об участии» — https://www.crossref.org/members/prep/, который помогает журналам-членам проверить качество машиночитаемых метаданных, связанных с каждым из их DOI. Данный инструмент может сказать, какие метаданные хранятся в каждом из DOI журнала, а каких нет. Это может помочь журналам узнать, где они могут улучшить свои записи. В этом интервью директор отдела метаданных Crossref Патришия Фини рассказывает о новом инструменте, требованиях метаданных Crossref и некоторых общих рекомендациях, которые помогут Вам узнать, имеют ли ваши статьи полные машиночитаемые метаданные.

Интервью с Патришией Фини:

— Не могли бы Вы вкратце объяснить, что такое машиночитаемые метаданные и почему так важно, чтобы журналы имели машиночитаемые метаданные для каждой из своих статей?

— Машиночитаемые метаданные — это описательные метаданные, которые могут быть «прочитаны» компьютером. Это означает, что это организованные, чистые метаданные, которые следуют определенным правилам. Сегодня многие журнальные статьи обрабатываются с использованием XML, который следует определенному набору правил, требующих четкой маркировки названий, имен авторов и тому подобного, чтобы машина могла «понимать» правила и знать, для чего предназначен каждый фрагмент данных.

Машиночитаемые метаданные очень важны для поиска. По крайней мере, каждая статья должна обладать основными метаданными, чтобы поисковые и библиотечные системы могли импортировать эти метаданные, связывать читателей с тем, что они ищут, а также помогать читателям открывать новую информацию для дальнейших исследований. Машиночитаемые метаданные также важны для правильного цитирования. Вы хотите убедиться, что статьи цитируются точно. А кто-то, глядя на вашу статюю, должен уметь найти четкую ссылку на то, что вы цитируете. Но на данный момент слишком много людей делают все это вручную, что приводит к большому числу ошибок в цитировании.

Примечание РАЦС:

Crossref имеет собственную схему метаданных, которую должны соблюдать все участники. Они должны иметь возможность создавать XML и отправлять его в Crossref в соответствии с правилами схемы метаданных. Система Гефест, разработанная РАЦС, помогает генерировать XML для регистрации DOI в Crossref и DataCite, а также преобразовывать метаданные из Российского Индекса Научного Цитирования (РИНЦ) в xml для регистрации DOI. Помимо этого, при помощи Гефест можно генерировать и переносить в различные системы XML DOI (DataCite и Crossref), РИНЦ (elibrary.ru), DOAJ и AGRIS. В данный момент ведется разработка новой версии системы, которая позволит отправлять данные в PubMed, Math-Net, Chemical Abstracts и GeoRef.

Я думаю, что основные метаданные, которые должны предоставить издатели, — это базовая информация о цитировании, чтобы можно было идентифицировать имеющиеся у нас записи метаданных. Поэтому важными являются заголовок, имена авторов и любые идентификаторы, такие как ISSN. Одним словом, все данные, необходимые для создания полной записи.

— Какие рекомендации по метаданным Вы бы предложили? Что бы Вы назвали основными плюсами и минусами?

— Есть несколько довольно простых советов для формирования метаданных журнала. Это может быть довольно сложно, если вы делаете это вручную (примечание РАЦС: система Гефест позволяет предоставить все необходимые метаданные и осуществить их проверку). Я думаю, что для журналов, в частности, важно обращать внимание на информацию об авторах — именно здесь у нас может быть много проблем с неверными данными. Включение ORCID в метаданные помогает решить проблемы идентификации автора. Если издатели еще этого не делают, им следует рассмотреть возможность получения ORCID от авторов. Другой совет – уделять больше времени проверки метаданных. Вы можете подумать, что это требует слишком много усилий, и что овчинка не стоит выделки. Но журналы должны знать, что оно того стоит. Метаданные перемещаются очень далеко, и важно убедиться, что детали верны.

— Можете ли Вы объяснить новый инструмент отчетов об участии? Как участники могут использовать это?

— Наши отчеты об участии решают одну из самых больших проблем.

Инструмент позволяет понять, являются ли полными метаданные, которые представили журналы. По сути, он проверяет, отправляете ли вы нам все метаданные, которые, по вашему мнению, отправляете.

При первом входе на страницу отчетов появляется окно поиска, которое можно использовать для просмотра отчетов по имени участника или издателю. Далее вы можете найти конкретный заголовок статьи. В отчетах по издателю, вы увидите сводку всех данных в своем журнале или журналах. Вы можете посмотреть какой статус метаданных у текущего контента, а также, сколько объектов было зарегистрировано в Crossref.

Это очень простой инструмент, который позволяет получить много ценной информации. Например, он показывает, отправляются полные ссылки или нет. Отчеты не дадут информации о качестве ваших метаданных. Например, вы не сможете определить, верны ли имена авторов, но они покажут, сколько статей имеют ORCID. Участники, работающие со спонсорами, могут не иметь четкого представления о том, что они нам отправляют. Или если участник работает с системой, которая обрабатывает большое количество статей, и которой может быть очень сложно проверить каждую из них, отчеты помогут увидеть, попадают ли ссылки в Crossref. Поэтому я думаю, что это очень простой, но мощный инструмент. Отчеты находятся в свободном доступе, все пользователи могут просматривать метаданные издателя.

— Каковы основные преимущества для журналов в использовании отчетов для проверки своих метаданных? Что Вы надеетесь получить от этого нового инструмента?

 Я думаю, что реальная выгода для наших участников заключается в том, что отчеты дают представление о качестве метаданных, которые они отправляют в Crossref. В ходе обсуждений с участниками мы обнаружили, что многие из них хотят присылать нам более качественные метаданные, но иногда им трудно получить общую картину того, как их записи обрабатываются Crossref. Так что это своего рода первый шаг к тому, чтобы позволить издателям увидеть это самим. Это облегчит им просмотр статей и позволит понять, не теряются ли какие-либо метаданные, которые они отправляют.

Мы надеемся, что этот новый инструмент повысит осведомленность о различных типах метаданных, которые могут быть отправлены в Crossref. Наши участники знают, что им нужно отправлять нам базовые метаданные цитирования, но они могут не знать, что могут отправлять нам, например, URL-адреса с текстом и данными. Посмотрев на этот отчет, участники смогут увидеть опции метаданных, которые они еще не используют. Это может привести к тому, что они начнут посылать нам дополнительные метаданные.

Инструмент «Отчет об участии» все еще находится на стадии бета-тестирования, и мы хотели бы получить больше отзывов о нем и в целом больше отзывов о том, что нужно нашим членам от нас, чтобы понять и улучшить качество их метаданных.

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *