Рубрики
Новости

Интеграция программы Гефест для регистрации DOI с сервисом Crossmark

Публикуемые результаты исследований не являются статичными: даже после публикации статьи можно снабдить дополнительными данными или исправлениями. Важно знать, была ли цитируемае статья обновлена, исправлена или отозвана — и эту возможность издатели могут предложить с помощью Crossmark. Crossmark представляет собой баннер, отображающий статус материала и любые дополнительные метаданные, выбранные участником. Важно отметить, что отметка Crossmark также может быть встроена в PDF-файлы, это позволяет издателям предупреждать читателей об изменениях через месяцы или даже годы после их скачивания.

Одним щелчком мыши читатель может увидеть, был ли контент обновлен, исправлен или отозван, и получить доступ к важным дополнительным метаданным, предоставленным издателем. Такими данными могут быть: ключевые даты публикации (представление, редакция, принятие), идентификаторы ORCID авторов, тип объекта, статус проверки на плагиат и информация о финансировании, лицензии, экспертной оценке и местонахождении данных исследования.

Дополнительные метаданные Crossmark являются необязательными и определяются издателем.

Для Crossmark существует две категории обновлений: незначительные и серьезные изменения.

Незначительные изменения включают исправление форматирования и орфографии. Если изменения не влияют на оценку или интерпретацию работы, статус Crossmark останется неизменным. Это также относится к управлению версиями статьи — если изменения между версиями работы не отражают серьезных изменений в содержании статьи, оставте статус Crossmark не меняется.

Существенные изменения влияют на статус работы Crossmark, поскольку Crossmark предназначен для информирования читателей о значительных изменениях в опубликованной литературе. Существенные изменения, такие как отзыв статьи из-за ошибки или исправление имени автора, должны отражаться в статусе Crossmark. Рекомендуемая практика — публиковать уведомление об исправлении или опровержении (с собственным DOI). Это позволяет читателям перейти по ссылке в кнопке Crossmark и найти дополнительную информацию об изменениях.

Преимущества Crossmark

Издательства могут гарантировать читателям, что они постоянно обновляют свои публикации, и предоставляют дополнительные метаданные.
Исследователи и библиотекари могут легко увидеть изменения в публикации, которую они читают, узнать, кто финансировал исследование, какие лицензии применяются к материалу и многое другое.
Любой желающий может получить доступ к метаданным Crossmark через REST API, предоставляя множество возможностей для интеграции с другими системами и анализа изменений в научных записях.

Как работает Crossmark

Издательства должны разместить кнопку Crossmark рядом с заголовком научной статьи на своих веб-страницах и в файлах PDF, при этом, они обязуются сообщать, если есть обновление, исправление или реагирование, а также о добавлении любых дополнительных метаданных.

Наличие отметки Crossmark в публикации само по себе не означает, что документ актуален, но показывает, что издатель где-то хранит документ. Когда читатель нажимает на отметку, появляется всплывающее окно, в котором отображается текущий статус контента (актуальный, доступны обновление или ретрагирование), постоянная ссылка на копию, поддерживаемую издателем, и любую дополнительную информацию.

Важно применять кнопку Crossmark сразу при публикации статьи иди другого контента. Данная практика позволит избежать проблем когда исследователь может загрузить статью в формате PDF без кнопки Crossmark, и впоследствии статья будет обновлена, исследователь не сможет узнать, актуальна ли его локально сохраненная статья, поскольку в ней не было отметки Crossmark.

Также рекомендуется показывать отметку Crossmark на всех публикациях, чтобы показать читателям, что издатель участвуете в Crossmark.

Программа Crossmark доступна для пользователей, который используют Crossref в качестве регистрационного агентства. Для регистрации метаданных с Crossmark необходимо отметить галочку Crossmark при создании проекта. И выбрать будет ли применяться Crossmark для всего выпуска или только для отдельных статей в выпуске.

Регистрация Crossmark

Далее необходимо ввести данные о политике Crossmark. Для политики Crossmark ранее должен быть зарегистрирован DOI.

Регистрация Crossmark

При первой регистрации действие Crossmark по умолчанию — Регистрация Crossmark.

Первая регистрация Crossmark

После того как DOI проекта были зарегистрированы через систему Гефест, и в ваших публикациях появились какие-либо изменения. Нужно вернуться в данный проект, выбрать объект в котором произошли изменения, выбрать действие Crossmark и отправить проект на повторную регистрацию.

Повторные действия Crossmark

Рубрики
Новости

Почему каждому научному журналу нужно отслеживать статистику публикаций

Что вы знаете о читателях своего научного журнала?

У всех журналов общая цель – представить читателям значимые исследования и со временем увеличить свою аудиторию. Соответственно, издателям журналов нужно держать руку на пульсе, чтобы знать, как идут дела и чтобы убедиться, что они эффективно продвигают статьи и готовят верные спецвыпуски и дополнительные материалы, которые привлекут как можно больше читателей и смогут поддержать их интерес.

Многие полагаются на интуицию, когда определяют, на верную ли аудиторию направлен журнал, и также интуитивно принимают решения о том, где продвигать свой контент. Зачастую, при таком подходе они упускают хорошие возможности. Если это описывает и вас, то возможно вы знаете своих читателей не так хорошо, как вам кажется. Чтобы достоверно оценить результативность работы вашего журнала и получить знания, которые помогут расширить круг читателей, просто необходимо иметь доступ к базовой статистике публикаций. Ниже представлены три области анализа, на которых нужно сконцентрироваться всем издателям журналов, а также указаны причины, почему это стоит сделать.

Отслеживайте обращения к статьям и просмотры страниц

Основа того, что стоит отслеживать всем журналам – обращения к статье и просмотр страниц. Вот лучшие параметры для отслеживания:

  • Общее число просмотров страниц сайта
  • Счётчик просмотров каждой страницы (смотрите, какие статьи, информационные страницы и дополнительные материалы больше всего привлекают читателей)
  • Общее число скачанных статей
  • Счётчик скачиваний каждой статьи

Статистика обращений к статье и число просмотров страниц позволят вам взглянуть на то, как читатели взаимодействуют с материалами. В основе своей, отслеживание счётчика загрузок поможет вам понять, какие статьи больше всего привлекают внимание читателей. Можно использовать эту информацию, чтобы определить, какие статьи нужно больше продвигать, или же какие статьи привлекут больше всего внимания при онлайн-продвижении. Вы также сможете найти, что общего у популярных статей, и это поможет сформировать новые цели и определить предмет следующего спецвыпуска.

К тому же, несомненным преимуществом станет то, что вы сможете отправлять авторам статистику скачиваний статьи. С помощью этой информации авторы смогут узнать, какие из их статей наиболее популярны у читателей, что поможет им в продвижении своих исследований, также эту статистику они смогут предоставить, подавая заявку на финансирование или при поиске работы.

Кроме отслеживания числа загрузки статей, посмотрев на статистику посещений страниц, можно будет получить более детальную картину того, как посетители сайта взаимодействуют с контентом. Вы увидите, страницы каких статей собирают больше всего просмотров и каково соотношение просмотров к закачкам для каждой статьи, а также узнаете, какие страницы с дополнительными материалами, например, посты в блоге, привлекают больше всего внимания. Вы также сможете отследить, какие информационные страницы вашего журнала собирают больше всего просмотров, например, это может быть страница с информацией для авторов, и не случилось ли так, что некоторые информационные страницы собирают слишком мало просмотров (это может значить, что посетители не могут их найти).

Узнайте, растёт ли число ваших читателей

Счётчики просмотров страниц и загрузки статей помогут вам определить, какие материалы больше всего привлекают читателей, но не дадут чёткой картины того, как увеличивается количество читателей. Для этого вам придётся копнуть глубже и взглянуть на «уникальные просмотры страниц». Общий счётчик просмотра страниц засчитывает посещение каждый раз, когда человек открывает страницу вашего сайта за время одной веб-сессии (если один посетитель десять раз подряд откроет страницу, это засчитается как десять просмотров), а уникальные просмотры учитывают каждого человека, впервые за веб-сессию открывшего страницу вашего сайта. За сессию засчитывается только один уникальный просмотр. Уникальные просмотры можно отслеживать, чтобы понять, сколько читателей переходят на определённые страницы сайта впервые, и чтобы видеть уменьшается или увеличивается количество посещений страниц сайта.

Посмотрите, откуда приходят ваши читатели

Кроме отслеживания статистики по читателям, издателям любого журнала необходимо базовое отслеживание того, откуда приходят читатели. Обычно начинают с географии посещений. Вам нужно проследить, из каких стран ваши читатели, чтобы понять, достаточно ли широка аудитория или есть некие области, на которых нужно сосредоточиться, чтобы привлечь больше внимания.

Кроме отслеживания того, из каких стран приходят читатели, нужно понять, как они находят ваш материал в сети. Прекрасный способ это сделать – проследить источники ссылок. Источники – это те сайты, которые позволяют читателям перейти на страницы вашего журнала. На таких сайтах есть ссылки, отправляющие читателей к вашим материалам. Например, если на новостном сайте один из сюжетов ссылается на одну из ваших статей, этот сюжет и есть источник ссылки. Отслеживание источников позволит вам узнать, что из ваших материалов обсуждают и цитируют в сети, и где именно это делают.

Начните анализировать публикации

Если вы ещё не отслеживаете статистику в этих ключевых областях, самое время начать! Начните изучать, какие имеются возможности по отслеживанию статистики публикаций и определите, что подойдёт вам лучше всего. Например, если у вашей команды есть время и возможность настроить собственный сбор статистических данных, можно воспользоваться Google Analytics. Для настройки гугл-аналитики нужно время, к тому же некоторое время уйдёт на то, чтобы научиться ей пользоваться, поэтому вам может понадобиться для этого отдельный сотрудник. Если вы заинтересованы в более быстром, готовом решении, уже заточенном под ваши нужды, которое не нужно настраивать и поддерживать, можете обратиться к аналитикам, предназначенным для научных журналов. В программное обеспечение OJS входит полный набор для отслеживания статистики публикаций, за который не нужно отдельно доплачивать.

Рубрики
Новости

Национальные языки и регистрация DOI

В новой версии программы Гефест для разметки данных для регистрации DOI мы добавили поддержку всех официальных языков Российской Федерации, теперь научные статьи, на этих языках можно будет найти в глобальном хранилище DOI, непосредственно, указав язык произведения:

• абазинский язык
• адыгейский язык
• алтайский язык
• башкирский язык
• бурятский язык
• ингушский язык
• кабардино-черкесский язык
• калмыцкий язык
• карачаево-балкарский язык
• коми язык
• крымско-татарский язык
• марийский язык
• мокшанский язык
• ногайский язык
• осетинский язык
• татарский язык
• тувинский язык
• удмуртский язык
• украинский язык
• хакасский язык
• чеченский язык
• чувашский язык
• эрзянский язык
• якутский язык
• языки Дагестана: аварский, агульский, азербайджанский, даргинский, кумыкский, лакский, лезгинский, ногайский, рутульский, табасаранский, татский, цахурский

Мы также предусмотрели возможности добавлять языки по запросу, если это необходимо. Для добавления необходимого языка, пожалуйста свяжитесь с нами по электронной почте info@rads-doi.org

Рубрики
Новости

А ваш научный журнал обладает полными метаданными? Интервью с Патришией Фини (Crossref)

Если Вам важно, чтобы статьи в научном журнале отображались в результатах онлайн-поиска и в науокометрических индексах, то наличие качественных метаданных должно быть одним из ваших главных приоритетов. Метаданные — это данные, хранящиеся в цифровом объекте, например, журнальной статье. Эти данные предоставляют информацию о содержимом объекта. Когда мы говорим о полях метаданных, мы имеем в виду данные, которые можно использовать для организации или поиска определенных статей в Интернете. Основными матаданными являются, например, название журнала, ISSN, название статьи. Примером более специфических метаданных могут служить релевантные ключевые слова и ORCID авторов.

Crossref — одно из регистрационных агентств DOI. Метаданные заносятся в DOI, который, в свою очередь, присваивается контенту, с которым связан DOI. Crossref не может обрабатывать данные статей, если те выпускаются только в текстовом формате. Для регистрации DOI необходимо предоставить метаданные в машиночитаемом формате, который система может «прочитать» и использовать для хранения информацию о статье с помощью DOI. Точно так же, многие научные базы данных и основные онлайн-браузеры, такие как Google и Google Scholar, полностью или частично используют машинно-читаемые метаданные для индексации цифровых объектов и их выдаче в поиске. Поэтому очень важно, чтобы журналы не просто публиковали статьи в Интернет, надеясь на то, что индексы и браузеры смогут их обрабатывать, но и предоставляли полные метаданные ко всем статьям, чтобы сделать их индексируемыми.

Недавно Crossref выпустил бета-версию нового инструмента под названием «Отчеты об участии» — https://www.crossref.org/members/prep/, который помогает журналам-членам проверить качество машиночитаемых метаданных, связанных с каждым из их DOI. Данный инструмент может сказать, какие метаданные хранятся в каждом из DOI журнала, а каких нет. Это может помочь журналам узнать, где они могут улучшить свои записи. В этом интервью директор отдела метаданных Crossref Патришия Фини рассказывает о новом инструменте, требованиях метаданных Crossref и некоторых общих рекомендациях, которые помогут Вам узнать, имеют ли ваши статьи полные машиночитаемые метаданные.

Интервью с Патришией Фини:

— Не могли бы Вы вкратце объяснить, что такое машиночитаемые метаданные и почему так важно, чтобы журналы имели машиночитаемые метаданные для каждой из своих статей?

— Машиночитаемые метаданные — это описательные метаданные, которые могут быть «прочитаны» компьютером. Это означает, что это организованные, чистые метаданные, которые следуют определенным правилам. Сегодня многие журнальные статьи обрабатываются с использованием XML, который следует определенному набору правил, требующих четкой маркировки названий, имен авторов и тому подобного, чтобы машина могла «понимать» правила и знать, для чего предназначен каждый фрагмент данных.

Машиночитаемые метаданные очень важны для поиска. По крайней мере, каждая статья должна обладать основными метаданными, чтобы поисковые и библиотечные системы могли импортировать эти метаданные, связывать читателей с тем, что они ищут, а также помогать читателям открывать новую информацию для дальнейших исследований. Машиночитаемые метаданные также важны для правильного цитирования. Вы хотите убедиться, что статьи цитируются точно. А кто-то, глядя на вашу статюю, должен уметь найти четкую ссылку на то, что вы цитируете. Но на данный момент слишком много людей делают все это вручную, что приводит к большому числу ошибок в цитировании.

Примечание РАЦС:

Crossref имеет собственную схему метаданных, которую должны соблюдать все участники. Они должны иметь возможность создавать XML и отправлять его в Crossref в соответствии с правилами схемы метаданных. Система Гефест, разработанная РАЦС, помогает генерировать XML для регистрации DOI в Crossref и DataCite, а также преобразовывать метаданные из Российского Индекса Научного Цитирования (РИНЦ) в xml для регистрации DOI. Помимо этого, при помощи Гефест можно генерировать и переносить в различные системы XML DOI (DataCite и Crossref с опцией Crossmark), РИНЦ (elibrary.ru), DOAJ, AGRIS, PubMed, Math-Net, Chemical Abstracts и GeoRef.

Я думаю, что основные метаданные, которые должны предоставить издатели, — это базовая информация о цитировании, чтобы можно было идентифицировать имеющиеся у нас записи метаданных. Поэтому важными являются заголовок, имена авторов и любые идентификаторы, такие как ISSN. Одним словом, все данные, необходимые для создания полной записи.

— Какие рекомендации по метаданным Вы бы предложили? Что бы Вы назвали основными плюсами и минусами?

— Есть несколько довольно простых советов для формирования метаданных журнала. Это может быть довольно сложно, если вы делаете это вручную (примечание РАЦС: система Гефест позволяет предоставить все необходимые метаданные и осуществить их проверку). Я думаю, что для журналов, в частности, важно обращать внимание на информацию об авторах — именно здесь у нас может быть много проблем с неверными данными. Включение ORCID в метаданные помогает решить проблемы идентификации автора. Если издатели еще этого не делают, им следует рассмотреть возможность получения ORCID от авторов. Другой совет – уделять больше времени проверки метаданных. Вы можете подумать, что это требует слишком много усилий, и что овчинка не стоит выделки. Но журналы должны знать, что оно того стоит. Метаданные перемещаются очень далеко, и важно убедиться, что детали верны.

— Можете ли Вы объяснить новый инструмент отчетов об участии? Как участники могут использовать это?

— Наши отчеты об участии решают одну из самых больших проблем.

Инструмент позволяет понять, являются ли полными метаданные, которые представили журналы. По сути, он проверяет, отправляете ли вы нам все метаданные, которые, по вашему мнению, отправляете.

При первом входе на страницу отчетов появляется окно поиска, которое можно использовать для просмотра отчетов по имени участника или издателю. Далее вы можете найти конкретный заголовок статьи. В отчетах по издателю, вы увидите сводку всех данных в своем журнале или журналах. Вы можете посмотреть какой статус метаданных у текущего контента, а также, сколько объектов было зарегистрировано в Crossref.

Это очень простой инструмент, который позволяет получить много ценной информации. Например, он показывает, отправляются полные ссылки или нет. Отчеты не дадут информации о качестве ваших метаданных. Например, вы не сможете определить, верны ли имена авторов, но они покажут, сколько статей имеют ORCID. Участники, работающие со спонсорами, могут не иметь четкого представления о том, что они нам отправляют. Или если участник работает с системой, которая обрабатывает большое количество статей, и которой может быть очень сложно проверить каждую из них, отчеты помогут увидеть, попадают ли ссылки в Crossref. Поэтому я думаю, что это очень простой, но мощный инструмент. Отчеты находятся в свободном доступе, все пользователи могут просматривать метаданные издателя.

— Каковы основные преимущества для журналов в использовании отчетов для проверки своих метаданных? Что Вы надеетесь получить от этого нового инструмента?

 Я думаю, что реальная выгода для наших участников заключается в том, что отчеты дают представление о качестве метаданных, которые они отправляют в Crossref. В ходе обсуждений с участниками мы обнаружили, что многие из них хотят присылать нам более качественные метаданные, но иногда им трудно получить общую картину того, как их записи обрабатываются Crossref. Так что это своего рода первый шаг к тому, чтобы позволить издателям увидеть это самим. Это облегчит им просмотр статей и позволит понять, не теряются ли какие-либо метаданные, которые они отправляют.

Мы надеемся, что этот новый инструмент повысит осведомленность о различных типах метаданных, которые могут быть отправлены в Crossref. Наши участники знают, что им нужно отправлять нам базовые метаданные цитирования, но они могут не знать, что могут отправлять нам, например, URL-адреса с текстом и данными. Посмотрев на этот отчет, участники смогут увидеть опции метаданных, которые они еще не используют. Это может привести к тому, что они начнут посылать нам дополнительные метаданные.

Инструмент «Отчет об участии» все еще находится на стадии бета-тестирования, и мы хотели бы получить больше отзывов о нем и в целом больше отзывов о том, что нужно нашим членам от нас, чтобы понять и улучшить качество их метаданных.

Рубрики
Новости

Почему выпускать научный журнал только в pdf — это очень плохо? (Часть 2)

В издании «The Atlantic» вышла статья с заголовком «Научная публикация устарела», проиллюстрированная изображением горящей рукописи. Подзаголовок ниже немного обнадёживает — «Вот что будет дальше».

Что же будет дальше? Куда мы движемся? Статья, написанная бывшим редактором «The Atlantic» Джеймсом Сомерсом, не констатирует смерть научной публикации, как можно быстро догадаться из названия. Она говорит о том, что представление исследований, основанное преимущественно на бумаге, становится устаревшим. Сомерс утверждает, что печать журналов и публикация статей в формате PDF на бумажных носителях в Интернете не позволяет проводить динамические презентации исследований, необходимые для авторов и читателей. Он задает вопрос: «Что бы вы получили, если бы сегодня создавали научную статью с нуля?». В статье рассматривается альтернативный вариант научной публикации, созданный при помощи так называемого формата computational notebook.

Станет ли computational notebook основным издательским форматом, еще предстоит определить. Как отмечает Сомерс, это потребует кардинальных изменений в академических исследованиях и издательской среде в целом. И действительно ли PDF так устарел? Мы обсуждали ограничения PDF-файлов в первой части этой статьи. Формат PDF не поддерживает мультимедийные файлы, и такие материалы очень сложно воспринимать с экрана мобильных устройств. Но PDF-файлы имеют свои преимущества. PDF-файлы — лучший формат для ученых, которые предпочитают читать физические копии статей, так как этот формат позволяет распечатать нужный материал, и быть уверенным, что копия будет идентична оригиналу. PDF-файлы также можно сохранять в формате e-book, что делает их легко транспортируемыми. Так что есть причины не списывать PDF со счетов.

Однако если оставить в стороне дискуссию о полезности PDF-файлов, становится очевидно, что использование онлайн-формата публикации на бумажной основе не позволяет обеспечить максимально возможный пользовательский опыт для читателей-людей или для растущего числа читателей-машин (поисковые системы, репозитории, агрегаторы и т. д.). Машины должны уметь обрабатывать информацию на языках компьютерной разметки, а ученым необходимо уметь добавлять динамические элементы в документы, анализировать данные и просто читать статьи на своих мобильных устройствах, не жалуясь на неудобства.

Изменения, внедряемые в журналы различных дисциплин, которые могут значительно расширить онлайновую доступность и полезность научных публикаций – это публикация статей в HTML и полнотекстовый XML. Создание этих дополнительных форматов статей не обязательно требует дополнительных этапов производства. Применяя процессы набора текста с использованием цифровых технологий, журналы могут одновременно создавать несколько файлов статей. Как система Гефест, разработанная РАЦС, позволяет осуществлять разметку научных статей для добавления в различные репозитории вы можете узнатьздесь.

Почему необходимы другие типы файлов в дополнение к PDF?

Поиск – краеугольный камень научных исследований

Давайте сначала проанализируем одну из самых больших проблем публикации в PDF – ограниченный поиск по содержанию исследования. В сфере цифровых публикаций поиск – это основа всего, краеугольный камень научного знания. В отчете 2018 года «Как читатели обнаруживают контент в научных публикациях», подготовленном Renew Publishing Consultants, говорится, что «академические исследователи (группа исключает студентов) оценивают поисковые системы как наиболее важный ресурс для поиска научных статей». Отчет включает наукометрические базы данных (например, PubMed Central), а также более распространенные научные поисковые системы, такие как Google Scholar.

Существуют две основные модели сбора и обработки информации репозиториями и поисковыми системами, чтобы узнать, что возвращать в результатах поиска: (1) метаданные и депозиты контента, и (2) поисковые роботы (crawlers). В обоих этих сценариях PDF не соответствует стандартам. В случае внесения метаданных и хранения содержимого, PDF-файлы не являются машиночитаемым вариантом. Большинство баз данных требуют, чтобы метаданные и депозиты контента передавались им в JATS-совместимом XML. Журналы, которые не создают машиночитаемых файлов статей XML, могут вручную вводить метаданные в некоторые индексы, но это утомительный процесс, который не позволяет ввести всю информацию, необходимую для эффективной обработки данных.

В случае поисковых систем, работа которых основана на поисковых роботах, PDF-файлы также представляют собой проблему. Хоть они и могут быть проиндексированы многими поисковыми системами, их содержание не оптимизировано для поиска по нескольким причинам. Во-первых, в статьях PDF часто отсутствуют адекватные метаданные HTML, потому что многие журналы не размещают их на страницах веб-сайта, а ссылаются непосредственно на сам PDF. Для эффективного индексирования веб-сайтов журналов, сканеры должны иметь возможность находить каждую статью журнала на отдельной веб-странице, с которой связаны метаданные статьи на уровне HTML. Файлы PDF сами по себе не предоставляют сканерам необходимые метаданные.

Чтобы оптимизировать статьи для поисковых систем, журналы должны размещать каждую из своих статей на указанной веб-странице статьи, которая включает библиографические метаданные на уровне HTML. На самом деле это основное требование к журналам, чтобы быть проиндексированными в Google Scholar. Журналы могут выполнить это требование, имея отдельные веб-страницы для PDF-версий каждой из статей, в идеале, с помощью встроенного в веб-страницу средства просмотра PDF, вместо того, чтобы страницы статей ссылались на файлы PDF. Отображение статей в формате PDF на веб-страницах помогает поисковым системам «понять», как они связаны с другим контентом на веб-сайте, и повышает вероятность сканирования дополнительных страниц.

Однако даже при размещении на отдельных веб-страницах PDF-файлы могут содержать ограничения по ссылкам. Бывает утомительно добавлять кликабельные ссылки в PDF-файлах, тогда как HTML более удобен для добавления интерактивных ссылок в текст. Статьи HTML также улучшают работу пользователей, когда дело доходит до ссылок. Они позволяют пользователям открывать ссылки на отдельных вкладках, сохраняя при этом их место чтения в статье. PDF-файлы часто открывают ссылки в одной вкладке, в результате чего читатель перебрасывается на другую страницу и теряет то место, которое он читал ранее.

Следующим, но не менее серьезным ограничением PDF-файлов в современном поиске является неадаптированность для мобильных устройств. Сегодня многие поисковые системы, в том числе Google, переходят на индексацию с мобильных устройств. Сканеры индексируют и ранжируют удобный для мобильных устройств контент перед контентом, который не оптимизирован для мобильных устройств. Поэтому оптимизация издания под чтение с мобильных устройств является залогом его конкурентоспособности.

Читатели становятся все более мобильными

Помимо поиска, существуют также очевидные преимущества для читателей при создании статей на удобном для мобильных устройств HTML. Поскольку мобильное использование растет среди широкой публики, оно также увеличивается в академических кругах. В отчете «Как читатели находят контент в научных публикациях» за 2015 год было установлено следующее: исследователи продолжают в основном использовать настольные компьютеры и ноутбуки для исследований и написания статей, но, не смотря на это, наблюдается явное увеличение использования мобильных устройств респондентами в разных дисциплинах. Это особенно актуально в странах с низким уровнем дохода, где количество пользователей мобильной связи почти удвоилось. Поскольку весь мир становится все более мобильным, ученые должны иметь возможность быстро и легко получать доступ к исследованиям. А для стран с низким уровнем дохода мобильные устройства зачастую более доступны, чем компьютеры.

Возможности для улучшения читательского опыта и использования

Публикация PDF-файлов сама по себе ограничивает использование новых возможностей чтения и использования статей в Интернете. Например, некоторые издатели и базы данных контента начинают вводить расширенные метаданные статьи. Расширенные метаданные включают в себя семантические элементы контента, которые могут помочь базам данных не только понять, что это за контент, но и о чем он. В недавнем интервью Джабин Уайт, вице-президент по управлению контентом JSTOR и Portico, сделал большой доклад о расширенных метаданных. Как он отметил, наличие полнотекстового XML является важной предпосылкой для того, чтобы издатели, репозитории и распространители контента, такие как JSTOR, могли эффективно создавать расширенные метаданные.

Помимо поддержки создания расширенных метаданных, полнотекстовые XML-файлы также более удобны для анализа текста и данных, где для получения информации о статье используются онлайновые сценарии или инструменты машинного обучения. Например, ученый может использовать анализ текста и данных для составления совокупности статей, которые ссылаются на конкретный предмет, или для анализа связанных наборов данных в разных статьях. Новые инструменты машинного обучения продемонстрировали, что хотя и есть возможность анализировать PDF-файлы, технически это очень сложно. Например, Scite анализирует цитирование статей, чтобы определить, подтверждают или противоречат исследования друг друг. Для Scite и других инструментов машинного обучения, переход всех статей в машиночитаемый формат станет важным шагом вперёд. В настоящее же время им приходится анализировать и PDF, так как PDF-файлы являются преобладающим форматом публикации.

Гибкий опыт чтения для различных потребностей

При рассмотрении плюсов и минусов PDF, а также других типов файлов, читаемых человеком и машиной, становится очевидным, что каждый тип файла отвечает различным потребностям. PDF-файл остается оптимальным вариантом для журналов, который может дать читателям возможность легко распечатывать копии статей. Но для эффективности процесса цитирования и обработки информации, выпуск журналов в HTML и XML имеет первостепенное значение.