Data sharing в науке: нужно ли публиковать свои данные и где это делать
Публикация научной статьи сегодня всё чаще сопровождается требованием раскрытия исходных данных исследования. Data sharing — это практика открытого предоставления данных, использованных в научной работе, для проверки, повторного анализа и дальнейшего использования другими исследователями. Если ещё несколько лет назад это считалось дополнительной опцией, то сейчас во многих журналах это становится обязательным стандартом.
Разберёмся, нужно ли публиковать данные, какие требования предъявляют журналы и где именно размещать исследовательские материалы.
Что такое data sharing и почему это стало стандартом
Data sharing — это предоставление доступа к данным, лежащим в основе научной публикации. Это могут быть числовые массивы, результаты экспериментов, анкеты, изображения, коды и любые другие материалы, на которых основаны выводы статьи.
Проконсультироваться бесплатно
Подскажем по публикации в журналах ВАК, требованиям к статье, срокам и редакционной подготовке материала.
Ключевая задача этой практики — повышение прозрачности науки. Когда данные доступны, другие исследователи могут проверить результаты, воспроизвести эксперимент или использовать эти данные для новых исследований.
(https://lib-os.ru/faq/otkrytye-dannye/)Открытые данные определяются как информация, которую можно свободно использовать, повторно применять и распространять при условии указания источника, что делает их фундаментом современной научной открытости и повторяемости исследований .
Кроме того, data sharing напрямую связан с проблемой воспроизводимости. В последние годы значительная часть научных результатов не могла быть проверена именно из-за отсутствия доступа к исходным данным.
(https://data.rcsi.science/publications/news/108/)Эксперты отмечают, что развитие цифровых технологий привело к росту объемов данных и усилило потребность в их открытом обмене, поскольку именно доступность данных становится ключевым условием эффективного научного взаимодействия .
Таким образом, data sharing постепенно превращается из дополнительной практики в стандарт научных публикаций, без которого невозможно обеспечить прозрачность, проверяемость и развитие исследований.
Обязательно ли публиковать данные
Ответ зависит от журнала и области исследования, однако общий тренд однозначен: требования ужесточаются.
Во многих международных журналах политика data sharing уже является обязательной. При подаче статьи автор должен:
Публикация в журнале, входящем в RSCI
Если нужен более сильный индексируемый контур, на сайте есть отдельное направление для публикации в изданиях уровня RSCI.
- Подбор релевантного журнала
- Экспертная редактура
- Поддержка по этапам публикации
указать, где размещены данные
предоставить ссылку на репозиторий
описать условия доступа
В ряде случаев без этого статья просто не принимается к рассмотрению.
В российских журналах требования пока менее жесткие, но также постепенно усиливаются. Всё чаще редакции требуют хотя бы указать доступность данных (data availability statement).
Отмечается, что внедрение политики открытых данных становится важной частью научных публикаций и влияет на их качество.
Какие данные нужно публиковать
Не все данные подлежат обязательному раскрытию. Однако существует общий принцип: публиковать следует те данные, которые необходимы для проверки результатов.
К таким данным относятся:
исходные экспериментальные результаты
обработанные наборы данных
статистические выборки
алгоритмы и программный код
Если данные являются слишком объемными или чувствительными, допускаются ограничения доступа, но это должно быть обосновано.
Когда данные можно не раскрывать
Существуют ситуации, когда полное раскрытие данных невозможно или нежелательно.
Это касается, например, медицинских исследований, где данные могут содержать персональную информацию. В таких случаях необходимо соблюдать требования конфиденциальности. Также ограничения возможны при коммерческой тайне или использовании данных третьих лиц.
Эксперты подчеркивают, что баланс между открытостью и защитой данных является одной из ключевых задач современной науки.
Где публиковать научные данные
Выбор площадки для размещения данных — один из самых важных вопросов для автора. Существует несколько типов репозиториев.
Первый вариант — международные универсальные репозитории. Они подходят для большинства дисциплин и обеспечивают стабильное хранение данных.
Среди наиболее известных:
Zenodo
Figshare
Dryad
Эти платформы позволяют получить DOI для набора данных, что делает его полноценным научным объектом.
Второй вариант — специализированные репозитории по дисциплинам. Например, для генетики, медицины или социальных наук существуют отдельные базы данных.
Третий вариант — институциональные репозитории университетов и научных организаций.
Как правильно оформить публикацию данных
Публикация данных — это не просто загрузка файлов. Существует ряд требований, которые необходимо соблюдать.
Во-первых, данные должны быть структурированы и понятны. Желательно сопровождать их описанием (metadata), чтобы другие исследователи могли разобраться в содержании.
Во-вторых, необходимо указать формат файлов и способы их использования.
В-третьих, важно выбрать лицензию. Чаще всего используются открытые лицензии, позволяющие свободное использование данных с указанием авторства.
Data availability statement: что это такое
Практически все современные журналы требуют включать в статью специальный раздел — Data availability statement.
В нем указывается:
где размещены данные
ссылка на репозиторий
условия доступа
Если данные не публикуются, автор должен объяснить причину.
Этот раздел становится обязательным элементом научной статьи.
Преимущества публикации данных
Несмотря на то что подготовка данных к публикации требует дополнительных ресурсов — времени, технической подготовки и внимательной проработки материалов, — практика data sharing дает авторам существенные профессиональные и научные преимущества.
Прежде всего, речь идет о росте доверия к исследованию. В условиях, когда научное сообщество все чаще сталкивается с проблемой воспроизводимости результатов, открытые данные становятся своего рода маркером качества работы. Если автор предоставляет доступ к исходным материалам, это демонстрирует уверенность в корректности выводов и готовность к проверке. Для редакторов и рецензентов это дополнительный сигнал надежности исследования, а для читателей — фактор, повышающий доверие к публикации.
Второй важный аспект — влияние на цитируемость. Международные эмпирические исследования в области научной коммуникации показывают, что статьи, сопровождаемые открытыми данными, в среднем цитируются чаще. Это объясняется тем, что такие работы легче использовать в дальнейших исследованиях: ученым не нужно заново собирать данные, они могут опираться на уже опубликованные массивы. В результате статья становится частью более широкого научного оборота.
Третье преимущество связано с тем, что сами данные превращаются в самостоятельный научный продукт. Размещая набор данных в репозитории с присвоением DOI (например, через Zenodo или Figshare), автор получает дополнительный объект цитирования. Это особенно важно в условиях, когда оценка научной деятельности increasingly учитывает не только статьи, но и сопутствующие материалы: базы данных, программный код, методики.
Кроме того, публикация данных способствует расширению научных связей. Открытые наборы данных могут заинтересовать исследователей из других областей, что повышает вероятность междисциплинарного сотрудничества. В ряде случаев именно доступность данных становится отправной точкой для новых совместных проектов.
Наконец, стоит отметить институциональный фактор. Все больше грантодателей и научных организаций требуют соблюдения принципов открытой науки. Наличие опыта работы с открытыми данными повышает конкурентоспособность автора при подаче заявок на финансирование и участии в международных проектах.
Риски и опасения авторов
Несмотря на очевидные преимущества, многие исследователи по-прежнему относятся к публикации данных с осторожностью. Эти опасения во многом объяснимы и связаны как с профессиональными, так и с психологическими факторами.
Один из наиболее распространенных страхов — риск недобросовестного использования данных. Авторы опасаются, что другие исследователи могут использовать опубликованные наборы без корректного указания источника или попытаться «перехватить» дальнейшее развитие темы. Особенно это актуально в конкурентных областях, где скорость публикации играет критическую роль.
Еще одно опасение связано с возможным выявлением ошибок. Открытые данные делают исследование полностью прозрачным, а значит, любой специалист может провести повторный анализ. Для многих авторов это психологически сложный момент, особенно если речь идет о больших и сложных массивах данных. Однако важно понимать, что выявление и корректировка ошибок — это нормальная часть научного процесса, а не репутационный риск.
Также существует проблема интерпретации данных. Без достаточного контекста другие исследователи могут неправильно понять структуру или особенности набора данных, что приведет к некорректным выводам. Именно поэтому так важна качественная документация.
Отдельная категория рисков связана с юридическими и этическими ограничениями. В медицинских, социальных и прикладных исследованиях данные могут содержать персональную или конфиденциальную информацию. В таких случаях требуется анонимизация или частичное ограничение доступа.
Тем не менее, современная научная практика показывает, что при грамотном подходе эти риски управляемы. Использование лицензий, выбор проверенных репозиториев и качественная документация существенно снижают вероятность проблем. В итоге преимущества открытости, как правило, оказываются более значимыми, чем потенциальные угрозы.
Практические рекомендации для авторов
Эффективная работа с данными начинается задолго до момента публикации статьи. На практике успешный data sharing — это результат правильно выстроенного процесса управления данными на всех этапах исследования.
Первое, на что следует обратить внимание, — организация хранения данных. Уже на этапе сбора информации важно продумать структуру файлов, систему наименований и резервное копирование. Использование облачных сервисов или институциональных хранилищ помогает избежать потери данных и упрощает дальнейшую работу.
Второй ключевой элемент — документирование. Каждое действие с данными должно быть зафиксировано: от методов сбора до этапов обработки. Это включает описание переменных, используемых инструментов, параметров анализа. Без такой документации даже автор через некоторое время может столкнуться с трудностями при интерпретации собственных данных, не говоря уже о сторонних исследователях.
Третий аспект — учет требований журналов. Перед подачей статьи необходимо внимательно изучить политику издания в отношении data sharing. Некоторые журналы требуют обязательного размещения данных в конкретных репозиториях или предоставления определенного формата описания.
Выбор репозитория также имеет принципиальное значение. Предпочтение стоит отдавать проверенным платформам, которые обеспечивают долговременное хранение, присвоение DOI и соответствие международным стандартам. Универсальные решения, такие как Dryad, подходят для большинства дисциплин, однако в ряде случаев лучше использовать специализированные базы.
Не менее важно правильно оформить публикацию данных. Это включает подготовку метаданных, выбор формата файлов, указание лицензии на использование. Четкое описание условий доступа помогает избежать недоразумений и защищает интересы автора.
Наконец, стоит рассматривать публикацию данных не как дополнительную нагрузку, а как инвестицию в собственную научную репутацию. Грамотно оформленные и доступные данные повышают видимость исследования, способствуют цитируемости и формируют образ автора как современного и ответственного исследователя.
В итоге можно сказать, что data sharing — это уже не опция, а часть профессионального стандарта. И чем раньше автор начинает выстраивать работу с данными системно, тем легче ему адаптироваться к требованиям современной науки.
Заключение
Data sharing становится неотъемлемой частью современной науки. Публикация данных повышает прозрачность, доверие и качество исследований.
Для авторов это означает необходимость адаптации к новым требованиям и освоения новых инструментов.
В ближайшие годы практика открытых данных станет стандартом для большинства научных журналов, а значит — умение работать с данными станет ключевым навыком исследователя.
I.kazarova@panor.ru