<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">ellibs</journal-id><journal-title-group><journal-title xml:lang="ru">Электронные библиотеки</journal-title><trans-title-group xml:lang="en"><trans-title>Russian Digital Libraries Journal</trans-title></trans-title-group></journal-title-group><issn pub-type="epub">1562-5419</issn><publisher><publisher-name>Казанский (Приволжский) федеральный университет</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.26907/1562-5419-2023-26-1-35-51</article-id><article-id custom-type="elpub" pub-id-type="custom">ellibs-364</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>Статьи</subject></subj-group></article-categories><title-group><article-title>Анализ распределения ключевых терминов в научных статьях</article-title><trans-title-group xml:lang="en"><trans-title>Analysis of the Distribution of Key Terms in Scientific Articles</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Власова</surname><given-names>С. А.</given-names></name><name name-style="western" xml:lang="en"><surname>Vlasova</surname><given-names>S. A.</given-names></name></name-alternatives><email xlink:type="simple">vlas.svetlana2013@yandex.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Каленов</surname><given-names>Н. Е.</given-names></name><name name-style="western" xml:lang="en"><surname>Kalenov</surname><given-names>N. E.</given-names></name></name-alternatives><email xlink:type="simple">nekalenov@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Соболевская</surname><given-names>И. Н.</given-names></name><name name-style="western" xml:lang="en"><surname>Sobolevskaya</surname><given-names>I. N.</given-names></name></name-alternatives><email xlink:type="simple">nik_first@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Межведомственный суперкомпьютерный центр (МСЦ) РАН – филиал ФГУ ФНЦ Научно-исследовательский институт системных исследований (НИИСИ) РАН</institution></aff><aff xml:lang="en"><institution>Joint Supercomputer Center of the Russian Academy of Sciences – JSC</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2023</year></pub-date><pub-date pub-type="epub"><day>28</day><month>02</month><year>2023</year></pub-date><volume>26</volume><issue>1</issue><fpage>35</fpage><lpage>51</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Власова С.А., Каленов Н.Е., Соболевская И.Н., 2023</copyright-statement><copyright-year>2023</copyright-year><copyright-holder xml:lang="ru">Власова С.А., Каленов Н.Е., Соболевская И.Н.</copyright-holder><copyright-holder xml:lang="en">Vlasova S.A., Kalenov N.E., Sobolevskaya I.N.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://ellibs.elpub.ru/jour/article/view/364">https://ellibs.elpub.ru/jour/article/view/364</self-uri><abstract><p>Одними из основных компонентов Единого Цифрового Пространства Научных Знаний (ЕЦПНЗ) являются предметные онтологии отдельных тематических подпространств, включающие в себя основные понятия, относящиеся к данному научному направлению. Задача построения предметных онтологий на первом этапе требует формирования массива ключевых терминов в заданной области науки с последующим установлением связей между ними. Аналогичная задача стоит и при формировании энциклопедий в части определения перечня статей (слотов), определяющего их содержание. Одним из источников формирования массива ключевых терминов могут являться метаданные статей, опубликованных в ведущих научных журналах, а именно, авторские ключевые термины («ключевые слова» – в терминологии редакций журналов), сопровождающие в обязательном порядке эти статьи. Чтобы сделать заключение о возможности использования этого подхода к формированию предметных онтологий, необходимо провести предварительный анализ массива авторских ключевых терминов как с точки зрения реального соответствия основным направлениям исследований в данном разделе науки, так и с точки зрения распределения частоты встречаемости тех или иных терминов. В данной статье приведены результаты частотного анализа встречаемости авторских ключевых терминов на русском и английском языках, проведенного на основе программной обработки нескольких тысяч статей из ведущих российских журналов по математике, информатике и физике, отраженных в базе данных MathNet и на сайтах ряда издательств. Проведена оценка соответствия распределения ключевых терминов (как словосочетаний) и отдельных слов закону Брэдфорда, выявлены ядра ключевых терминов внутри тематических направлений.
</p></abstract><trans-abstract xml:lang="en"><p>One of the Common Digital Space of Scientific Knowledge (CDSSK) main components are the subject ontologies of individual thematic subspaces, which include the basic concepts related to this scientific area. The constructing subject ontologies task at the initial phase requires the array of key terms formation in a given scientific are with the subsequent establishment of links between them. A similar task is in the encyclopedias formation in terms of the articles (slots) list generating that determines their content. One of the sources for the formation of the key terms array can be the metadata of articles published in the leading scientific journals. Namely, the author's key terms ("keywords" in the terminology of the journals editors) quoted by the article. To make a conclusion about the possibility of using this approach to the subject ontologies formation, it is necessary to conduct the author's key terms array preanalysis, both in terms of real correspondence to the main areas of research in this science branch and in terms of the distribution of the certain terms occurrence frequency. This article presents the results of the occurrence frequency analysis of the author's key terms in Russian and English, carried out on the software processing basis of several thousand articles from leading Russian journals in mathematics, computer science and physics, reflected in the MathNet database. An assessment was made of the distribution of key terms correspondence (as phrases) and individual words to the Bradford's law, and the key terms cores within the thematic direction were identified.
</p></trans-abstract><kwd-group xml:lang="ru"><kwd>цифровое пространство научных знаний</kwd><kwd>предметные онтологии</kwd><kwd>энциклопедические статьи</kwd><kwd>ключевые термины</kwd><kwd>метаданные статей</kwd><kwd>частотный анализ</kwd></kwd-group><kwd-group xml:lang="en"><kwd>digital space of scientific knowledge</kwd><kwd>subject ontologies</kwd><kwd>encyclopedia articles</kwd><kwd>key terms</kwd><kwd>article metadata</kwd><kwd>frequency analysis</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Антопольский А.Б., Каленов Н.Е., Серебряков В.А., Сотников А.Н. О едином цифровом пространстве научных знаний // Вестник Российской академии наук. 2019. Т. 89 (7). C. 728–735. URL: https://doi.org/ 10.31857/S0869-5873897728-735.</mixed-citation><mixed-citation xml:lang="en">Антопольский А.Б., Каленов Н.Е., Серебряков В.А., Сотников А.Н. О едином цифровом пространстве научных знаний // Вестник Российской академии наук. 2019. Т. 89 (7). C. 728–735. URL: https://doi.org/ 10.31857/S0869-5873897728-735.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Савин Г.И. Единое цифровое пространство научных знаний: цели и задачи // Информационные ресурсы России. 2020. № 5. С. 3–5. URL: https://doi.org/ 10.51218/0204-3653-2020-5-3-5.</mixed-citation><mixed-citation xml:lang="en">Савин Г.И. Единое цифровое пространство научных знаний: цели и задачи // Информационные ресурсы России. 2020. № 5. С. 3–5. URL: https://doi.org/ 10.51218/0204-3653-2020-5-3-5.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Большая российская энциклопедия. URL: https://bigenc.ru/ (дата обращения: 22.12.2022).</mixed-citation><mixed-citation xml:lang="en">Большая российская энциклопедия. URL: https://bigenc.ru/ (дата обращения: 22.12.2022).</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Kalenov N., Savin G., Sotnikov A. Fundamentals of Common Digital Space of Scientific Knowledge Building // CEUR Workshop Proceedings (CEUR-WS.org). 2021. Vol. 2990. P. 93–99. URL: https://doi.org/10.51218/1613-0073-2990-93-99</mixed-citation><mixed-citation xml:lang="en">Kalenov N., Savin G., Sotnikov A. Fundamentals of Common Digital Space of Scientific Knowledge Building // CEUR Workshop Proceedings (CEUR-WS.org). 2021. Vol. 2990. P. 93–99. URL: https://doi.org/10.51218/1613-0073-2990-93-99</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Михайлов О.В. Новая платформа журналов RSCI в WEB of Science Вестник Российской академии наук. 2017. Т. 87. № 2. С. 177–180.</mixed-citation><mixed-citation xml:lang="en">Михайлов О.В. Новая платформа журналов RSCI в WEB of Science Вестник Российской академии наук. 2017. Т. 87. № 2. С. 177–180.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Общероссийский портал Math-Net.ru. URL: http://www.mathnet.ru/ (дата обращения: 22.12.2022).</mixed-citation><mixed-citation xml:lang="en">Общероссийский портал Math-Net.ru. URL: http://www.mathnet.ru/ (дата обращения: 22.12.2022).</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Вычислительные методы и программирование. URL: https://num-meth.ru/index.php/journal/issue/archive (дата обращения: 22.12.2022).</mixed-citation><mixed-citation xml:lang="en">Вычислительные методы и программирование. URL: https://num-meth.ru/index.php/journal/issue/archive (дата обращения: 22.12.2022).</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Программные продукты и системы. URL: http://www.swsys.ru/index.php?page=10&amp;lang= (дата обращения: 22.12.2022)</mixed-citation><mixed-citation xml:lang="en">Программные продукты и системы. URL: http://www.swsys.ru/index.php?page=10&amp;lang= (дата обращения: 22.12.2022)</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Власова С.А., Каленов Н.Е., Сотников А.Н. Web-ориентированная система формирования контента единого цифрового пространства научных знаний // Программные продукты и системы. 2020. № 3. С. 365–374. URL: https://doi.org/10.15827/0236-235X.131.365-374.</mixed-citation><mixed-citation xml:lang="en">Власова С.А., Каленов Н.Е., Сотников А.Н. Web-ориентированная система формирования контента единого цифрового пространства научных знаний // Программные продукты и системы. 2020. № 3. С. 365–374. URL: https://doi.org/10.15827/0236-235X.131.365-374.</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
