<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">ellibs</journal-id><journal-title-group><journal-title xml:lang="ru">Электронные библиотеки</journal-title><trans-title-group xml:lang="en"><trans-title>Russian Digital Libraries Journal</trans-title></trans-title-group></journal-title-group><issn pub-type="epub">1562-5419</issn><publisher><publisher-name>Казанский (Приволжский) федеральный университет</publisher-name></publisher></journal-meta><article-meta><article-id custom-type="elpub" pub-id-type="custom">ellibs-99</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>Статьи</subject></subj-group></article-categories><title-group><article-title>Алгоритм определения переводов статей с использованием статистических данных</article-title><trans-title-group xml:lang="en"><trans-title>Algorithm for linking translated articles using authorship statistics</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Козицын</surname><given-names>А. С.</given-names></name></name-alternatives><email xlink:type="simple">alexanderkz@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Афонин</surname><given-names>С. А.</given-names></name></name-alternatives><email xlink:type="simple">serg@msu.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Зензинов</surname><given-names>А. А.</given-names></name></name-alternatives><email xlink:type="simple">andrey.zenzinov@gmail.com</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff xml:lang="ru" id="aff-1"><institution>НИИ механики Московского государственного университета им. М.В. Ломоносова</institution><country>Russian Federation</country></aff><pub-date pub-type="collection"><year>2018</year></pub-date><pub-date pub-type="epub"><day>28</day><month>12</month><year>2018</year></pub-date><volume>21</volume><issue>6</issue><fpage>494</fpage><lpage>505</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Козицын А.С., Афонин С.А., Зензинов А.А., 2018</copyright-statement><copyright-year>2018</copyright-year><copyright-holder xml:lang="ru">Козицын А.С., Афонин С.А., Зензинов А.А.</copyright-holder><copyright-holder xml:lang="en">Козицын А.С., Афонин С.А., Зензинов А.А.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://ellibs.elpub.ru/jour/article/view/99">https://ellibs.elpub.ru/jour/article/view/99</self-uri><abstract><p>В настоящее время происходит активное внедрение наукометрических систем для автоматизации процесса анализа эффективности деятельности научных организаций с целью применения различных методов стимулирования научной деятельности. Одними из наиболее важных индикаторов являются количество публикаций и их цитируемость. Для оценки этих показателей необходимы средства автоматизированного построения связей между оригинальными статьями и их переводами. В настоящей работе проанализированы существующие методы оценки близости оригинального текста и его возможного перевода, показана их недостаточная эффективность для построения связей между статьями и описаня разработанный авторами метод автоматического поиска переводов статей в больших коллекциях библиографических данных. Особенностью разработанного алгоритма является использование статистических данных о публикации статей в различных журналах и информации о соавторах анализируемых статей. Представленный в настоящей работе алгоритм позволяет осуществлять поиск переводов статей без предварительной настройки на заданные пары языков оригинала и перевода статьи, а также не требует использования больших коллекций обучающих выборок. Апробация программной реализации алгоритма проводилась в наукометрической системе Московского государственного университета (МГУ) им. М.В. Ломоносова. Результаты тестирования показали ее достаточную эффективность и возможность использования разработанного алгоритма для автоматического построения рекомендаций пользователям для отметки в системе переводных версий статей.
</p></abstract><trans-abstract xml:lang="en"><p>During the last decades scientometric techniques have been used for research activity stimulation. Number of published articles and number of their citation counts are among the most important scientometric parameters. In an automated environment, when the publications metadata is gathered from various sources, correct linking of original papers with their translations into different languages is extremely important. In the paper we show that the known text similarity measures are inefficient in the context of article linkage problem. We propose a method for semi-automatic article linkage using statistical data on authors publication activities only. This approach may be used for linking articles without training for the language of translation. The method was evaluated on real-world collection of publications metadata of ISTINA information system.
</p></trans-abstract><kwd-group xml:lang="ru"><kwd>библиографические данные</kwd><kwd>анализ графов</kwd><kwd>перевод</kwd><kwd>статья</kwd><kwd>статистика</kwd><kwd>наукометрия</kwd><kwd>цитирование</kwd><kwd>автоматизированные системы</kwd></kwd-group><kwd-group xml:lang="en"><kwd>bibliographic data</kwd><kwd>graph analysis</kwd><kwd>translation</kwd><kwd>article</kwd><kwd>statistics</kwd><kwd>scientometrics</kwd><kwd>citation</kwd><kwd>automated systems</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Налимов В.В., Мульченко З.М. Наукометрия. Изучение науки как информационного процесса. Москва: Наука, 1969. 340 с.</mixed-citation><mixed-citation xml:lang="en">Налимов В.В., Мульченко З.М. Наукометрия. Изучение науки как информационного процесса. Москва: Наука, 1969. 340 с.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">URL: http://www.library.spbu.ru</mixed-citation><mixed-citation xml:lang="en">URL: http://www.library.spbu.ru</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">URL: http://library.bmstu.ru/Publications/</mixed-citation><mixed-citation xml:lang="en">URL: http://library.bmstu.ru/Publications/</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Алехина Е.И. Информационная система учета научно-исследовательской деятельности сотрудников вуза // Инновационная наука. 2018. №5-1. С. 9–12.</mixed-citation><mixed-citation xml:lang="en">Алехина Е.И. Информационная система учета научно-исследовательской деятельности сотрудников вуза // Инновационная наука. 2018. №5-1. С. 9–12.</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Столяров Р.А., Чугреев В.Л. Автоматизированная система учета результатов интеллектуальной деятельности в научной организации. URL: http://vtr.vscc.ac.ru/article/1512</mixed-citation><mixed-citation xml:lang="en">Столяров Р.А., Чугреев В.Л. Автоматизированная система учета результатов интеллектуальной деятельности в научной организации. URL: http://vtr.vscc.ac.ru/article/1512</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Садовничий В.А., Васенин В.А. Интеллектуальная система тематического исследования наукометрических данных: предпосылки создания и методология разработки. Часть 1 // Программная инженерия. 2018. Т. 9. №2. С. 51–58.</mixed-citation><mixed-citation xml:lang="en">Садовничий В.А., Васенин В.А. Интеллектуальная система тематического исследования наукометрических данных: предпосылки создания и методология разработки. Часть 1 // Программная инженерия. 2018. Т. 9. №2. С. 51–58.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Васенин В.А., Занчурин М.А., Козицын А.С. и др. Архитектурно-технологические аспекты разработки и сопровождения больших информационно-аналитических систем в сфере науки и образования // Программная инженерия. 2017. Т. 8. № 10. С. 448–455.</mixed-citation><mixed-citation xml:lang="en">Васенин В.А., Занчурин М.А., Козицын А.С. и др. Архитектурно-технологические аспекты разработки и сопровождения больших информационно-аналитических систем в сфере науки и образования // Программная инженерия. 2017. Т. 8. № 10. С. 448–455.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Васенин В.А., Иткес A.А. Внедрение реляционной модели логического разграничения доступа в web-приложения информационных систем, разработанных на основе библиотеки django // Программная инженерия. 2018. Т. 9. № 5. С. 195–208.</mixed-citation><mixed-citation xml:lang="en">Васенин В.А., Иткес A.А. Внедрение реляционной модели логического разграничения доступа в web-приложения информационных систем, разработанных на основе библиотеки django // Программная инженерия. 2018. Т. 9. № 5. С. 195–208.</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Васенин В.А., Иткес А.А., Бухонов В.Ю., Галатенко А.В. Модели логического разграничения доступа в многопользовательских системах управления наукометрическим контентом // Программная инженерия. 2016. Т. 7. № 12. С. 547–558.</mixed-citation><mixed-citation xml:lang="en">Васенин В.А., Иткес А.А., Бухонов В.Ю., Галатенко А.В. Модели логического разграничения доступа в многопользовательских системах управления наукометрическим контентом // Программная инженерия. 2016. Т. 7. № 12. С. 547–558.</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Коряков Д.Е. Наукометрия. Зачем нужны разные индексы. URL: https://www.mcb.nsc.ru/sites/mcb.nsc.ru/files/fck/file/naukometriya_2.pdf</mixed-citation><mixed-citation xml:lang="en">Коряков Д.Е. Наукометрия. Зачем нужны разные индексы. URL: https://www.mcb.nsc.ru/sites/mcb.nsc.ru/files/fck/file/naukometriya_2.pdf</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Автоматический переводчик «Гугл». URL: https://translate.google.ru/</mixed-citation><mixed-citation xml:lang="en">Автоматический переводчик «Гугл». URL: https://translate.google.ru/</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Автоматический переводчик «Промпт». URL: http://www.translate.ru</mixed-citation><mixed-citation xml:lang="en">Автоматический переводчик «Промпт». URL: http://www.translate.ru</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Научная конференция «Обнаружение заимствований – 2017». URL: http://www.oz2017.ru</mixed-citation><mixed-citation xml:lang="en">Научная конференция «Обнаружение заимствований – 2017». URL: http://www.oz2017.ru</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Плагиат в научных статьях: трудности обнаружения перевода. URL: http://ai-news.ru/2018/01/plagiat_v_nauchnyh_statyah_trudnosti_obnaruzheniya_ perevoda.html</mixed-citation><mixed-citation xml:lang="en">Плагиат в научных статьях: трудности обнаружения перевода. URL: http://ai-news.ru/2018/01/plagiat_v_nauchnyh_statyah_trudnosti_obnaruzheniya_ perevoda.html</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">Афонин С.А., Гаспарянц А.Э. Автоматическое построение функции оценки качества в задаче разрешения неоднозначности имен авторов научных публикаций // Программная инженерия. 2015. № 10. С. 31–37.</mixed-citation><mixed-citation xml:lang="en">Афонин С.А., Гаспарянц А.Э. Автоматическое построение функции оценки качества в задаче разрешения неоднозначности имен авторов научных публикаций // Программная инженерия. 2015. № 10. С. 31–37.</mixed-citation></citation-alternatives></ref><ref id="cit16"><label>16</label><citation-alternatives><mixed-citation xml:lang="ru">Наукометрическая система «ИСТИНА». URL: https://istina.msu.ru/</mixed-citation><mixed-citation xml:lang="en">Наукометрическая система «ИСТИНА». URL: https://istina.msu.ru/</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
