<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">ellibs</journal-id><journal-title-group><journal-title xml:lang="ru">Электронные библиотеки</journal-title><trans-title-group xml:lang="en"><trans-title>Russian Digital Libraries Journal</trans-title></trans-title-group></journal-title-group><issn pub-type="epub">1562-5419</issn><publisher><publisher-name>Казанский (Приволжский) федеральный университет</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.26907/1562-5419-2024-27-3-366-382</article-id><article-id custom-type="elpub" pub-id-type="custom">ellibs-509</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>Статьи</subject></subj-group></article-categories><title-group><article-title>Классификация изображений с помощью сверточных нейронных сетей</article-title><trans-title-group xml:lang="en"><trans-title>Image Classification using Convolutional Neural Networks</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Филиппов</surname><given-names>Сергей Алексеевич</given-names></name><name name-style="western" xml:lang="en"><surname>Filippov</surname><given-names>Sergey Alekseevich</given-names></name></name-alternatives><email xlink:type="simple">woppilif@icloud.com</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Казанский (Приволжский) федеральный университет</institution></aff><aff xml:lang="en"><institution>Kazan (Volga region) Federal University</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2024</year></pub-date><pub-date pub-type="epub"><day>11</day><month>02</month><year>2025</year></pub-date><volume>27</volume><issue>3</issue><fpage>366</fpage><lpage>382</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Филиппов С.А., 2025</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="ru">Филиппов С.А.</copyright-holder><copyright-holder xml:lang="en">Filippov S.A.</copyright-holder><license xml:lang="ru" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p></license><license xml:lang="en" license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://ellibs.elpub.ru/jour/article/view/509">https://ellibs.elpub.ru/jour/article/view/509</self-uri><abstract><p>Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.
&#13;

Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.
&#13;

Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.
&#13;

Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.
</p></abstract><trans-abstract xml:lang="en"><p>Nowadays, many different tools can be used to classify images, each of which is aimed at solving a certain range of tasks. This article provides a brief overview of libraries and technologies for image classification. The architecture of a simple convolutional neural network for image classification is built. Image recognition experiments have been conducted with popular neural networks such as VGG 16 and ResNet 50. Both neural networks have shown good results. However, ResNet 50 overfitted due to the fact that the dataset contained the same type of images for training, since this neural network has more layers that allow reading the attributes of objects in the images. A comparative analysis of image recognition specially prepared for this experiment was carried out with the trained models.
</p></trans-abstract><kwd-group xml:lang="ru"><kwd>распознавание изображений</kwd><kwd>нейронная сеть</kwd><kwd>сверточная нейронная сеть</kwd><kwd>классификация изображений</kwd><kwd>машинное обучение</kwd></kwd-group><kwd-group xml:lang="en"><kwd>image recognition</kwd><kwd>neural network</kwd><kwd>convolutional neural network</kwd><kwd>image classification</kwd><kwd>machine learning</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Фисько Д.В. Обзор методов условной генерации изображений нейросетевыми моделями // Актуальные вопросы современной науки и технологий. 2021. С. 57–62.</mixed-citation><mixed-citation xml:lang="en">Фисько Д.В. Обзор методов условной генерации изображений нейросетевыми моделями // Актуальные вопросы современной науки и технологий. 2021. С. 57–62.</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Мосин Е.Д., Белов Ю.С. Генерация музыки с использованием двунаправленной рекуррентной нейронной сети // Научное обозрение. Технические науки. 2023. № 1. С. 10–14. https://doi.org/10.17513/srts.1419</mixed-citation><mixed-citation xml:lang="en">Мосин Е.Д., Белов Ю.С. Генерация музыки с использованием двунаправленной рекуррентной нейронной сети // Научное обозрение. Технические науки. 2023. № 1. С. 10–14. https://doi.org/10.17513/srts.1419</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Козар Б.А., Кугуракова В.В., Сахибгареева Г.Ф. Структуризация сущностей естественного текста с использованием нейронных сетей для генерации трехмерных сцен // Программные продукты и системы. 2022. Т. 35. № 3. С. 329–339. https://doi.org/10.15827/0236-235X.139.329-339.</mixed-citation><mixed-citation xml:lang="en">Козар Б.А., Кугуракова В.В., Сахибгареева Г.Ф. Структуризация сущностей естественного текста с использованием нейронных сетей для генерации трехмерных сцен // Программные продукты и системы. 2022. Т. 35. № 3. С. 329–339. https://doi.org/10.15827/0236-235X.139.329-339.</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Пантюхин Д.В. Нейронные сети синтеза речи голосовых помощников и поющих автоматов // Речевые технологии/Speech Technologies. 2021. № 3-4. С. 3–16. https://doi.org/10.58633/2305-8129_2021_3-4_3</mixed-citation><mixed-citation xml:lang="en">Пантюхин Д.В. Нейронные сети синтеза речи голосовых помощников и поющих автоматов // Речевые технологии/Speech Technologies. 2021. № 3-4. С. 3–16. https://doi.org/10.58633/2305-8129_2021_3-4_3</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Шамансуров Ш. Влияние искусственного интеллекта на развитие области синхронного перевода // Oriental renaissance: Innovative, educational, natural and social sciences. 2023. Т. 3. № 23. С. 305–309. https://doi.org/10.5281/zenodo.10365801</mixed-citation><mixed-citation xml:lang="en">Шамансуров Ш. Влияние искусственного интеллекта на развитие области синхронного перевода // Oriental renaissance: Innovative, educational, natural and social sciences. 2023. Т. 3. № 23. С. 305–309. https://doi.org/10.5281/zenodo.10365801</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Pang B., Nijkamp E., Wu Y.N. Deep learning with tensorflow: a review // Journal of Educational and Behavioral Statistics. 2020. Vol. 45. No. 2. P. 227–248. https://doi.org/10.3102/1076998619872761</mixed-citation><mixed-citation xml:lang="en">Pang B., Nijkamp E., Wu Y.N. Deep learning with tensorflow: a review // Journal of Educational and Behavioral Statistics. 2020. Vol. 45. No. 2. P. 227–248. https://doi.org/10.3102/1076998619872761</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Ketkar N., Ketkar N. Introduction to Keras // Deep learning with python: a hands-on introduction. 2017. P. 97–111. https://doi.org/10.1007/978-1-4842-2766-4_7</mixed-citation><mixed-citation xml:lang="en">Ketkar N., Ketkar N. Introduction to Keras // Deep learning with python: a hands-on introduction. 2017. P. 97–111. https://doi.org/10.1007/978-1-4842-2766-4_7</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Convolutional Neural Networks. URL: https://www.ibm.com/topics/convolutional-neural-networks</mixed-citation><mixed-citation xml:lang="en">Convolutional Neural Networks. URL: https://www.ibm.com/topics/convolutional-neural-networks</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Sapijaszko G., Mikhael W.B. An overview of recent convolutional neural network algorithms for image recognition // 2018 IEEE 61st International midwest symposium on circuits and systems (MWSCAS). IEEE, 2018. P. 743–746. https://doi.org/10.1109/MWSCAS.2018.8623911</mixed-citation><mixed-citation xml:lang="en">Sapijaszko G., Mikhael W.B. An overview of recent convolutional neural network algorithms for image recognition // 2018 IEEE 61st International midwest symposium on circuits and systems (MWSCAS). IEEE, 2018. P. 743–746. https://doi.org/10.1109/MWSCAS.2018.8623911</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">He K. et al. Deep residual learning for image recognition // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 770–778. https://doi.org/10.48550/arXiv.1512.03385</mixed-citation><mixed-citation xml:lang="en">He K. et al. Deep residual learning for image recognition // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 770–778. https://doi.org/10.48550/arXiv.1512.03385</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Nguyen V. Bayesian optimization for accelerating hyper-parameter tuning // 2019 IEEE second international conference on artificial intelligence and knowledge engineering (AIKE). IEEE. 2019. P. 302–305. https://doi.org/10.1109/AIKE.2019.00060</mixed-citation><mixed-citation xml:lang="en">Nguyen V. Bayesian optimization for accelerating hyper-parameter tuning // 2019 IEEE second international conference on artificial intelligence and knowledge engineering (AIKE). IEEE. 2019. P. 302–305. https://doi.org/10.1109/AIKE.2019.00060</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Poojary R., Raina R., Mondal A.K. Effect of data-augmentation on fine-tuned CNN model performance // IAES International Journal of Artificial Intelligence. 2021. Vol. 10. No. 1. P. 84. https://doi.org/10.11591/ijai.v10.i1.pp84-92</mixed-citation><mixed-citation xml:lang="en">Poojary R., Raina R., Mondal A.K. Effect of data-augmentation on fine-tuned CNN model performance // IAES International Journal of Artificial Intelligence. 2021. Vol. 10. No. 1. P. 84. https://doi.org/10.11591/ijai.v10.i1.pp84-92</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Tian Y., Zhang Y. A comprehensive survey on regularization strategies in machine learning // Information Fusion. 2022. Vol. 80. P. 146–166. https://doi.org/10.1016/j.inffus.2021.11.005</mixed-citation><mixed-citation xml:lang="en">Tian Y., Zhang Y. A comprehensive survey on regularization strategies in machine learning // Information Fusion. 2022. Vol. 80. P. 146–166. https://doi.org/10.1016/j.inffus.2021.11.005</mixed-citation></citation-alternatives></ref><ref id="cit14"><label>14</label><citation-alternatives><mixed-citation xml:lang="ru">Fruits 360. URL: https://www.kaggle.com/datasets/moltean/fruits</mixed-citation><mixed-citation xml:lang="en">Fruits 360. URL: https://www.kaggle.com/datasets/moltean/fruits</mixed-citation></citation-alternatives></ref><ref id="cit15"><label>15</label><citation-alternatives><mixed-citation xml:lang="ru">PyCharm, Quick start guide. URL: https://www.jetbrains.com/help/pycharm/quick-start-guide.html</mixed-citation><mixed-citation xml:lang="en">PyCharm, Quick start guide. URL: https://www.jetbrains.com/help/pycharm/quick-start-guide.html</mixed-citation></citation-alternatives></ref><ref id="cit16"><label>16</label><citation-alternatives><mixed-citation xml:lang="ru">MacOS. URL: https://www.apple.com/za/macos/what-is/</mixed-citation><mixed-citation xml:lang="en">MacOS. URL: https://www.apple.com/za/macos/what-is/</mixed-citation></citation-alternatives></ref><ref id="cit17"><label>17</label><citation-alternatives><mixed-citation xml:lang="ru">Zhang Z. Analysis of the Advantages of the M1 CPU and Its Impact on the Future Development of Apple // 2021 2nd International Conference on Big Data &amp; Artificial Intelligence &amp; Software Engineering (ICBASE). IEEE, 2021. P. 732–735. https://doi.org/10.1109/ICBASE53849.2021.00143</mixed-citation><mixed-citation xml:lang="en">Zhang Z. Analysis of the Advantages of the M1 CPU and Its Impact on the Future Development of Apple // 2021 2nd International Conference on Big Data &amp; Artificial Intelligence &amp; Software Engineering (ICBASE). IEEE, 2021. P. 732–735. https://doi.org/10.1109/ICBASE53849.2021.00143</mixed-citation></citation-alternatives></ref><ref id="cit18"><label>18</label><citation-alternatives><mixed-citation xml:lang="ru">Tensorflow Macos. URL: https://developer.apple.com/metal/tensorflow-plugin/</mixed-citation><mixed-citation xml:lang="en">Tensorflow Macos. URL: https://developer.apple.com/metal/tensorflow-plugin/</mixed-citation></citation-alternatives></ref><ref id="cit19"><label>19</label><citation-alternatives><mixed-citation xml:lang="ru">Conv2D layer. URL: https://keras.io/api/layers/convolution_layers/convolution2d/</mixed-citation><mixed-citation xml:lang="en">Conv2D layer. URL: https://keras.io/api/layers/convolution_layers/convolution2d/</mixed-citation></citation-alternatives></ref><ref id="cit20"><label>20</label><citation-alternatives><mixed-citation xml:lang="ru">MaxPooling2D layer. URL: https://keras.io/api/layers/pooling_layers/max_pooling2d/</mixed-citation><mixed-citation xml:lang="en">MaxPooling2D layer. URL: https://keras.io/api/layers/pooling_layers/max_pooling2d/</mixed-citation></citation-alternatives></ref><ref id="cit21"><label>21</label><citation-alternatives><mixed-citation xml:lang="ru">Flatten layer. URL: https://keras.io/api/layers/reshaping_layers/flatten/</mixed-citation><mixed-citation xml:lang="en">Flatten layer. URL: https://keras.io/api/layers/reshaping_layers/flatten/</mixed-citation></citation-alternatives></ref><ref id="cit22"><label>22</label><citation-alternatives><mixed-citation xml:lang="ru">Dense layer. URL: https://keras.io/api/layers/core_layers/dense/</mixed-citation><mixed-citation xml:lang="en">Dense layer. URL: https://keras.io/api/layers/core_layers/dense/</mixed-citation></citation-alternatives></ref><ref id="cit23"><label>23</label><citation-alternatives><mixed-citation xml:lang="ru">Dropout layer. URL: https://keras.io/api/layers/regularization_layers/dropout/</mixed-citation><mixed-citation xml:lang="en">Dropout layer. URL: https://keras.io/api/layers/regularization_layers/dropout/</mixed-citation></citation-alternatives></ref><ref id="cit24"><label>24</label><citation-alternatives><mixed-citation xml:lang="ru">Layer activation functions, Softmax function. URL: https://keras.io/api/layers/activations/#softmax-function</mixed-citation><mixed-citation xml:lang="en">Layer activation functions, Softmax function. URL: https://keras.io/api/layers/activations/#softmax-function</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
