000 08068nla2a2200553 4500
001 275886
005 20231029215843.0
035 _a(RuTPU)RU\TPU\book\299139
090 _a275886
100 _a20141117d2014 k y0rusy50 ca
101 0 _arus
102 _aRU
135 _adrnn ---uucaa
181 0 _ai
182 0 _ab
200 1 _aМоделирование искусственных нейронных сетей с помощью графического адаптера общего назначения
_bЭлектронный ресурс
_fА. А. Королев, А. В. Кучуганов
203 _aТекст
_cэлектронный
215 _a1 файл (496 Kb)
230 _aЭлектронные текстовые данные (1 файл : 496 Kb)
300 _aЗаглавие с титульного листа
300 _aЭлектронная версия печатной публикации
320 _a[Библиогр.: с. 75-76 (21 назв.)]
330 _aАктуальность работы обусловлена тем, что искусственные нейронные сети, будучи наиболее успешным подходом к решению некоторых задач искусственного интеллекта, предъявляют высокие требования к вычислительным ресурсам. При этом в большинстве случаев именно высокая вычислительная нагрузка оказывается ограничивающим фактором, снижающим на практике функциональность и применимость аппарата искусственных нейронных сетей. Цель работы: повышение эффективности при решении задач искусственного интеллекта с применением искусственных нейронных сетей путём увеличения производительности моделирования за счёт применения высокопараллельных вычислений на графическом адаптере общего назначения. Методы исследования. Теоретические исследования выполнены с использованием теории параллельных вычислений, теории графов, векторной алгебры и методов системного анализа. В ходе экспериментальных исследовании осуществлена апробация программного комплекса системы анализа изображений с использованием предложенных подходов. Результаты. Предложен подход для моделирования нейронных сетей различных архитектур с высокой степенью параллелизма обработки, позволяющий перенести вычисления на графический адаптер общего назначения, заключающийся в группировке связей между нейронами по признаку их параллелизма по времени обработки. Такая группировка позволила заранее определить, какие вычислительные задачи могут выполняться параллельно и какие последовательно, что заметно упростило перенос вычислений на графический адаптер, а также позволило реализовать пакетную обработку, ускоряющую вычисления и на центральном процессоре. Достигнутый коэффициент ускорения обработки за счёт использования параллельных вычислений на графическом адаптере достигает коэффициента отношения его пиковой теоретической производительности к таковой характеристике центрального процессора, что говорит о высокой эффективности предложенного подхода.
330 _aThe relevance of the discussed issue is caused by the high computational load generating by an artificial neural network simulation, while the latter is the most successful solution for several AI tasks. In most cases, the high computational load of artificial neural network simulation causes a decline of its functionality and restricts its applicability. The main aim of the study is to improve the efficiency of resolving the AI tasks using artificial neural networks by improving simulation performance applying parallel computations on general purpose graphics processing unit. The methods used in the study. The theoretical researches were carried out using concurrency theory, graph theory, vector algebra and methods of systems analysis. During the experimental study the authors tested an image analysis system software complex that uses the proposed approaches. The results. The authors proposed an approach to simulate the variety of artificial neural networks with high degree of parallelism, which is based on specific precomputation of the groups of compute-time parallel connections between neurons. This group defines explicitly what parts of overall computational task can be performed in parallel. The approach allows transferring as well a computational load to graphics processing unit and performing a batch processing on central processing unit. The achieved performance speed-up ratio reaches the ratio of GPU peak theoretical performance to that of CPU indicating the high efficiency of the proposed approach.
337 _aAdobe Reader
453 _tSimulation of artificial neural networks using general purpose graphics processing unit
_otranslation from Russian
_fA. A. Korolev, A. V. Kuchuganov
_cTomsk
_nTPU Press
_d2014
_d2014
_aKorolev, Alexander
453 _tBulletin of the Tomsk Polytechnic University
453 _tVol. 325, № 5 : IT Technologies
461 1 _0(RuTPU)RU\TPU\book\176237
_tИзвестия Томского политехнического университета [Известия ТПУ]
_fТомский политехнический университет (ТПУ)
_d2000-
463 1 _0(RuTPU)RU\TPU\book\298625
_x1684-8519
_tТ. 325, № 5 : Информационные технологии
_v[С. 72-76]
_d2014
610 1 _aэлектронный ресурс
610 1 _aискусственные нейронные сети
610 1 _aмассовый параллелизм
610 1 _aграфические адаптеры общего назначения
610 1 _aCUDA
610 1 _aраспознавание
610 1 _aобразы
610 _aartificial neural networks
610 _amassive parallelism
610 _ageneral purpose graphics processing unit
610 _aCUDA
610 _aimage recognition
700 1 _aКоролев
_bА. А.
_gАлександр Аркадьевич
_6z01712
701 1 _aКучуганов
_bА. В.
_gАлександр Валерьевич
_6z02712
712 0 2 _aИжевский государственный технический университет
_fz01700
_2stltpush
_3(RuTPU)RU\TPU\col\5643
712 0 2 _aИжевский государственный технический университет
_fz02701
_2stltpush
_3(RuTPU)RU\TPU\col\5643
801 2 _aRU
_b63413507
_c20190517
_gPSBO
856 4 _uhttp://earchive.tpu.ru/bitstream/11683/5385/1/bulletin_tpu-2014-325-5-09.pdf
942 _cCF