Sale

Подпись к изображению

Sciencia Scripts
SKU:
9786207661022
|
ISBN13:
9786207661022
$47.00 $46.66
(No reviews yet)
Usually Ships in 24hrs
Current Stock:
Estimated Delivery by: | Fastest delivery by:
Adding to cart… The item has been added
Buy ebook
Создание подписей к изображениям с помощью аудио стало сложной, но перспективной задачей в области глубокого обучения. В данной работе предлагается новый подход к решению этой задачи путем объединения конволюционных нейронных сетей (CNN) для извлечения признаков изображения и рекуррентных нейронных сетей (RNN) для последовательного анализа аудио. В частности, мы используем предварительно обученные CNN, такие как VGG, для извлечения визуальных признаков из изображений и используем представления спектрограмм в сочетании с RNN, такими как LSTM или GRU, для обработки аудиовходов. Предлагаемая нами модель основывается не только на визуальном содержании изображений, но и на сопутствующих аудиосигналах. Мы оцениваем производительность нашей модели на эталонных наборах данных и демонстрируем ее эффективность в генерации связных и контекстуально релевантных подписей к изображениям с соответствующими аудиовходами. Кроме того, мы проводим анализ вклада каждой модальности в общую производительнос


  • | Author: Каннаl
  • | Publisher: Sciencia Scripts
  • | Publication Date: Jun 19, 2024
  • | Number of Pages: 64 pages
  • | Binding: Paperback or Softback
  • | ISBN-10: 6207661028
  • | ISBN-13: 9786207661022
Author:
К
Publisher:
Sciencia Scripts
Publication Date:
Jun 19, 2024
Number of pages:
64 pages
Binding:
Paperback or Softback
ISBN-10:
6207661028
ISBN-13:
9786207661022