Скажем сразу: с изображениями людей и животных нейросеть справляется далеко не всегда. Например, горного барана, которого снял Валерий Малеев, подзвучила карканьем ворон, а ягуаров — птичьим пением.
Кроме того, робот верно распознает воду на картинках. По крайней мере, он угадал с аккомпанементом для путоранских водопадов Сергея Горшкова, волков Евгения Полонского и архивного снимка японской ныряльщицы ама.
Нажмите на картинку, чтобы посмотреть следующий слайд.
Нейросеть Imaginary Soundscape написала группа исследователей из Токийского университета. Эта программа опознает на картинке «знакомые» элементы — и подбирает один из тысяч звуков, хранящийся в ее базе данных — от плача младенца до стука шагов.