Ученые продолжают "очеловечивать" возможности искусственного интеллекта. Сначала он научился распознавать лица по фотографии, теперь же он умеет довольно точно описывать "увиденное" на снимке человеческим языком.
Впервые о программе
NeuralTalk (именно так называется программа, способная описать
изображение словами) заговорили в прошлом году. Ее разработками руководят директор Лаборатории искусственного интеллекта при Стэнфордском университете Фей-Фей Ли и его выпускник Андрей Карпатый. Известно, что
система может проанализировать изображение, определить, что происходит на нем, а затем описать "увиденное" разговорным человеческим языком.
Так, например, если на
фото изображен человек, запускающий воздушного змея, система опишет увиденное: "человек запускает воздушного змея на лужайке".
Программа пока несовершенна и допускает курьезные ошибки, но работа над ней продолжается. Следующим этапом алгоритма станет видео.