cv学习笔记看图说话image-captioning-1

本文介绍了使用CNN和LSTM将图像和文字进行处理,并将两个神经网络结合在一起,实现多模态任务如图像搜索、安全和鉴黄等。文章还介绍了使用的Flickr8K数据集以及VGG16网络模型。最后给出了一个简单的代码示例,用于生成VGG16神经网络。


本站由 Somnifex 使用 Stellar 1.33.1 主题创建。

本站由 又拍云提供CDN加速/云存储服务

本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。