一种基于层次注意力机制的双向重构网络视频描述方法
出售价格
¥ 24487
卖家底价
¥ 20520
专利局官费
¥ 200
平台服务费
¥ 3767

微信扫码邀请顾问协助
- 该资源已获得保障和赔付:
- 转让不成功退款退
- 转让超期必赔时
- 该资源未获得保障和赔付:
- 资源不保真必赔真
- 下单后加价必赔价
本发明公开了一种基于层次注意力机制的双向重构网络视频描述方法。本发明方法首先利用卷积神经网络作为编码器提取视频帧的多尺度区域特征,并利用层次注意力机制处理视频特征得到视频特征动态表示;其次,利用长短时记忆神经网络作为解码器,以视频特征动态表示及其文本描述为输入,通过最小化交叉熵损失函数得到词汇表单词的概率分布并据此获得生成语句;再次,通过构建以解码器的隐藏向量为输入的双向重构网络,最小化重构损失,可输出重构的视频特征,使得生成的文本描述和视频内容具有很高的语义相似性。本发明能有效提取多尺度视频特征反映视频时空结构,减少无关信息干扰,挖掘潜在视频语义信息,生成更准确更自然流畅的视频内容描述。

顾问一对一服务

快速确定优质专利

成功付款

国知局审查办理


个人身份证

公司或个体营业执照

专利证书

专利登记簿副本

手续合格通知书
相似专利
换一换