论文：A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval

最新推荐文章于 2026-06-23 20:34:44 发布

原创

最新推荐文章于 2026-06-23 20:34:44 发布 · 543 阅读

·

0

·

标签

#神经网络 #深度学习

论文：A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval

跨模态图像语音哈希检索

跨模态图像语音哈希检索

关于网络结构

使用了三元组网络，对于anchor图片使用VGG16提取deep feature,对于pos和neg语音使用MFCC提取deep feature。两种网络都增加了全连接层+sigmoid,以及全连接层+tanh的结构来获取hash-like特征。（hash的提取使用sign函数）

关于负样本采样

通过距离公式计算难语音样本集，在集合中，随机取样neg。

关于损失函数

由三部分构成，一部分是hash-like triplets,一部分是hash-like与hash的距离，一部分是deep feature的triplet，三部分加权和构成损失函数。

使用hash特征近似化后，取hash-like值计算的triplet loss，用来使正样本对靠近，负样本对远离。

用来使得hash-like与hash值之间的靠的更近，因为二值化不好求梯度，使用的别的处理方法（公式暂且不列，原论文有具体实现方法）。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。