机器学习中的转导是什么
机器学习中的转导是什么?
转导模型一般用于基于RNN的序列预测问题,比如自然语言处理。
接下来会围绕以下三点展开:
转导的一般定义以及一些特定领域的研究。
机器学习中的转导是什么?
序列预测问题中的转导意味着什么?
1 什么是转导?
何为转导?我们先从字典中的定义开始。
transduce: to convert (something, such as energy or a message)
into another form essentially sense organs transduce physical energy
into a nervous signal
— Merriam-Webster
Dictionary (online), 2017
这是一个在电子与信号处理领域常见的术语。“换能器”,一种能将声音转换为看能量的元件,反之亦然。
All signal processing begins with an input transducer. The input
transducer takes the inpu...
论文阅读 Sigmoid Loss for Language Image Pre-Training
Sigmoid Loss for
Language Image Pre-Training
3 方法
我们介绍一种成对的sigmoid损失并且讨论他的有效应用。
给定一个小批次B = {(I1, T1), (I2, T2), ...},对比学习的目的就是让匹配的图文对
(Ii, Ti)嵌入向量尽可能近,让不匹配图文对(Ii, Tj ≠ i)的嵌入向量相互远离。在实际操作中,我们假设对于所有图像
i,以及与另一个图形 j所关联的文本之间是毫无关联的。
3.1 图文预训练的Softmax损失
当使用softmax损失对目标公式化时,我们训练图像模型f(⋅)与文本模型 g(⋅)以将以下目标函数最小化。
$$
-\frac{1}{2|B|}\displaystyle\sum_{i=1}^{|B|}(\overbrace{log\frac{e^{tx_i\cdot
y_i}}{\displaystyle\sum_{j=1}^{|B|}e^{tx_i\cdot y_j}}}^{image\to text\
softmax}+\overbrace{log\frac{e^{...