两种常用损失函数：nn.CrossEntropyLoss 与 nn.TripletMarginLoss

两种常用损失函数：nn.CrossEntropyLoss 与 nn.TripletMarginLoss

article2024/9/19 10:58:37/文章来源:https://blog.csdn.net/weixin_46933702/article/details/142034883

两种用于模型训练的损失函数：nn.CrossEntropyLoss 和 nn.TripletMarginLoss。它们在对比学习和分类任务中各自扮演不同的角色。接下来是对这两种损失函数的详细介绍。

1. nn.CrossEntropyLoss

nn.CrossEntropyLoss 是 PyTorch 提供的交叉熵损失函数，通常用于多分类任务中。它结合了 softmax 激活函数和负对数似然损失（Negative Log Likelihood Loss, NLLLoss），计算模型预测与真实标签之间的差距。

工作原理：

输入：模型的输出（logits）和真实的类别标签。
输出：一个标量值，表示预测分布与真实分布之间的差异。

交叉熵损失函数通过以下公式计算：
[ \text{Loss} = -\sum_{i} y_i \log(p_i) ]
其中 ( y_i ) 是真实的标签（one-hot 编码），而 ( p_i ) 是预测的概率分布（softmax 后的输出）。

使用场景：多分类任务中，比如文本分类、图像分类。
应用：在这段代码中，CrossEntropyLoss 用于计算模型输出与目标标签之间的分类损失，适合用来处理分类任务的目标。

示例：

假设有三个类别的分类任务，模型输出的 logits 是：
[ [2.0, 1.0, 0.1] ]
真实标签是类别 0，交叉熵损失函数将计算该类别对应的 softmax 概率，并与真实标签对比，得出损失。

2. nn.TripletMarginLoss

nn.TripletMarginLoss 是用于对比学习（contrastive learning）的损失函数，尤其适用于度量学习（metric learning）任务。它处理 三元组（triplet） 数据，即由锚点（anchor）、正样本（positive）和负样本（negative）组成的三元组。

工作原理：

输入：三组嵌入向量（特征表示）：锚点（anchor）、正样本（positive）和负样本（negative）。
输出：一个标量值，表示正样本与锚点之间的距离与负样本与锚点之间的距离之间的差距。

公式为：
[ \text{Loss} = \max(0, d(a, p) - d(a, n) + \text{margin}) ]
其中：

( a ) 表示锚点的特征向量，
( p ) 表示正样本的特征向量，
( n ) 表示负样本的特征向量，
( d(·,·) ) 是锚点与正样本/负样本之间的距离（通常是欧氏距离或余弦距离），
margin 是一个超参数，确保正样本与锚点的距离比负样本更近，且最小差值为 margin。
使用场景：主要用于度量学习和对比学习，如面部识别、文本匹配、图像检索等任务。它确保模型在嵌入空间中将相似的样本拉近，将不相似的样本推远。
应用：在这段代码中，TripletMarginLoss 用于处理对比学习中的三元组损失，确保正样本和锚点的表示比负样本更接近。

示例：

假设锚点、正样本、负样本的嵌入向量分别为：

Anchor: [1.0, 2.0]
Positive: [1.1, 2.1]
Negative: [3.0, 4.0]

如果 margin 设为 1.0，TripletMarginLoss 将确保锚点与正样本的距离比锚点与负样本的距离更小，并且至少差 1.0。

总结

CrossEntropyLoss 适用于分类任务，用于衡量模型输出的类别分布与真实标签之间的差距。
TripletMarginLoss 适用于对比学习，通过比较锚点、正样本和负样本的嵌入向量，确保正样本更接近锚点，负样本远离锚点。

在训练流程中，两者结合使用，以同时优化分类任务和对比学习任务中的关系表示。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/873566.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

深入理解数据库的 4NF：多值依赖与消除数据异常

深入理解数据库的 4NF：多值依赖与消除数据异常

在数据库设计中， "范式" 是一个常常被提到的重要概念。许多初学者在学习数据库设计时，经常听到第一范式（1NF）、第二范式（2NF）、第三范式（3NF）以及 BCNF（Boyce-…

阅读更多...

滑动窗口在算法中的应用

滑动窗口在算法中的应用

滑动窗口是一种经典的算法技巧，就像在处理一系列动态数据时，用一扇可以滑动的“窗口”来捕捉一段连续的子数组或子字符串。通过不断地移动窗口的起点或终点，我们能够以较低的时间复杂度来解决一系列问题。在这篇文章中，我们将通过…

阅读更多...

维信小程序禁止截屏/录屏

维信小程序禁止截屏/录屏

一、维信小程序禁止截屏/录屏 //录屏截屏,禁用wx.setVisualEffectOnCapture({visualEffect:hidden});wx.setVisualEffectOnCapture(Object object) 测试安卓手机： 用户截屏，被禁用用户录屏，录制的是空白内容/黑色内容的视频。二、微信小…

阅读更多...

C++ | Leetcode C++题解之第386题字典序排数

C++ | Leetcode C++题解之第386题字典序排数

题目： 题解： class Solution { public:vector<int> lexicalOrder(int n) {vector<int> ret(n);int number 1;for (int i 0; i < n; i) {ret[i] number;if (number * 10 < n) {number * 10;} else {while (number % 10 9 || numbe…

阅读更多...

EasyPlayer.js网页H5 Web js播放器能力合集

最近遇到一个需求，要求做一款播放器，发现能力上跟EasyPlayer.js基本一致，满足要求： 需求功性能分类需求描述功能预览分屏模式单分屏（单屏/全屏） 多分屏（2*2） 多分屏…

阅读更多...

【阿一网络安全】如何让你的密码更安全？（二） - 非对称加密

【阿一网络安全】如何让你的密码更安全？（二） - 非对称加密

上次《【阿一网络安全】如何让你的密码更安全？(一) - 对称加密》提到加密算法的对称加密，我们这次来聊聊非对称加密。和对称加密不同，非对称加密的加密密钥和解密密钥不同。非对称加密大概过程就是，发送方使用公钥对明文数据…

阅读更多...

mac 安装redis

mac 安装redis

官网下载指定版本的redis https://redis.io/ 目前3.2.0 是最新最稳定的版本这里是历史版本下载下载指定版本安装 1.放到自定义目录下并解压 2.打开终端，执行命令 cd redis的安装目录下 make test -- 此命令的作用是将redis源代码编译成可执行文件&#xff0c…

阅读更多...

SPI驱动学习五（如何编写SPI设备驱动程序）

SPI驱动学习五（如何编写SPI设备驱动程序）

目录一、SPI驱动程序框架二、怎么编写SPI设备驱动程序1. 编写设备树2. 注册spi_driver3. 怎么发起SPI传输3.1 接口函数3.2 函数解析三、示例1：编写SPI_DAC模块驱动程序1. 要做什么事情2. 硬件2.1 原理图2.2 连接 3. 编写设备树4. 编写驱动程序5. 编写app层操作程序…

阅读更多...

C++语法知识点合集：11.模板

C++语法知识点合集：11.模板

文章目录一、非类型模板参数1.非类型模板参数的基本形式2.指针作为非类型模板参数3.引用作为非类型模板参数4.非类型模板参数的限制和陷阱：5.几个问题二、模板的特化1.概念2.函数模板特化3.类模板特化(1)全特化(2)偏特化(3)类模板特化应用示例三、模板分离编译1.…

阅读更多...

微带结环行器仿真分析+HFSS工程文件

微带结环行器仿真分析+HFSS工程文件

微带结环行器仿真分析HFSS工程文件工程下载：微带结环行器仿真分析HFSS工程文件我使用HFSS版本的是HFSS 2024 R2 参考书籍《微波铁氧体器件HFSS设计原理》和视频微带结环行器HFSS仿真 1、环形器简介环行器是一个有单向传输特性的三端口器件，它表明…

阅读更多...

使用Qt编程QtNetwork无法使用

使用Qt编程QtNetwork无法使用

使用 VS 构建 Qt 项目时 QtNetwork 无法使用的问题 - 摘叶飞镖 - 博客园 (cnblogs.com) 另外,强烈建议在使用QNetworkAccessManager之前看看这篇文章: Qt 之 QNetworkAccessManager踏坑记录-CSDN博客 C Qt开发：QNetworkAccessManager网络接口组件阅读目录 1.1 …

阅读更多...

在Ubuntu上运行QtCreator相关程序

在Ubuntu上运行QtCreator相关程序

背景：希望尝试在Linux系统上跑一下使用QtCreator相关的程序，因为有一些工作岗位要求有Linux上使用Qt的经验。 (1)我是把Windows上的程序移过来的，Windows上文件名称是不区分大小写的。而Ubuntu上是区分的所以一部分头文件需要进行修改&am…

阅读更多...

idea创建SpringBoot项目

idea创建SpringBoot项目

目录 1. 新建一个SpringBoot项目 2. 使用Springboot官网创建项目 3. 使用阿里云地址创建SpringBoot项目 4. 使用maven创建SpringBoot项目 5. 在Idea中隐藏指定文件/文件夹 1. 新建一个SpringBoot项目 Springboot2 要求jdk版本: 1.8 maven: 3.3 内嵌的tomcat: tomcat9 我们…

阅读更多...

深度学习（一）-感知机+神经网络+激活函数

深度学习（一）-感知机+神经网络+激活函数

深度学习概述深度学习的特点优点性能更好不需要特征工程在大数据样本下有更好的性能能解决某些传统机器学习无法解决的问题缺点小数据样本下性能不如机器学习模型复杂可解释性弱深度学习与传统机器学习相同点深度学习、机器学习是同一问题不同的解决方法 …

阅读更多...

11.5.软件系统分析与设计-面向对象的程序设计与实现

11.5.软件系统分析与设计-面向对象的程序设计与实现

面向对象的程序设计与实现设计模式 Java代码 C代码

阅读更多...

SQL进阶技巧：每年在校人数统计 | 区间重叠问题

SQL进阶技巧：每年在校人数统计 | 区间重叠问题

目录 0 问题分析 1 数据准备 2 问题分析 3 小结区间重叠问题 0 问题分析有一个录取学生人数表 in_school_stu，记录的是每年录取学生的人数及录取学生的学制，计算每年在校学生人数。 1 数据准备 create table in_school_stu as ( select stack(5,1,2001,2,1200,2,2000…

阅读更多...

UML的图及其他图补充

UML的图及其他图补充

一、UML图 1.类图 ‌类图‌是统一建模语言（UML）中的一种静态结构图，主要用于描述软件系统的静态结构。它显示了模型中的类、类的内部结构以及它们与其他类的关系。类图是面向对象建模的主要组成部分，用于对系统的词汇进行建模、对…

阅读更多...

SigLIP——采用sigmoid损失的图文预训练方式

SigLIP——采用sigmoid损失的图文预训练方式

SigLIP——采用sigmoid损失的图文预训练方式 FesianXu 20240825 at Wechat Search Team 前言 CLIP中的infoNCE损失是一种对比性损失，在SigLIP这个工作中，作者提出采用非对比性的sigmoid损失，能够更高效地进行图文预训练，本文进行…

阅读更多...

93. UE5 GAS RPG 应用负面效果表现

93. UE5 GAS RPG 应用负面效果表现

在上一篇文章里，我们实现了添加负面效果GE，并且在添加GE时，也会给角色应用一个负面效果标签作为标识。在这一篇里，我们将通过负面效果标签标识，应用角色身上展现对应的负面效果的表现。我们将在这篇文章里添加一个自定…

阅读更多...

【c++进阶[五]】list相关接口介绍及list和vector的对比

【c++进阶[五]】list相关接口介绍及list和vector的对比

💓博主CSDN主页::Am心若依旧💓 ⏩专栏分类c从入门到精通⏪ 🚚代码仓库:青酒余成🚚 🌹关注我🫵带你学习更多c 🔝🔝 1.前言本章重点本章重点讲解list的接口函数的熟悉&#xf…

阅读更多...

最新文章