平滑处理

csjywu01 / 2024-08-28 / 原文

当然，我可以通过一个简化的例子来解释你提供的代码中的平滑处理操作。

假设和设定

类别数 num_aa_type：假设有 3 个类别（氨基酸类型）。
嵌入向量维度 embed_size：假设每个类别的嵌入向量的维度是 2。
smooth_prob：假设对于一个样本的概率分布为 [0.1, 0.7, 0.2]。
res_embeddings：假设 3 个类别的嵌入向量分别为：
- 类别 1（0）：[1.0, 0.0]
- 类别 2（1）：[0.0, 1.0]
- 类别 3（2）：[1.0, 1.0]

步骤 1：定义 `smooth_prob` 和 `res_embeddings`

import torch

# 假设的概率分布 (smooth_prob)
smooth_prob = torch.tensor([0.1, 0.7, 0.2])  # [num_aa_type]

# 假设的嵌入矩阵 (res_embeddings)
res_embeddings = torch.tensor([
    [1.0, 0.0],  # 类别 1 的嵌入向量
    [0.0, 1.0],  # 类别 2 的嵌入向量
    [1.0, 1.0],  # 类别 3 的嵌入向量
])  # [num_aa_type, embed_size]

步骤 2：执行平滑处理

# 平滑处理的计算：矩阵乘法
smoothed_embedding = smooth_prob @ res_embeddings  # 形状 [embed_size]

具体计算

现在，让我们详细计算矩阵乘法的结果：

# smoothed_embedding = smooth_prob @ res_embeddings
# smoothed_embedding = [0.1, 0.7, 0.2] @ [[1.0, 0.0], [0.0, 1.0], [1.0, 1.0]]

# 第一个维度的计算 (x 轴的嵌入):
# 0.1 * 1.0 + 0.7 * 0.0 + 0.2 * 1.0 = 0.1 + 0 + 0.2 = 0.3

# 第二个维度的计算 (y 轴的嵌入):
# 0.1 * 0.0 + 0.7 * 1.0 + 0.2 * 1.0 = 0 + 0.7 + 0.2 = 0.9

smoothed_embedding = torch.tensor([0.3, 0.9])  # 最终的平滑嵌入向量

步骤 3：将平滑后的嵌入赋值回去

假设我们有一个嵌入矩阵 H，其形状为 [batch_size, embed_size]，并且我们正在处理的样本需要进行平滑处理，那么就将计算得到的 smoothed_embedding 赋值给 H 中对应的行。

H[smooth_mask] = smoothed_embedding

总结

在这个示例中，smooth_prob 是一个表示模型预测概率分布的向量，res_embeddings 是每个类别的嵌入向量。通过将 smooth_prob 与 res_embeddings 相乘，我们得到了一个平滑后的嵌入向量 [0.3, 0.9]。

0.3 来自对类别 1 和类别 3 的 x 轴嵌入的加权平均。
0.9 来自对类别 2 和类别 3 的 y 轴嵌入的加权平均。

这个平滑后的嵌入向量避免了直接选择某个类别的嵌入向量，而是结合了多个类别的信息，从而使模型在输出时更为稳定和鲁棒。

平滑处理更多相关文章

今日报告-66

设置Windows10暂停更新3000天

AQS公平锁的流程

AMD锐龙7 7800X3D网游专项测试：竟比i9-13900KS强了15%

常用总线技术基本参数对比

探索图像数据中的隐藏信息：语义实体识别和关系抽取的奇妙之旅

设置Chrome浏览器自动升级

JavaScript – 小技巧 Tips

Winform无边框窗体实现拖动

STM32基础（一）

技术人的修炼---九五小庞

vue自定义事件用法及$emit

ODOO 科目配置4

sqlite 触发器 c#

postgresql在插入数据后怎么获取自增id

EF Core 的基本使用

error: failed to push some refs to 'https://github.com/*******/********.github.io.git'

编程语言能力对比

基于机器视觉的小车轨迹控制软件界面展示

随机推荐

命令拼接技巧

Fiddler抓包Android7以内版本

SD NAND 与 SPI NAND

C语言中的编译过程详解

step7 V5.x上的SCL

yolo --- 核心思想

【游记】CCPC 济南 2024 游记

AJAX & AXIOS-2024/11/1

验证码处理在自动化测试中的应用

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

Java，启动！

什么是IT技术

即将到来！

2024/11/1日日志关于JavaScript简介&引入方式以及基础语法的学习

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

原型模式的C++实现

python bytecode解析

热门话题

Ethernaut Level 11: Elevator Attack and Blockchain Interaction

快速部署开源spug运维平台的Docker安装指南

驱动调试之printk的原理与使用

计算机思维模型及其应用

华为云发布代码大模型PanGu-Coder2，实现高效代码生成

Linux多硬盘数据存储和分区操作

构建高可用架构: 分层冗余与自动故障转移

LoRA：高效调参的大语言模型适应方法

《分布式系统的基本原理及互联网分层架构的本质》

Hadoop写流程解析

Java架构师的系统架构设计方法论中的规范要点

使用observeDOM解决BetterScroll插件在移动端无法滑动的问题

互联网一致性架构设计实践

高并发系统架构与水平扩展

混合应用的崛起：跨平台开发取代原生应用

穗舟网（www.seizhou.com）

本站除标明"本站原创"外所有文章版权归创作人所有，本站不承担任何法律责任和连带责任，如有冒犯请直接联系，我们将立即予以纠正并致歉。

Powered by WordPress · v1.0.0-alpha