Transformer基础学习笔记

AI摘要:这篇文档介绍了 Transformer 模型的核心原理,旨在取代 RNN 用于序列处理。它阐述了 Transformer 如何利用自注意力机制克服 RNN 在长距离依赖和并行计算上的局限。文章详细拆解了其Encoder-Decoder架构,包括关键组件:词嵌入、位置编码(解决无序性问题)、多头注意力(核心,通过 QKV 计算上下文表示)、前馈网络以及残差连接与层归一化(稳定训练)。同时解释了 Encoder 层和 Decoder 层(含掩码机制)的构造,并提及了最终的线性输出层和 PyTorch 实现要点。

KL散度

这篇文章介绍了KL散度(Kullback–Leibler divergence)的概念和推导过程。首先介绍了熵的定义,然后通过熵的推广得到了KL散度的公式。KL散度可以用于衡量两个概率分布之间的差异,具有非负性质,但不具有对称性。文章最后总结了KL散度的两个重要性质:非负性和不对称性。

实验室GPU服务器使用简要说明

本文介绍了服务器的基本情况和连接方式。服务器拥有两块GPU:RTX3090 24G和泰坦12G,采用Docker容器化管理。容器只保留/home/ubuntu目录,其他目录不保留。可通过Zerotier加入网络后使用SSH连接服务器,传输文件不宜使用sftp,大文件建议使用wget从网络下载。

实验室GPU服务器管理员指南

本文介绍了服务器的基本信息,包括GPU型号和数量、存储目录、虚拟化环境和连接方式。重点提醒勿将服务器当做存储使用,并强调了备份数据的重要性。同时还介绍了容器部署方法、配置保存方法等内容。文章最后对已被弃用的LXD设置方法做了说明。总的来说,本文为服务器使用提供了全面的指导和警示。

TrueNAS虚拟机备份转换(KVM)

本文介绍了在TrueNAS Scale虚拟化环境中导出和导入虚拟机的方法。主要步骤包括使用dd命令将虚拟机打包为raw格式镜像文件,使用qemu-img进行格式转换和扩容,最后使用dd命令或qemu-img将镜像文件导入到新建的zvol中。这些操作为虚拟机的备份、恢复、迁移等管理工作提供了便利。

WSL2(Ubuntu)配置Java Hadoop Spark环境

本文介绍了如何在Windows 10上安装和使用适用于Linux的Windows子系统(WSL)以及WSL 2。首先介绍了WSL和WSL 2的概念和区别。然后详细说明了如何在Windows 10上启用并安装WSL功能,包括启用适用于Linux的Windows子系统功能、检查是否支持WSL 2、启用虚拟机平台功能、下载并安装Linux内核更新包,最后安装Linux发行版。最后简要介绍了如何在WSL中安装Java环境。

编译jdk

本文介绍了在WSL2环境下使用Ubuntu 22.04编译OpenJDK 12的过程。首先从官方仓库和 GitHub 下载了 OpenJDK 12 源代码,然后安装了编译所需的外部依赖库和 OpenJDK 11 的引导版本。接着使用 configure 命令配置编译参数,最后通过 make images 命令进行了编译构建。文中附有相关命令示例和操作截图,对整个编译过程进行了清晰描述。

learning-memory-guided-normality代码学习笔记

Memory模块是该神经网络架构的核心部分。它包含一个存储键值对的内存,并定义了对内存的读写操作。读操作通过计算查询向量与内存中键向量之间的相似度来检索相关内容。写操作根据查询向量和相关度分数,更新内存中的键值对。该模块还包含了用于训练的损失函数,用于增强内存的区分性和紧凑性。整个模块的目标是建立一个可查询和自更新的记忆系统,支持神经网络的学习和推理。

ResNet学习笔记

本文介绍了ResNet(深度残差神经网络)的理论基础与核心思想。首先解释了深度网络容易出现梯度消失和梯度爆炸的原因,导致深层网络训练效果变差。ResNet通过引入残差学习(Residual learning)的思想,使得网络能够直接学习残差映射,从而避免梯度消失和梯度爆炸的问题,成功训练出152层的深度卷积神经网络,取得了ImageNet等视觉任务中的卓越表现。

conda基本使用方法

本文介绍了如何安装和使用 Anaconda/Miniconda 及其虚拟环境和包管理功能。首先介绍了如何配置国内清华镜像源以加速下载。然后分别介绍了通过 Anaconda Navigator 图形界面和命令行两种方式进行虚拟环境和包的创建、删除、复制、分享等操作。文中还涉及了查看版本、获取帮助等基本命令的使用方法。


本站由 Somnifex 使用 Stellar 1.33.1 主题创建。

本站由 又拍云提供CDN加速/云存储服务

本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。