当前位置:首页 > 经验 >

对称行列式一般怎么计算(对称行列式的规律)

来源:原点资讯(www.yd166.com)时间:2022-11-04 15:42:05作者:YD166手机阅读>>

论文地址:https://arxiv.org/pdf/2112.01898.pdf

Transformer 是 Google 的团队在 2017 年提出的一种 NLP经典模型。Transformer采用注意力机制( Self-Attention)来提高模型训练速度,它抛弃了传统的CNN和RNN,整个网络结构完全是由Attention机制组成。主要由两部分组成:encoder和decoder。

对称行列式一般怎么计算,对称行列式的规律(5)

Transformer最初为机器翻译设计,后被应用于各种问题,从文本生成到图像处理、语音识别等等。在数学中,Transformer大多应用集中在符号计算上,它“操作”数学符号,就像“操作”自然语言中的单词一样。

但数学≠ 符号处理:许多实际应用涉及数值计算,精确(如算术)或近似(如函数计算、方程数值解)。使用Transformer数值计算的研究较少,而且多数早期算术实验结果差强人意。

但有一个不可回避的问题:数学和科学中的大多数问题都涉及符号计算和数值计算。如果我们希望Transformer端对端解决这些问题,它们就必须能进行高精度数值计算。

作者François Charton训练Transformer计算线性代数问题的解,线性代数是许多科学问题的基本组成部分:矩阵的基本运算、矩阵求逆、特征值和奇异值分解

接下来我们将介绍四种将问题和解决方案表示为Transformer可处理的编码方案,在生成的随机矩阵数据集上训练小型Transformer(最多 6 层,1000 到 5000 万个可训练参数)。训练过的模型计算问题的近似解(到其L1范数的几个百分比),精确度超过90%(大多数情况下为99%)。

同时,泛化训练过的模型,通过更多样化的数据集(特别是具有非独立和相同分布系数矩阵进行的训练),能够大大提高域外精度。

作者相信这些结果为Transformer打开了全新世界的大门,为Transformer作为数学和科学问题的端对端解算器铺平了道路。

1

问题建模

对称行列式一般怎么计算,对称行列式的规律(6)

第一步,将矩阵编码为序列。

因为问题的输入和输出是矩阵,要由Transformer处理,它们需要转换为token序列。

首先对一个m×n矩阵进行编码,将其维度编码为两个符号标记(Vm和Vn),然后是其mn系数,编码为序列。在本文中,使用了四种矩阵系数的编码方案:P10、P1000、B1999 和 FP15。

在基数为 10 的位置编码 (P10) 中,是五个标记的序列:一个符号标记( 或 -)、尾数的 3 位数字(从 0 到 9)和符号标记(来自E-100到E 100) 的指数。

例如,3.14 将表示为

,并编码为

。下图中展示了一些编码的示例。

对称行列式一般怎么计算,对称行列式的规律(7)

第二步,随机矩阵生成。

大多数实验是在均匀分布的随机矩阵数据集上训练模型的,[−A, A] (with A = 10)。有时,也对具有相同标准偏差

的高斯系数进行采样。

在研究特征值问题的分布外泛化时,生成具有不同特征值分布的随机对称矩阵(对应于具有非 iid 系数的随机矩阵)。为此,作者运用高斯系数随机采样对称矩阵M,并计算它们的特征值分解

P是特征向量的正交矩阵。然后,用从另一个分布采样的对角线D'替换M的特征值的对角矩阵D。

最后重新计算

,一个对称矩阵(因为P是正交的),特征值按选择分布,特征向量均匀分布在单位球面上。

2

实验和结果

  • 矩阵转置

学习转置矩阵相当于学习其元素的排列。矩形矩阵的排列涉及更长的周期。作者研究了两个公式:

1.固定大小情况,数据集中所有矩阵都具有相同维度,只需要学习一个排列。

2.可变大小的情况,数据集包括不同维度的矩阵,尽可能多的排列学习。

在编码器和解码器中使用四种编码方案,并数据集上训练1 层、256 个维度和 8 个注意力头的Transformer。模型学会在超过 99% 的测试用例准确预测解决方案(具有 0% 的容差)。

对称行列式一般怎么计算,对称行列式的规律(8)

栏目热文

对称行列式的简便计算(对称行列式的计算方法及例题)

对称行列式的简便计算(对称行列式的计算方法及例题)

作者 | P.A.M.Dirac【摘要】本文描述了数学的完美性及其在粒子物理学中的重要性。我在物理学中研究工作的主要部分...

2022-11-04 16:06:36查看全文 >>

对称行列式计算方法及技巧(行列式的计算方法图解)

对称行列式计算方法及技巧(行列式的计算方法图解)

设A、B为n阶方阵,μ为A的特征值。相关结论1.矩阵A的所有特征值的和等于A的迹(A的主对角线元素之和)。2.矩阵A的所...

2022-11-04 15:47:46查看全文 >>

行列式的计算方法图解(n阶行列式计算方法技巧)

行列式的计算方法图解(n阶行列式计算方法技巧)

行列式是线性代数中的基本概念,而有关行列式的计算有一定的规律和技巧性,我结合在考研过程中的做题经验给大家总结了行列式的全...

2022-11-04 16:23:24查看全文 >>

对称行列式的解法图解(对称行列式的计算技巧)

对称行列式的解法图解(对称行列式的计算技巧)

一篇文章搞定行列式知识点,考点,解题方法——第三篇 特征行列式,题型以及解法在了解完行列式的基本概念与性质后,终于来到了...

2022-11-04 16:04:48查看全文 >>

对称行列式的计算方法及例题(计算行列式的例题以及详细步骤)

对称行列式的计算方法及例题(计算行列式的例题以及详细步骤)

在这篇文章中,我将讨论以下内容。特征分解奇异值分解伪逆矩阵这三个方面是相互关联的。一旦我们知道特征分解原理是什么,我们就...

2022-11-04 16:02:53查看全文 >>

对称的行列式怎么计算更方便(对称行列式的计算方法及例题)

对称的行列式怎么计算更方便(对称行列式的计算方法及例题)

马辉教授2014年9月,清华大学数学科学系马辉教授团队的“线性代数”课程在学堂在线上线,这是国内最早上线的面向理工科学生...

2022-11-04 15:40:09查看全文 >>

行列式的三种计算方法(行列式计算方法有几种)

行列式的三种计算方法(行列式计算方法有几种)

行列式产生于解线性方程组,行列式的计算是一个重要的问题.计算行列式的几种常用方法:利用行列式的定义直接计算、化为三角形法...

2022-11-04 15:45:37查看全文 >>

对称行列式例题完整步骤(对称行列式计算方法)

对称行列式例题完整步骤(对称行列式计算方法)

对于一个实对称矩阵不仅可以通过一个可逆矩阵相似对角化,还可以通过一个正交矩阵来相似对角化。实对称矩阵的不同特征值所对应的...

2022-11-04 15:45:15查看全文 >>

对称行列式计算口诀(对称行列式的值怎么求)

对称行列式计算口诀(对称行列式的值怎么求)

对称矩阵是沿对角线对称的矩阵。它是一个自伴算子(self-adjoint operator)(把矩阵看作是一个算子并研究...

2022-11-04 16:05:37查看全文 >>

中心对称行列式计算方法(对称行列式的计算技巧)

中心对称行列式计算方法(对称行列式的计算技巧)

在线性代数中,有一些特殊的矩阵具有易于分析和操作的特性。它们的特征向量可能具有特定的特征值或特殊关系。还有一些方法可以将...

2022-11-04 16:07:48查看全文 >>

文档排行