【pytorch14】感知机

news/2024/7/8 1:37:39 标签: pytorch

单层感知机模型

在这里插入图片描述
在这里插入图片描述
对于单层的感知机,它的激活函数是一个sigmoid

对于符号的定义做一个规范化,输入层每一层进行一个编号

输入是第0层,上标0表示属于输入层,下标0到n表示一共有n个节点(这里严格来说应该是0~n-1,为了书写方便,不区分),下标为i的意思就是第i个元素

中间层,包含权值、累加、激活函数的输出,权值上标还是表示第1层,有2个下标,第一个下标表示连接上一层 x i x_{i} xi的节点,第二个下标表示连接的是这一层的节点,由于此时这一层只有一个节点,所以总是为0

x 0 1 x_{0}^{1} x01,上标表示属于第一层,下标表示第一层上面的第几个元素,这里讨论的是单层感知机,所以第一层只有一个节点

x 1 0 x_{1}^{0} x10经过激活函数以后会得到一个输出值,把这个激活函数的输出值叫做 o 0 1 o_{0}^{1} o01

最后 o 0 1 o_{0}^{1} o01与目标值做均方差,即loss

推导一下单层感知机的推导公式
在这里插入图片描述

此处的σ(x)特指sigmoid函数,对x求导之后为σ(1-σ)

求导之前需要先向右计算一次所有的变量值,这就是前向传播

可以看出对哪一号节点求导, x j 0 x_{j}^{0} xj0就代表了哪一号节点的数值

对于单层的感知机可以很好的总结一下loss对某一号权值求导,最终仅仅跟这个神经元的输出节点 O 0 1 O_{0}^{1} O01以及跟他对应输入节点的数值有关系,可以通过这个公式非常简单的直接更新,也就是可以通过公式推导的过程计算出来每一条连接上面的梯度的大小然后直接更新
在这里插入图片描述

pytorch计算,这里输入x的特征有10个
在这里插入图片描述

对loss做backward可以得到loss对w中的所有参数分别求偏导在这里插入图片描述

多层感知机模型MLP以及梯度

在这里插入图片描述
输出节点变多了,均方差不是跟一个节点作比较,而是所有的输出跟所有的label做比较
在这里插入图片描述

一共有N×M个连接数量,因此有N×M个偏微分的计算

对i号节点的输出对t第i号节点的label做均方差, w j k w_{jk} wjk O k 1 O_{k}^{1} Ok1的影响只有当O的i等于k的时候 w j k w_{jk} wjk才会有连接,O的i为其他值的时候 w j k w_{jk} wjk是没有连接的,也就是偏导数为0

第四步的时候 x k 1 x^{1}_{k} xk1可以写成n个w和x相乘在这里插入图片描述

在这里插入图片描述

在这里插入图片描述


http://www.niftyadmin.cn/n/5535856.html

相关文章

论文翻译 | (DSP)展示-搜索-预测:为知识密集型自然语言处理组合检索和语言模型

摘要 检索增强式上下文学习已经成为一种强大的方法,利用冻结语言模型 (LM) 和检索模型 (RM) 来解决知识密集型任务。现有工作将这些模型结合在简单的“检索-读取”流程中,其中 RM 检索到的段落被插入到 LM 提示中。 为了充分发挥冻结 LM 和 RM 的…

内网穿透--利用everything实现目录映射

免责声明:本文仅做技术交流与学习... 目录 来源文章 frp下载网址 为了隐藏: 演示: 1-靶机的everything开启http服务 2-Linux服务器: 3-靶机windows: 4-最后访问: 来源文章 渗透测试技巧|Everything的利用 frp下载网址 Release v0.58.1 fatedier/frp GitHub 为了隐…

基于ARM的通用的Qt移植思路

文章目录 实验环境介绍一、确认Qt版本二、确认交叉编译工具链三、配置Qt3.1、修改qmake.conf3.2、创建autoConfig.sh配置文件 四、编译安装Qt五、移植Qt安装目录六、配置Qt creator6.1、配置qmake6.2、配置GCC编译器6.3、配置G编译器6.4、配置编译器套件6.5、创建应用 七、总结…

【mybatis】ActiveRecord模式

一、定义与特点 定义:ActiveRecord是一种领域模型模式,特点是一个模型类对应关系型数据库中的一个表,而模型类的一个实例对应表中的一行记录。这种模式最早由Rails框架提出,并逐渐成为许多现代Web开发框架中的标准特性。特点&…

硬件中断号怎么跟irq映射的?

内核初始化 内核启动由这两个函数,完成中断的的初始化,包括硬件中断号和virq的映射 start_kernel{....early_irq_init();init_IRQ();.... } early_irq_init early_irq_init给前16个核内中断分配irq_desc,并通过arch_early_irq_init初始化…

大数据面试题之HBase(2)

列式数据库的适用场景和优势?列式存储的特点? HBase的rowkey设计原则 HBase的rowkey为什么不能超过一定的长度?为什么要唯一?rowkey太长会影响Hfile的存储是吧? HBase的RowKey设置讲究有什么原因 HBase的大合并、小合并是什么? HBase和关系型数据库(传统数据库…

Codeforces Round 955 (Div. 2, with prizes from NEAR!)(A~C题解)

这场比赛怎么说呢,一开始打的还算好,能进前1000,但是后面就被卡住了,这个确实没办法水平还是不够,学过的还是没想起来,后面继续练 A. Soccer 题解:水题一个,想要在过程中出现平局的…

vivado FIFO IP核 中的rd_valid信号

在Vivado中使用FIFO IP核时,valid信号(通常称为rd_valid或dout_valid)是一个重要的控制信号。让我详细解释它的作用和使用场景。 valid信号的作用: 功能: valid信号是一个输出信号,用于指示FIFO输出数据的…