3.11 模型选择、欠拟合和过拟合
训练误差和泛化误差 训练误差(training error)指模型在训练数据集上表现出的误差,泛化误差(generalization error)指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用损失函数,例如线性回归用到的平方损失函数和softmax回归用到的交叉熵损失函数。 在机器学习里,通常假设训练数据集和测试数据集里的每一个…
3.8 多层感知机
隐藏层 多层感知机在单层神经网络的基础上引入了一到多个隐藏层(hidden layer)。隐藏层位于输入层和输出层之间。 具体来说,给定一个小批量样本$\boldsymbol{X} \in \mathbb{R}^{n \times d}$,其批量大小为$n$,输入个数为$d$。假设多层感知机只有一个隐藏层,其中隐藏单元个数为$h$。记隐藏层的输出(也称为隐藏层变量或隐藏变量)为$\boldsymb…
3.5 图像分类数据集(Fashion-MNIST)
获取数据集 通过torchvision的`torchvision.datasets`来下载这个数据集。第一次调用时会自动从网上获取数据。通过参数`train`来指定获取训练数据集或测试数据集。参数`transform = transforms.ToTensor()`使所有数据转换为`Tensor`,如果不进行转换则返回的是PIL图片。`transforms.ToTensor()`将尺寸为 (H x…
3.4 softmax回归
分类问题 线性回归模型适用于输出为连续值的情景。softmax回归适用于离散值的预测问题。 通常使用离散的数值来表示类别,例如$y_1=1, y_2=2, y_3=3$。与线性回归的一个主要不同在于,softmax回归的输出值个数等于标签里的类别数。 softmax回归模型 softmax回归同线性回归一样,也是一个单层神经网络。输出值$o_i$当作预测类别是$i$的置信度。 $$\hat{y}_…
Frpc配置说明
项目地址:https://github.com/fatedier/frp 从此处下载对应系统的frpc:https://github.com/fatedier/frp/releases 官方文档:https://gofrp.org/zh-cn/docs/overview/ 启动方式 使用命令行,执行: frpc.toml 为配置文件 frpc -c frpc.toml 基础配置 打开frpc.to…
贪心算法专训题解
P1007. 独木桥 题目描述 当两人面对面相碰时,两人都会转向行走, 那可以看成两个人交错而过。 求最小时间,计算出每个人到达两边的最小时间,所有时间中最大的一个即为所有人离开桥需要用的时间。 求最大时间,计算出每个人到达两边的最大时间,所有时间中最大的一个即为所有人离开桥需要用的时间。 #include<bits/stdc++.h> using namespace std; int…