Regression

python库学习

pandas:用于数据挖掘的python库 有以下特点:

  • 便捷的数据处理能力
  • 独特的数据结构
  • 读取文件方便
  • 封装了matplotlib的画图和numpy的计算

数据结构series 和 dataframe

os:提供通用的,基本的操作系统交互功能,包含路径操作 进程管理 环境参数等

csv:操作表格数据的库

tqdm:进度条库

torchviz:网络可视化库

piPL6eO.png

过程

使用随机seed 将数据集分为训练集和测试集

piPLsOK.png

nn.linear:就是进行了线性的变化 从input_dim,16 从输入维度降到16->8->1

nn.ReLU是一个激活函数,允许非线性的变化

squeeze():降维

piPLDQx.png

选择特征

选择器,SGD,随机梯度下降算法,将损失函数最小化

训练3000个epoch,每一次迭代都使用SGD是损失函数最小,拟合效果更好,回归出来的也就越接近真实

1

最后输出pred.csv,相当于把117个features 聚合为一个值

piPLdY9.png

最后预测出第五天的阳性病例数

遇到的问题

tensorboard不能使用:目前还没解决

网络构建的原理关于反向传播还没搞懂。

10.20更新——反向传播(Back Propagation)

正常的神经网络在进行前向传播时,分别进行线性变化和非线性的激活函数,最后的到Out,反向传播就是用Out和真实值做比对,利用误差MSE均方差反过来去修改各个线上面的权重让误差逐渐减小从输出层的前一层到输入层,