Machine Learning HW1
Regression
python库学习
pandas:用于数据挖掘的python库 有以下特点:
- 便捷的数据处理能力
- 独特的数据结构
- 读取文件方便
- 封装了matplotlib的画图和numpy的计算
数据结构series 和 dataframe
os:提供通用的,基本的操作系统交互功能,包含路径操作 进程管理 环境参数等
csv:操作表格数据的库
tqdm:进度条库
torchviz:网络可视化库
过程
使用随机seed 将数据集分为训练集和测试集
nn.linear:就是进行了线性的变化 从input_dim,16 从输入维度降到16->8->1
nn.ReLU是一个激活函数,允许非线性的变化
squeeze():降维
选择特征
选择器,SGD,随机梯度下降算法,将损失函数最小化
训练3000个epoch,每一次迭代都使用SGD是损失函数最小,拟合效果更好,回归出来的也就越接近真实
最后输出pred.csv,相当于把117个features 聚合为一个值
最后预测出第五天的阳性病例数
遇到的问题
tensorboard不能使用:目前还没解决
网络构建的原理关于反向传播还没搞懂。
10.20更新——反向传播(Back Propagation)
正常的神经网络在进行前向传播时,分别进行线性变化和非线性的激活函数,最后的到Out,反向传播就是用Out和真实值做比对,利用误差MSE均方差反过来去修改各个线上面的权重让误差逐渐减小从输出层的前一层到输入层,
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 I-New!