斯皮尔曼相关系数和皮尔逊相关系数的区别
连续数据、正态分布、线性关系,用皮尔逊系数是最恰当的,斯皮尔曼也可以只是效率比较低的问题。
上述任一条件不满足,就使用斯皮尔曼相关系数,不能使用皮尔逊相关系数。
两个定序数据之间使用斯皮尔曼相关系数
定序数据是指仅仅反映观测对象等级、顺序关系的数据,是由定序尺度计量形成的,表现为类别,可以进行排序,属于品质数据。优、良、差,我们可以用1表示差,2表示良、3表示优,但是,用2/1=2得出的2不具有任何含义。定序数据最重要的意义是代表了一组数据中的某种逻辑顺序。
无题
Part One——Code Train《猫狗大战》Enviromentvscode:1.83.0
python 3.11.3
pytorch 2.0.1
1.导入库 pytorch等#本次内容是使用LeNet实现猫狗图片的二分类
# 源数据(https://www.kaggle.com/datasets/tongpython/cat-and-dog/data)
#这里已经下载到本地
MyDataLoader
用os中库读取本地文件 并根据图片的名字进行处理 分类
使用DataLoader 将train分为200个batch 并打乱
创建网络
super是为了继承父类的init所使用的,
借鉴作业四中的leNet代码 在此基础上增加一个卷积层和池化操作,最后output是个2维向量,并且修改最后的ReLU为Sigmoid更适合二分类模型
损失函数和优化器分别为交叉熵和Adam 学习率为0.001
训练过程
最后Epoch:9 Acc:0.9925
验证集有0.8070的精准度
最后再测试集上加载模型
提交在AI研习社
resNet接着使用resNet重新新训练
...
Machine Learning HW1
Regressionpython库学习pandas:用于数据挖掘的python库 有以下特点:
便捷的数据处理能力
独特的数据结构
读取文件方便
封装了matplotlib的画图和numpy的计算
数据结构series 和 dataframe
os:提供通用的,基本的操作系统交互功能,包含路径操作 进程管理 环境参数等
csv:操作表格数据的库
tqdm:进度条库
torchviz:网络可视化库
过程使用随机seed 将数据集分为训练集和测试集
nn.linear:就是进行了线性的变化 从input_dim,16 从输入维度降到16->8->1
nn.ReLU是一个激活函数,允许非线性的变化
squeeze():降维
选择特征
选择器,SGD,随机梯度下降算法,将损失函数最小化
训练3000个epoch,每一次迭代都使用SGD是损失函数最小,拟合效果更好,回归出来的也就越接近真实
最后输出pred.csv,相当于把117个features 聚合为一个值
最后预测出第五天的阳性病例数
遇到的问题tensorboard不能使用:目前还没解决
网络构建的原理关于反 ...
Welcome To My Homepage——Who am I.
¡Hola! 我是Annyufeng, 大家一般叫我蛋哥。这是我的第一篇博客,下面是我的个人介绍:
IntroductionDetail&Skill我来自山西,在OUC当一名working hard的大三计算机学生,目前情绪稳定,前途渺茫。
目前学习过C,C++,C#,java,python,javascript,liquid,算法达到入门基础,有web(React框架)和小程序的前端开发经验。在IT工作室担任游戏部副部长,会使用unity引擎进行2D游戏的开发。
Hobby游戏,动漫,骑车,跑步,乒乓球、健身,旅游,摄影,唱歌。总之是都沾点,比较喜欢尝试新鲜的东西。
Achievement
2023年全国大学生数学建模比赛国家二等奖
2023年mathorcup数学建模比赛国家一等奖
2023年美国大学生数学建模比赛国家二等奖
2022年全国大学生数学建模比赛山东省二等奖
2023年亚太杯数学建模比赛S奖
CCF认证 200分
以第一责任人组织参与SRDP创新项目一项
合作完成独立游戏《大地之歌》
获得学校综合二,三等奖学金,“优秀学生”荣誉称号
Present Work ...