科百科
当前位置: 首页 科技资讯

主流深度学习模型分类(观点小心训练模型)

时间:2023-06-04 作者: 小编 阅读量: 1 栏目名: 科技资讯

我们将测试集分为两部分,上半部分用于评估训练过程的收敛,而下半部分用于测量样本预测的准确度。一个类似的现象可能能够解释Leekasso的Python和R版本之间的不同。这可能会有影响,因为Leekasso选择的变量是高度共线性的。我重新运行了Leekasso,但仅使用了最好的预测器,其结果几乎完全等同于全Leekasso。最后,本文并不是想说Jeff的观点错了,而是旨在提供一个不同的新视角,为读者带来启发。

选自Github

作者:Andrew L. Beam

机器之心编译

最近,Jeff Leek 在 Simply Stats 上发表了一篇题为「如果你的数据量不够大就不要使用深度学习」(Don't use deep learning your data isn't that big)的文章(链接见文末),认为只有获得了谷歌、Facebook 这样规模的数据才有资格做深度学习。对于这点 Andrew L. Beam(本文作者)并不反对,他认为这使我们清楚地意识到深度学习并不是一种万能的灵药;但是,虽然 Beam 同意其核心观点,但是其还有很多不明确或不清晰的地方,并且 Beam 认为只要小心地训练模型,就能在小数据设置中使用深度学习。机器之心对该文进行了编译,原文链接请见文末。

Jeff Leek 采用两种方法基于 MNIST 数据集对手写字体进行分类。他对比了五层神经网络(激活函数使用的是 hyperbolic tangent)的系统和 Leekasso,Leekasso 仅仅使用了带最小边际 p-value 的 10 块像素。他惊讶地表明,在使用少量样本时,Leekasso 要比神经网络性能更加出色。

CNN 模型也和以前的十分相似:

作为参考,MLP 大约有 12 万个参数,而 CNN 大约有 20 万个参数。根据原文的假设,当我们有这么多的参数和少量样本时,模型好像真的会出错。

我们尽可能地靠近原始分析,我们使用了 5 层交叉验证(5-fold cross validation),但使用了标准 MNIST 测试集进行评估(大约有 2000 张测试样本)。我们将测试集分为两部分,上半部分用于评估训练过程的收敛,而下半部分用于测量样本预测的准确度。我们甚至没有调整这些模型,对于大多数超参数,仅仅只是使用合理的默认值。

我们尽可能地重新构建了原文中 Leekasso 和 MLP 的 Python 版本。代码可以在此处下载:https://github.com/beamandrew/deep_learning_works/blob/master/mnist.py

以下是每个模型的样本精度:

这两个模型的精度和原来的分析有很大的不同,原始分析中对小样本使用 MLP 仍然有很差的效果,但我们的神经网络在各种样本大小的情况下都可以达到非常完美的精度。

为什么会这样?

众所周知,深度学习模型的训练往往对细节要求极高,而知道如何「调参」是一件非常重要的技能。许多超参数的调整是非常具体的问题(特别是关于 SGD 的超参数),而错误地调参会导致整个模型的性能大幅度下降。如果你在构建深度学习模型,那么就一定要记住:模型的细节是十分重要的,你需要当心任何看起来像深度学习那样的黑箱模型。

下面是我对原文模型出现问题的猜测:

幸好,RStudio 那些人太好了,他们刚刚发布了 Keras 的 R 接口:https://rstudio.github.io/keras/,这样我就可以完全用 R 语言重建我的 Python 代码了。我们之前使用 MLP 用 R 实现了就是这样:

我将这个放进了 Jeff 的 R 代码中,并重新生成了原来的图表。我对 Leekasso 进行了一点修改。原来的代码使用了 lm()(即线性回归),我觉得很奇怪,所以我切换成了 glm()(即 logistic 回归)。新的图表如下所示:

深度学习真是厉害了!一个类似的现象可能能够解释 Leekasso 的 Python 和 R 版本之间的不同。Python 版本的 logistic 回归使用了 liblinear 作为其解算器,我认为这比 R 默认的解算器更加可靠一点。这可能会有影响,因为 Leekasso 选择的变量是高度共线性的(collinear)。

这个问题太简单了,以致于不能说明什么有意义的东西。我重新运行了 Leekasso,但仅使用了最好的预测器,其结果几乎完全等同于全 Leekasso。实际上,我确定我可以做出一个不使用数据的且具有高准确度的分类器。只需要取其中心像素,如果是黑色,则预测 1,否则就预测 0,正如 David Robinson 指出的那样:

David 还指出,大多数数字对(pairs of numbers)都可以由单个像素进行分类。所以,这个问题很可能不能给我们带来任何关于「真实」小数据场景的见解,我们应当对其结论保持适当的怀疑。

关于深度学习为什么有效的误解

最终,我想要重新回到 Jeff 在文中所提出的观点,尤其是这个声明:

问题在于:实际上仅有少数几个企业有足够数据去做深度学习,[…] 但是我经常思考的是,在更简单的模型上使用深度学习的主要优势是如果你有大量数据就可以拟合大量的参数。

这篇文章,尤其是最后一部分,在我看来并不完整。很多人似乎把深度学习看成一个巨大的黑箱,有大量可以学习任何函数的参数,只要你有足够的数据。神经网络当然是极其灵活的,这种灵活性正是其成功原因的一部分,但不是全部,不是吗?

毕竟,这种超级灵活的模型在机器学习和统计学中有着 70 多年的发展历史。我并不认为神经网络是先验(priori)的,我也不认为比同等复杂度的其他算法更灵活。

下面是我对其成功所作的原因总结:

总结一下,我认为上述原因很好地解释了为什么深度学习在实践中奏效,打破了深度学习需要大量参数和数据的假设。最后,本文并不是想说 Jeff 的观点错了,而是旨在提供一个不同的新视角,为读者带来启发。

,
    推荐阅读
  • 卡卡退役后还会看足球吗(卡卡随基普乔格跑完柏林全马)

    在9月25日进行的2022柏林马拉松赛上,37岁的肯尼亚名将基普乔格以2小时1分9秒的成绩夺冠,并创造了全新的世界纪录。后半程,卡卡的速度有所下降,但最终以3小时38分06秒完赛的成绩,在业余马拉松选手中还是算相当不错的。而且,这次卡卡参加柏林马拉松也有为父亲打气、鼓劲的原因。2016年镇江马拉松,李铁又以1小时45分的成绩完成半马比赛。

  • 学校预防新冠肺炎防控知识(复课防控小知识)

    对其它地区返校师生要做好体温监测及症状筛查。高校应设置集中隔离医学观察区,对来自或经停湖北以及疫情高发地区的师生和被判定为密切接触者进行集中医学观察。要配合辖区疾病预防控制中心做好疑似或确诊病例的流行病学调查、密切接触者排查。在辖区疾病预防控制中心和中小学卫生保健科的工作人员指导下进行消毒。所使用消毒剂应在有效期内。

  • 按部就班造句(按部就班造句一年级)

    7、即使是您认为应该按部就班,直截了当的技术决策,也会有政治参杂其中,特别是您处于决定是否批准购买某企业工具的职位。

  • 15分钟快速退烧(我娃快速退烧)

    我娃快速退烧昨天晚上10点半才回家,刚回到家里,老人家就说,娃发烧了,我赶紧到房里看娃,发现他还在被窝里打冷战急忙用手探他额头,哇!挺烫的,问他哪里不舒服?头疼头晕发热发冷������,用探热针测出来事38.9℃。

  • 产后怎么缩阴效果好

    运动法阴道本身有一定的修复功能,产后出现的扩张现象在产后3个月即可恢复。产后妈妈可以通过一些锻炼来加强弹性的恢复,促进阴道紧实。练习骨盆运动女人半蹲,两膝微屈,两足分开60厘米左右,两手叉腰。吸气,将骨盆前推;呼气,将骨盆拉回,同时臀部尽量向后撅起。练习展腿运动女人运动躯干、大腿时,腹压作用于阴道,产生快感,同时阴道口开张,利于局部气血通畅。女人坐姿,两手后撑,左腿屈立,右腿屈膝外展,平放垫上。

  • 手机新浪微博怎么取消关注(手机新浪微博如何取消关注)

    以下内容希望对你有帮助!手机新浪微博怎么取消关注打开新浪微博手机客户端,点击页面底部“我”菜单,在展开的页面中,点击“关注”选项。打开微博账号当前关注的用户之后,点击“关注的人”菜单按钮。接下来,可以看到当前已经关注的用户,想要取消关注的话,点击“已关注”按钮,在弹出的对话框中,点击“确定”按钮即可。

  • 广州人口(广州的介绍)

    广州人口广州人口数量:1530.59万人。广州是首批国家历史文化名城,广府文化的发祥地,从秦朝开始一直是郡治、州治、府治的所在地,华南地区的政治、军事、经济、文化和科教中心。广州被全球权威机构GaWC评为世界一线城市,每年举办的中国进出口商品交易会吸引了大量客商以及大量外资企业、世界500强企业的投资,国家高新技术企业达8700多家,总量居全国前三,集结了全省80%的高校、70%的科技人员,在校大学生总量居全国第一。

  • 夏天的租房市场(北京租房夏理银)

    2012年2月,女儿参加“国考”被录取到了国家机关。7月,接通知到单位报到上班。也就是说,租户与房东并无直接联系。我们签订的租期为一年,中介先收一个月的房租即3600元为中介费,另外还要一次性地交付“押二付三”的费用。所谓“押二付三”,就是将两个月的房租作为押金,另预付三个月的房租。如果合同到期双方无什么纠纷时则押金退回。合同签订后我们和中介按合同上的内容对室内设施进行查看清点,完毕后中介将钥匙交付我们。

  • 麻酱秋葵的做法凉拌(简单版凉拌(麻酱秋葵的做法)

    以下内容大家不妨参考一二希望能帮到您!麻酱秋葵的做法凉拌原料:秋葵、橄榄油、盐、芝麻酱、大蒜。秋葵洗干净入煮锅焯水后捞出沥干水。大蒜碎放入碗中加盐。加橄榄油搅拌均匀成芝麻酱汁。秋葵放入盘中,添加芝麻酱汁,稍加搅拌即可享用。

  • 稍的拼音和组词(稍的拼音和组词是怎样的)

    稍的拼音和组词稍的拼音和组词:稍许、稍微、稍纵即逝、稍稍、稍麦、脱稍、手稍、稍地、花稍、枝稍、稍伯、秩稍、稍芟、稍房、稍子、稍麻寺、稍属、眼稍、稍杀、稍问、四稍、稍黩筐篚、稍安勿躁、稍倾、上稍、俸稍、稍麄胆壮、稍长胆壮、乡稍、稍迁、拉稍寺、头稍自领、竿稍、稍绿、稍挽稍、稍侵、饩稍、稍天、奉稍、没下稍。稍有shāo和shào两种读音。作shāo时本义为禾末,引申为略微。作shào时〔~息〕军事或体操的口令。