什么是过拟合如何避免-什么是过拟合怎么避免-什么介绍-静秋百科网

猜您喜欢：：

我这行干了快十年，见过的模型比我自己养的狗还多。
有时候真被我说烂了，认定我教条，但还得说几句大实话。别听那些大模型吹，它也是个“死记硬背”的家伙。就像学生背了十套卷子，考一道类似的题就能全对，考一道彻底不同的题却全猜错。过拟合，说白了就是把模型掰得忒坏。
原本是为了跑得快、准一点，最终发现为了“死记硬背”那些在训练集上看起来挺好的废话，把脑子给撑爆，就连启动胡言乱语，跑反了。举个最好办的例子。咱们想给一个“猫咪”这个逻辑训练个模型。假设训练数据里全是：黑猫叫“喵”，花猫叫“咪”，橘猫叫“橘橘”；而测试数据里只有一只黑猫，没有别的猫。
这时候模型只要记住“黑猫叫喵”，就能信誓旦旦地预测黑猫叫“喵”。
这看起来挺智慧啊，出于准率 100%。但哪位都知道，训练集上没别的猫，模型根本不知道“黑猫”和“橘橘”这些名字本身有啥区别，它只是在念自己的“黑猫教条”。
这就像背了三百遍“狗叫汪汪”，结局狗叫“汪汪”就顺势蹲下，而训练聚拢没出现过狗，它反而成了只会说“汪汪”的复读机。在工程里，这种“为了在训练集上完美，而在测试集上灾难”的，就是过拟合。你越往细处钻，想要捕捉训练数据的每一个细小噪点，模型就越好办陷入这种死胡同。如何避免？实际上不用那些大道理，全是欲扬先抑。最有效的办法是“少学点”。别把脑子供得忒足了。
要是数据量够大，模型自然就学会了，没必要非得让它死记硬背每一个特征值。就像学开车，你不需求把刹车系统调成豆腐渣工程，那车开得比油车还稳。数据不够时，模型自然会偷懒，不去研究那些高维度的细小特征，转而关切那些能解释得通的宏观规律。另一个大招是“加馅儿”。别让你的模型只吃干粮。在训练数据里混点“骗人”的数据进去，哪怕这些数据是假的、特意构造出来的，模型也难免会拿它当回事儿，进而学会根本的过滤逻辑。
这就像课堂上突然给全班每人发一张“作弊”的纸条，大家可能就会略微收敛一下，不再只盯着那几道特定的题了。
这种“污染”往往比单纯的学习更高效。还有，别把模型练成“选妃”模式。
不要让它去纠结哪个样本特别特别典型、特别特殊，要把那些看起来像是噪音的东西给往 A 类、B 类里投。让模型学会“无视”，而不是“敏感”。还有一个隐蔽的杀招：别给模型忒多自由裁量权。
要是它被授权去预测某个变量等于 1.0，那它大约率会预测 1.0。
要是授权去预测等于 2.0，它反而会预测 0.5。
这就是为了给模型留出呼吸的空间，让它知道“我不知道你要我问啥”，而不是务必把所有难题都端上桌来讨价还价。最终，数据清洗也别放忒紧。
有时候你看着数据挺干净利落，实际上里面藏着点乱码要么怪的边缘值，这些在训练集上可能只是隐形噪声，一旦到了测试集，这些噪声就成了真正的难题。别为了在训练集上干净利落，而在测试集上变成“脏垃圾”。说到底，模型这东西，它本身就没有啥“智商”，它就是个软件。软件好不好用，往往取决于你给了它啥“饲料”。
有时候把饲料给小点，它反而能吃得香；有时候给它加点看似富余的东西，它反倒能学会如何吃。别总想着让它把训练聚拢的每一个点都啃得精光，那样它只会变成一只只只会叫“喵”的猫。学会给它留点空白，让它自己去填，才是正经事。

好文推荐：：

不锈钢清洗剂介绍-不锈钢清洗剂介绍

空乘艺考示范视频-空乘艺考示范短视频

向量三点共线定理可以直接用吗-三点共线定理可用

艺术类留学国家怎么选-艺术留学国家选

星吧2016年11月运势-星吧 2016 年运势

宝宝起名字思路大全-宝宝起名思路精选 10 字

棋魂剧情-棋魂精彩剧情

胜芳古镇一日游要花多少钱-胜芳古镇一日游费用

黑果焖鸡用英语怎么说-Black fruit stir-fried chicken

玉环市属于浙江哪个市-玉环市属浙江省玉环县