avatar
文章
3111
标签
111
分类
73
首页
时间轴
标签
分类
关于
友链
LogoEstom的博客SUMMARY 返回首页
搜索
首页
时间轴
标签
分类
关于
友链

SUMMARY

发表于2021-03-20|更新于2021-03-20|Sklearn
|总字数:54|阅读时长:1分钟|浏览量:
  • Scikit-learn 秘籍
  • 第一章 模型预处理
  • 第二章 处理线性模型
  • 第三章 使用距离向量构建模型
  • 第四章 使用 scikit-learn 对数据分类
  • 第五章 模型后处理
文章作者: Estom
文章链接: https://estom.github.com/2021/03/19/Sklearn/sklearn-cookbook-zh/SUMMARY/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客!
cover of previous post
上一篇
5 模型后处理
第五章 模型后处理 作者:Trent Hauck 译者:飞龙 协议:CC BY-NC-SA 4.0 5.1 K-fold 交叉验证这个秘籍中,我们会创建交叉验证,它可能是最重要的模型后处理验证练习。我们会在这个秘籍中讨论 k-fold 交叉验证。有几种交叉验证的种类,每个都有不同的随机化模式。K-fold 可能是一种最熟知的随机化模式。 准备我们会创建一些数据集,之后在不同的在不同的折叠上面训练分类器。值得注意的是,如果你可以保留一部分数据,那是最好的。例如,我们拥有N = 1000的数据集,如果我们保留 200 个数据点,之后使用其他 800 个数据点之间的交叉验证,来判断最佳参数。 工作原理首先,我们会创建一些伪造数据,之后测试参数,最后,我们会看看结果数据集的大小。 1234>>> N = 1000 >>> holdout = 200>>> from sklearn.datasets import make_regression >>> X, y = make_regression(1000...
cover of next post
下一篇
4 使用 scikit-learn 对数据分类
第四章 使用 scikit-learn 对数据分类 作者:Trent Hauck 译者:飞龙 协议:CC BY-NC-SA 4.0 分类在大量语境下都非常重要。例如,如果我们打算自动化一些决策过程,我们可以利用分类。在我们需要研究诈骗的情况下,有大量的事务,人去检查它们是不实际的。所以,我们可以使用分类都自动化这种决策。 4.1 使用决策树实现基本的分类这个秘籍中,我们使用决策树执行基本的分类。它们是非常不错的模型,因为它们很易于理解,并且一旦训练完成,评估就很容易。通常可以使用 SQL 语句,这意味着结果可以由许多人使用。 准备这个秘籍中,我们会看一看决策树。我喜欢将决策树看做基类,大量的模型从中派生。它是个非常简单的想法,但是适用于大量的情况。 首先,让我们获取一些分类数据,我们可以使用它来练习: 123>>> from sklearn import datasets >>> X, y = datasets.make_classification(n_samples=1000, n_features=3, ...
avatar
Estom
也许那年在绿色的麦浪中奔跑的时候,就注定了我此生的繁华与悲叹
文章
3111
标签
111
分类
73
关注
公告
欢迎参观Estom的小屋
最新文章
自引用泛型概述
自引用泛型概述2025-12-21
06 JUC并发容器
06 JUC并发容器2025-12-18
02 集合底层结构
02 集合底层结构2025-12-18
30 问题排查和性能优化指南
30 问题排查和性能优化指南2025-09-14
面试说明
面试说明2025-09-03
© 2025 By Estom框架 Hexo 8.1.1|主题 Butterfly 5.5.3
搜索
数据加载中