博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习之路: python 实践 提升树 XGBoost 分类器
阅读量:5034 次
发布时间:2019-06-12

本文共 1576 字,大约阅读时间需要 5 分钟。

git: https://github.com/linyi0604/MachineLearning

数据集被我下载到本地,可以去我的git上拿数据集

XGBoost

提升分类器
属于集成学习模型
把成百上千个分类准确率较低的树模型组合起来
不断迭代,每次迭代生成一颗新的树
下面 对泰坦尼克遇难预测
使用XGBoost模型 和 其他分类器性能进行比较

 

1 import pandas as pd 2 from sklearn.cross_validation import train_test_split 3 from sklearn.feature_extraction import DictVectorizer 4 from sklearn.ensemble import RandomForestClassifier 5 from xgboost import XGBClassifier 6  7 ''' 8 XGBoost 9 提升分类器10     属于集成学习模型11     把成百上千个分类准确率较低的树模型组合起来12     不断迭代,每次迭代生成一颗新的树13     14     15 下面 对泰坦尼克遇难预测16 使用XGBoost模型 和 其他分类器性能进行比较17 18 '''19 20 titanic = pd.read_csv("../data/titanic/titanic.txt")21 # 抽取pclass age 和 sex 作为训练样本22 x = titanic[["pclass", "age", "sex"]]23 y = titanic["survived"]24 # 采集的age空的用平均数补全25 x["age"].fillna(x["age"].mean(), inplace=True)26 27 # 分割训练数据和测试数据28 x_train, x_test, y_train, y_test = train_test_split(x,29                                                     y,30                                                     test_size=0.25,31                                                     random_state=33)32 # 提取字典特征 进行 向量化33 vec = DictVectorizer()34 x_train = vec.fit_transform(x_train.to_dict(orient="record"))35 x_test = vec.transform(x_test.to_dict(orient="record"))36 37 # 采用默认配置的随机森林进行预测38 rfc = RandomForestClassifier()39 rfc.fit(x_train, y_train)40 print("随机森林预测准确率:", rfc.score(x_test, y_test))  # 0.781155015197568441 42 # 采用XGBoost模型进行预测43 xgbc = XGBClassifier()44 xgbc.fit(x_train, y_train)45 print("XGBoost预测准确率:", xgbc.score(x_test, y_test))  # 0.7872340425531915

 

转载于:https://www.cnblogs.com/Lin-Yi/p/9009271.html

你可能感兴趣的文章
11个审查Linux是否被入侵的方法
查看>>
CentOS6.7源码安装MySQL5.6
查看>>
android Bitmap总结
查看>>
触发器简介
查看>>
JAVA反射机制的学习
查看>>
mysql - rollup 使用
查看>>
Chrome系列 Failed to load resource: net::ERR_CACHE_MISS
查看>>
出现函数重载错误call of overloaded ‘printfSth(double)’ is ambiguous
查看>>
SDUT 1941-Friday the Thirteenth(水)
查看>>
java API连接虚拟机上的hbase
查看>>
c#扩展出MapReduce方法
查看>>
Cookie工具类 - CookieUtil.java
查看>>
[转载]linux下各文件夹的结构说明及用途介绍
查看>>
《敏捷开发绩效管理》扩展阅读(敏捷开发绩效管理,敏捷团队绩效管理)
查看>>
Jquery怎么获取select选中项 自定义属性的值
查看>>
CKEditor (Toolbar Definition)工具栏自定义配置
查看>>
在vscode成功配置Python环境
查看>>
mysql table 最新更新时间
查看>>
个人永久性免费-Excel催化剂功能第37波-把Sqlserver的强大分析函数拿到Excel中用...
查看>>
PHP中字符串比较的常用方法
查看>>