Xgboost安装、使用和算法原理理解

本文详细介绍了XGBoost的重要资源,包括官方文档、GitHub源码和Maven仓库,提供了Spark上使用XGBoost的示例代码,并分享了实际使用过程中的经验和技巧,涉及模型训练、评估和调参。此外,还探讨了XGBoost的基本原理和参数设置。

一、Xgboost相关重要文档

1、官方文档

官方文档中可查询到各语言版本的安装方法、官方用例等

XGBoost Documentation — xgboost 1.6.0-dev documentationhttps://xgboost.readthedocs.io/en/latest/index.html2、github

github源码可查看代码实现、下载数据样例等GitHub - dmlc/xgboost: Scalable, Portable and Distributed Gradient Boosting (GBDT, GBRT or GBM) Library, for Python, R, Java, Scala, C++ and more. Runs on single machine, Hadoop, Spark, Dask, Flink and DataFlowhttps://github.com/dmlc/xgboost3、maven仓库

使用IDEA配置xgboost4j的时候,根据scala版本配置依赖

https://mvnrepository.com/artifact/ml.dmlc/xgboost4jhttps://mvnrepository.com/artifact/ml.dmlc/xgboost4j

POM文件配置:

<properties>
 <spark.version.scala>2.12</spark.version.scala>
 <scala.version>2.12.6</scala.version>
 <spark.version>3.0.2</spark.version>
 <xgboost.version>1.2.0</xgboost.version>
</properties>


<dependencies>
<dependency>
 <groupId>ml.dmlc</groupId>
 <artifactId>xgboost4j-spark_${spark.version.scala}</artifactId>
 <version>${xgboost.version}</version>
</dependency>
</dependencies>

二、xgboost使用方法

参考官方github给出的spark分布式训练的代码例子

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值