深入探索Catboost模型可解释性（下） | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

深入探索Catboost模型可解释性（下）

2019年07月16日由 sunlei 发表 954807 0

在昨天的内容中，我们看到catboost如何帮助我们分析模型，今天我们继续更新，希望能帮助你更好地使用这些工具去开发模型。

传送门：https://www.atyun.com/?p=42039&preview=true

交互

通过这个参数，您可以找到一对特性的强度(两个特性的重要性)。

在输出中，您将得到每对特性的列表。列表将有3个值，第一个值是该对中第一个特性的索引，第二个值是该对中第二个特性的索引，第三个值是该对的特性重要性得分。具体实施请查看嵌入式笔记本。

有趣的是，在单一功能重要性中，前两个功能不一定会成为最强的一对。

笔记本

笔记本中使用的数据集

对象重要性

你为什么要知道？

从训练数据中删除最无用的训练对象

将一批新对象按优先级排列，以便根据哪些对象最有帮助进行标记，类似于主动学习。

使用此功能，您可以计算每个对象对测试数据优化指标的影响。正值表示优化指标增加，负值表示优化指标减少。该方法是本文所描述方法的一个实现。这些算法的细节超出了本文的范围。

Catboost对象重要性教程

cb.get对象重要性中有三种更新方法：

SinglePoint：最快最不准确的方法

TopKLeaves:指定叶数。数值越大，计算越精确，速度越慢

AllPoints:最慢最准确的方法

例如，下面的值将方法设置为TopKLeaves，并将叶子的数量限制为3:

TopKLeaves:top=3

模型分析情节

CatBoost最近在其最新更新中启动了此功能。有了这个特性，我们将能够可视化算法是如何分割每个特性的数据的，并查看特性特定的统计信息。更具体地说，我们将能够看到：

每个容器（容器用于连续特征）或类别的平均目标值（目前仅支持OHE特征）

每个容器/类别的平均预测值

每个容器中的对象数

对不同特征值的预测：对于每个对象，特征值都是不同的，因此它会落入某个容器中。然后，该模型根据该特性的新值预测目标，并取一个容器中预测的平均值（由红点给出）。

这个图会给我们提供信息，比如我们的分割有多均匀（我们不希望所有的物体都放在一个容器里），我们的预测是否接近目标（蓝色和橙色的线），红线会告诉我们预测对某个特征有多敏感。

数值特性分析

一组热编码特征分析

感谢您阅读本文。希望下次您能够使用这些工具更好地开发您的模型。

标签：

学习 Catboost

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇深入探索Catboost模型可解释性（上）

下一篇如何给6岁小盆友讲解面向对象编程

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

广告

写评论取消

回复取消