decision tree 是否linear

我们一般说decision tree 是non-linear model, 但是它划分的各个boundary 却都是linear 的对吧? 如果我知道我的data 的boundary 不是linear 的 (比如boundary 呈S 形),这种情况还能用decision tree 或者说tree-based model 吗? 换句话说,有什么情况是很不适合用tree based model 的吗

这个问题我们在class 9 decision tree的课程中会详细讨论。

  1. decision tree确实是non-linear model, 这是由于该模型中x和y的关系并不是简单的一次多项式形式,核心原因在于tree branch split的逻辑。如果一定要从图形的角度看,decision tree的boundary确实是由很多线性分割线组成的(注意,不是一条线, 是很多条线),这些分割线连接成的boundary也可以被看做非线性。
  2. tree-based model不使用于sparse feature的应用场景,因为那种情况下, tree对数据的分割功能会退化。 这个问题课上会给大家介绍。