想请问一下老师,对于多分类问题,LDA,QDA和naive bayes是不是都是很好的模型选择(如果feature数量不大的话)?
LDA (Latent Dirichlet Allocation) 这种概率生成模型的training/inference速度都比较慢,这是它的一个缺陷。当然,现在有onlineLDA或者其他一些library可以提高运算速度。而Naive bayes使用得较少,因为它的conditional independent assumption有很强的局限性,对绝大部分具体应用场景都不适用。一般来说,如果数据量很大,multi-class classification是用neural network. 如果数据量不大,可以用one-vs-all的方法构建成binary classification, 从而通过tree-based model or logistic regression处理
1 个赞