有个classification model,performance也不错,某个feature x是最重要的feature,但这个x在两个class的distribution差不多,问题出在哪。
我不认为这是问题。衡量模型唯一的标准就是在new data上的performance。如果你是想解释这个feature的impact的话,有可能它与其他features之间的interaction impact on label是明显不同的,而它自己单独对label的impact可能在不同label见效果类似。