场景:需开发一个fraud detection系统对欧洲10国market的某个网站的交易数据进行欺诈检测。
这里assumption会是 不同国家可能会存在消费行为的shift
那么建一个model,这个model也take as input了customer profile (include country),所取得的效果
和
分别对每个market建一个model,features基本也都一样,得到的效果
有何区别?
pros and cons?
我的个人想法是如果不同market间的用户行为是non-linear separable的话,用tree-based model效果就是一样的,但用logistic regression的话如果只有一个model只能做到全局最优 但是对于每个market细分来看performance,却不一定是最优的; 如果不同market间的用户行为是很相似地linear separable的话,那么不论是1个总的model还是10个model的最终效果是很相似的。
不知道我的想法对不对,请同学指正