[Uber 面经][DS] Modeling at Scale

uber 在1w+个城市运营,怎么预测有多少个trip ?,每一个城市都搞一个model 的话computation cost 太大,要怎么办?

不太懂回答这个问题的方向,可以先训练一个general model然后再针对每个city做transfer learning吗

为什么不能用一个model对所有city做预测?只需要把city (以及这个city的具体信息)作为feature放在模型里就可以。这样可以把city之间的共通/相似性也考虑进去。

当然,通过evaluation, 如果发现有一些city的user pattern很特殊的话,可以再单独用这个city的数据构造一个模型。但这种情况不应该很频繁地出现。