有两个关于project的问题想问一下老师:
- 构建label的时候,我们进行了对有相同user_id&product_id pair的信息进行了去重操作,但他们drop的行的‘order_number’,'order_dow’这些都有可能是不一样的,随机drop的话,保留下来的信息相当于是随机留下来的,那为什么还要保留这些作为feature呢?为什么不全都用之后构建的feature呢?
- 在构建user_product features时,为何不构建per user的商品距离上次被购买的均值,而在构建product features时有这个feature?
product feature:
user_product feature: