[Random Forest]有关OOB的公式计算问题

在第11课和OOB相关的课件里写到计算OOB的公式,我们是对full data size n来做相加和平均的。 但是有没有可能其中有一行数据它被选到了所有的decsion tree中做训练导致所有的tree都没有拿它来做test,那这样的话我们在算oob的时候就没法使用full data size,因为并不是对每一行数据都做了test,那公式中的除以n需要针对这样的情况进行改变吗?

你说的完全正确。我在这里应该把OOB的公式中的full data size n 改成 size of all the OOB instances. 也就是那些没被包括在所有Tree的training dataset的数据。