- 1)Model Error 在这里为什么被写成了E_D[(f(x;D)-y)^2],为什么会有个平方?这样不就算成方差了吗?不应该是E_D[f(x;D)-y]吗
1.2)为什么Error不是mean square error就等于三个平方相加?Error不应该不带平方号吗
2. Model Error这些计算都是针对一个点而讨论的吗?如果是多个点,每个点又有多组model,整体error就没法算;但如果只讨论一个点,好像又意义不大。
1.2)为什么Error不是mean square error就等于三个平方相加?Error不应该不带平方号吗
2. Model Error这些计算都是针对一个点而讨论的吗?如果是多个点,每个点又有多组model,整体error就没法算;但如果只讨论一个点,好像又意义不大。
第一个公式E_D(Error)没有规定Error的具体形式,因此有irreducible error term. 第二个公式中,我们规定“we choose to use squared error”, 因此根据公式推导,irreducible error term就不存在了。这件事情在课上说过多次。
“MSE是很多个model space 里的model针对一个点的squared error的平均吧?”我没说过这句话,不知道你是从哪里了解到的这个观点。
MSE中的mean, 是对于多个数据点产生的error的mean, 和model space中我们讲到的内容不同。Model space概念中,我们还是研究的单个数据点的error,当然,我们可以把研究的单个数据点的error,在多个数据上再累加,再取平均,那就是另外的事情了,即 mean_m[E_D(error_i)].
公式里写的E_D(Error)您上课讲的时候说指的是error在model space的期望呀? 您上课讲这个E_D(Error)的意义的时候,举了(4000,30)的例子,那我理解涉及到model space的话,看error都是一个点?
加上这一页ppt最下面的公式(bias^2+variance)的前提是使用mean square error,其实E_D(Error)这个表达式的意义,就是某点在model space上的square error,然后取期望、也就是取mean?
这里CONTEXT就是在您的PPT上同时出现了“某点error对于Model Space的期望”和“用mean square error”。前文您说的是MSE是多个点,Model Space的讨论是单个点,那对于这部分,讨论的到底是单个点还是多个点呢?