We are back!!!

Hola, después de tiempo!! Queremos retomar este blog, prometemos postear más seguido, por mi parte tengo una estrategia, que se las pasamos a contar y que empieza en este primer post Si tenemos más de un criterio para agrupar nuestros casos lo mejor es que recurramos a estas técnicas. Finalmente lo que buscamos obtener es [...]

数据挖掘的错误与陷阱

1 只关注训练数据训练样本之外的数据才是真正重要的。安德森医疗中心的研究人员在十年前使用神经网络来检测癌症。相对于训练样本,他们的检验样本表现不佳,但还算不错的。但他们认