Data_mining 本仓库为研究生课程数据挖掘的实验,实验包括以下2个分类器: 1.K均值聚类,二分k聚类 用matlab编写,直接运行即可,其中含有SSE的计算 2.决策树 用python编写,使用了sklearn库,其中包括holdout,交叉验证,bootstrap,adaboost等模型评估方法,决策树包括预剪枝,后剪枝以及分别从信息增益,错误率和基尼指数进行树生成