优化K-means算法的实现与应用(省级大创项目)
日期:2020-04-01  发布人:admin  浏览量:955

项目名称:优化K-means算法的实现与应用

执行时间:2018年7月至2019年10月

项目成员:李小飞、张凌霄

指导教师:邵欣欣(副教授) 软件工程系

项目简介(200字以内):

传统的K-means算法的最大缺点之一是初始类聚数k值的选择,选择不当容易得到局部最优解,无法得出更准确的结果,针对k值的选择进行优化,使用其他算法或方法得出更合适的k值,使得K-means算法的结果更加精确,优化后的K-means算法能够获取更加精准的结果,对数据的分析挖掘更加准确,能够获取更多的潜在信息,为使用者提供更加准确的数据结果。本项目针对K-means算法的聚类数和聚类中心的选择进行优化形成优化K-means算法。

创新点(100字以内):

1.使用Java语言实现K-means算法,并且完成对大量数据的分析。

2.选择适当的方法或算法优化K-means算法中最关键的部分即K值得选择,选择Canopy算法作为得出K值的算法或者使用正态分布的方法得出K值的更优解。

3.将K-means算法以及优化后的K-means算法对同一数据进行分析,并将分析结果用图像直观的呈现出来,凸显优化算法的效果。

取得成果:

1.优化后的算法和代码、文档

2.软著

3.论文

心得体会(50字以内):

K-means算法中参数K值对算法分析结果影响很大,Canopy算法很好的解决了这个问题,本项目通过算法的实现,对数据分析,结果对比,证明了这一理论。当然算法依旧有很大的改进空间。

相关图片:

收藏本页