关键词:
聚类,K-means
SQL
关系数据库管理系统
摘要:
基于关系型数据库管理系统(DBMS)的数据挖掘算法对数据库程序员来说是一个很重要的问题。这里介绍了利用SQL实现的基于关系数据库管理系统的K-means聚类算法,将简单的K-means计算转化为SQL。实验证明,提出的K-means聚类算法可以对大型数据集进行聚类。将K-means算法分别用SQL和C++实现,比较相关的速度和可伸缩性,并且研究了在DBM S外输出数据集的时间。实验表明,SQL对于小型数据集还是很有效的,但对于大型数据集效率较低,而输出次数对于C++成为了一个瓶颈。