当前位置: 代码迷 >> Oracle开发 >> oracle的数据挖掘中的聚类,该如何解决
  详细解决方案

oracle的数据挖掘中的聚类,该如何解决

热度:108   发布时间:2016-04-24 06:39:30.0
oracle的数据挖掘中的聚类
最近在看oracle data mining,试着进行了下聚类(clustering),使用的o-cluster算法,要进行聚类的数据表有三千万行记录,在进行聚类的时候,临时表空间增长的很快,中途提示temp不能扩展(聚类之前已经扩展了temp的数据文件),查询的时候发现temp表空间的数据文件有90G左右,聚类还没有完成。我想问下,temp表空间怎么增长这么快,这个问题怎么解决,或者是要进行聚类之前多增加些temp的数据文件吗?但当数据量很大时怎么办?
------解决方案--------------------
对o-cluster算法不了解,但是看起来应该是聚类操作使得大量数据在临时表空间中进行排序,造成数据文件暴涨。解决的方法,1是尽可能删除垃圾数据,降低数据量,2是了解该算法的工作机制,可能的话,使用适当的索引来缓解临时表空间压力,提高聚类操作的效率。以上方法如果不行,大概就只能准备足够大的临时表空间,待数据万挖掘完成以后,重建临时表空间来回收磁盘空间
  相关解决方案