当前位置:首页 > 论文知识 » 正文

快速聚类XX文(矩阵相似的若干判定方XX文)

目录:

快速聚类XX文

矩阵相似的若干判定方XX文

K均值聚类算法

canopy算法

快速聚类XX文

快速聚类XX文

1、摘 要:为了从大量含噪的航运信息中挖掘出有用的知识,研究孤立点探测方法在航运信息处理中的应用,在对k-means聚类算法分析的基础上,定义中位数的概念及孤立点的判断标准,提出一种基于k-means聚类的孤立点分析算法;,针对航运信息的特点,采用一维数据和XX数据异常点探测方法挖掘AIS数据库中的异常信息,实验结果证明,基于k-means聚类的算法对孤立点更敏感,能够探测到一维统计方法中探测不到的异常点.

矩阵相似的若干判定方XX文

矩阵相似的若干判定方XX文

1、摘 要:为了提高基于相似度矩阵的K-Means算法(K-means)处理大数据的能力,它使用MapReduce分布式编程模型,并结合K-means算法自身的特点,设计出了K-means算法基于MapReduce的并行化实现.通过设计Map和Re-duce函数实现了K-means算法的并行化.Map函数通过计算样本和聚簇中心的相似度来确定样本的聚簇归属,Re-duce函数用于完成聚簇中心的计算.实验结果证明,基于MapReduce的并行化的K-means算法在保证文本挖掘性能不降的前提下,使得运行效率得到了大幅度提升.

2、随着大数据时代的到来,人们所接触到的数据量成PB级别快速增长,同时还要求快速高效地处理所得到的数据.对于数据处理有两方面的要求,一是要比数据产生的速度快,二是还要达到数据使用者对处理结果的预期.尽管这两个要求通过使用并行计算的框架得到了一定程度上的满足,但是MPI等传统的并行框架还存在不少缺点,像技术人员需要自己实现对任务分配、集群管理等工作的编码,它在可扩展性上也有一定的XX等问题,这样就直接增高了传统并行框架的使用门槛,也无法将成本控制在一个较低的水平.而MapReduce等并行计算框架的出现较好地解决了并行计算实现难和成本高的问题.本文使用MapReduce并行框架,对基于相似度矩阵的K-Means算法(K-means)进行并行化处理.

3、MapReduce处理大数据集,其关键步骤为Map函数和Re-duce函数的设计与实现.用户根据自己的要求对这两个函数进行自定义,函数的输入与输出都是使用键值对的形式.

4、Map函数中,MapReduce模型把数据集平均分割成若干个数据块,再把各数据块解析成对的形式.各个数据块经过Map函数的处理得到一组相应的结果,其结果记录为对.这些结果将会被输入到Reduce函数中.

K均值聚类算法

K均值聚类算法

1、⑤ 迭代直至收敛 : 迭代执行 ② ③ ④ 步骤 , 直到 聚类算法收敛 , 即 中心点 和 分组 经过多少次迭代都不再改变 , 也就是本次计算的中心点与上一次的中心点一样 ;

2、给定 一组样本 , 和 一组中心点 , 计算 所有样本 到 所有中心点 的距离 , 给样本 分组 , 计算分好组的样本的中心点 , 重新计算所有样本到所有中心点的距离 , 继续进行分组 , 一直迭代执行上述操作 , 直到连续两次样本分组不再变化 ;

canopy算法

1、技术的快速发展,数据库技术得到了迅猛发展,目前,数据库已经在人们的生活中广泛应用。产生越来越多的数据,如文本、图像、视频以及音频数据等,这些数据发挥了当前效用后,数据的价值也随时间而降低,被作为资料存起来。由于这些资料的范围广复杂度高,很难准确的形容和有效的利用,因此如何从中提取有用的信息和知识,成为了人们一项艰巨的任务。为了解决用户从这些大量数据中挑选出其间所蕴涵的有价值的知识,人们结合统计学、数据库、计算机和人工智能等技术,提出了数据挖掘(Data Mining,DM)技术。

2、聚类;关联分析,关联规则分析,序列模式分析,相似时间序列分析;预测:时间序列预测,算法有统计的时间序列模型,例如,ARIMA、Box-Jenkins、神经网络。 聚类分析算法研究k-means算法:

后台-系统设置-扩展变量-手机广告位-内容正文底部

本文标签:数据  算法

<< 上一篇 下一篇 >>

  • 评论(

赞助团论文网
留言与评论(共有 0 条评论)
   
验证码:

相关文章

随机文章

标签列表

最近发表

    热门文章 | 最新文章 | 随机文章

最新留言

首页 论文知识 教育论文 毕业论文 教学论文 经济学 管理学 职称论文 法学 理学 医学 社会学 物理学 文献 工程论文 学位论文 研究论文

Powered 团论文网 版权所有 备案号:鄂ICP备2022005557号统计代码

全站搜索