Please wait a minute...
 
主管单位:广东省科学技术厅
主办单位:广东省科技合作研究促进中心
编辑出版:《电脑与电信》编辑部
ISSN 1008-6609 CN 44-1606/TN
邮发代号:46-95
国内发行:广东省报刊发行局
《电脑与电信》唯一官方网站。
电脑与电信
  本期目录 | 过刊浏览 | 高级检索 |
基于Canopy的K-Means并行化算法
安徽理工大学 计算机科学与工程系
K-Means ParallelizationAlgorithm Based on Canopy
全文: PDF(0 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 针对大数据带来的海量信息,传统的数据挖掘方法已经不再适用。近些年来很多学者提出新的数据挖掘方式,或者在传统的方法上进行改进,但是还远不足以处理这些海量信息。在总结已有方法的基础上,提出一种基于C anopy的K-M eans并行化算法。与传统的K-M eans算法相比,本文提出的改进方法会通过密度确定初始中心,然后在H adoop分布式集群上运行K-M eans算法。实验证明,该方法在保证精度的情况下,能降低运算复杂度从而提高计算效率。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王 颖
关键词 数据挖掘C anopy并行化H adoop    
Abstract:Aiming at the massive information brought by big data, the traditional data mining method is no longer applicable. In recent years, many scholars have proposed new data mining methods, or improved the traditional methods. But it is still far from adapting to this vast amount of information. After summarizing the previous methods, an improved K-Means algorithm based on Canopy is proposed in this paper. Compared with the traditional K-Means, the improved method proposed in this paper will first de- termine the initial center by density, and then run the reduced data on the Hadoop distributed cluster. The experimental results show that this method can reduce the computational complexity and improve the computational efficiency under the condition of ensuring the accuracy.
Key wordsdata mining    Canopy    deserialize    Hadoop
年卷期日期: 2019-07-10      出版日期: 2019-07-13
作者简介: 王颖(1995-),女,安徽池州人,硕士研究生,研究方向为大数据挖掘。
引用本文:   
王 颖. 基于Canopy的K-Means并行化算法[J]. 电脑与电信, .
链接本文:  
https://www.computertelecom.com.cn/CN/  或          https://www.computertelecom.com.cn/CN/Y2019/V1/I7/30
[1] 黄慧君  王 波  李宇中. 地市农商银行整村授信使用率数据分析 ——以H农商银行为例[J]. 电脑与电信, 2024, 1(5): 1-.
[2] 沈 培  曹晓静  郑心炜.
基于数据挖掘的网络营销课程项目式教学改革
[J]. 电脑与电信, 2024, 1(4): 35-37.
[3] 李姗姗 李 忠.
新工科背景下数科专业数据挖掘与分析课程建设
[J]. 电脑与电信, 2023, 1(4): 28-.
[4] 刘 然 程 曼.
基于数据挖掘的校园食品安全事件分析
[J]. 电脑与电信, 2022, 1(4): 65-.
[5] 王茂发 王子民 汪华登 刘振丙. 基于Jupyter的数据挖掘课程建设与研究 [J]. 电脑与电信, 2021, 1(7): 12-16.
[6] 葛晓燕. 数据挖掘课程混合式教学改革探索[J]. 电脑与电信, 2021, 1(6): 43-46.
[7] 杜振鑫.
数据挖掘课程中过程生成式启发教学研究
[J]. 电脑与电信, 2021, 1(12): 47-49.
[8] 郁 烨.
交通管理工程专业核心课程成绩数据挖掘
[J]. 电脑与电信, 2021, 1(12): 62-65.
[9] 龚建锋.
基于数据挖掘的云安全评估模型研究
[J]. 电脑与电信, 2021, 1(11): 95-.
[10] 赵宇阔. 通讯痕迹与情报分析系统的设计方法[J]. 电脑与电信, 2018, 1(9): 52-53.
[11] 汪一百. 基于Hadoop 平台的聚类K-means算法的研究[J]. 电脑与电信, 2018, 1(4): 18-20.
[12] 张志文, 何明昌, 杨维伟, 刘仁笑, 王瑜, 胡学友. 校园知识技能变现系统设计与实现[J]. 电脑与电信, 2018, 1(4): 27-30.
[13] 魏爽. 一种文本聚类的增强数据挖掘方法[J]. 电脑与电信, 2018, 1(3): 46-48.
[14] 潘正勇. 基于大数据的水土保持监测站自动数据采集系统设计与应用[J]. 电脑与电信, 2018, 1(1-2): 64-66.
[15] 姜美. 基于隐私保护的数据挖掘综述[J]. 电脑与电信, 2017, 1(8): 31-.
No Suggested Reading articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
  Copyright © 电脑与电信 All Rights Reserved.
地址:广州市连新路171号广东国际科技中心 邮编:510033
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn
粤ICP备05080322号-4