Please wait a minute...
 
主管单位:广东省科学技术厅
主办单位:广东省科技合作研究促进中心
编辑出版:《电脑与电信》编辑部
ISSN 1008-6609 CN 44-1606/TN
邮发代号:46-95
国内发行:广东省报刊发行局
《电脑与电信》唯一官方网站。
电脑与电信  2015, Vol. 1 Issue (3): 49-52    
  基金项目 本期目录 | 过刊浏览 | 高级检索 |
基于遗传算法及概率论的文本分类算法
宋倩1,王东明2
1.华东师范大学 2.成都理工大学
Text Classification Algorithm Based on Genetic Algorithm and Probability Theory
Song Qian1,Wang Dongming2
1.East China Normal University 2.Chengdu University of Technology
全文: PDF(0 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 本文意在提高文本分类的准确度和速度。利用tf 算法对特征项进行初步赋予权值,再使用屏蔽词对特殊非实 意词进行屏蔽。本文独创概率论分布法,使用L-E 算子进行加权,使得特殊位置与分布广泛的特征项,呈指数形式加权,较优 结果能更快收敛。本文利用遗传算法,采用交叉算子和变异算子,采用适宜的目标函数,加快了检索速度,并有更大概率得到 最优结果。采用混合算法,可以排除同义词和非特征项的干扰。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
宋倩王
东明
关键词 遗传算法文本分类特征项    
Abstract:This article aims to improve the accuracy and speed of text classification. T * f algorithm is used to initially weigh the feature item, then stop words is used to shield specially meaningless words. Original probability distribution method and weighted L - E operator enable the features in the special positions or widely distributed to weight in exponential form, so that the better results converge faster. In this paper, by using the genetic algorithm, crossover operator and mutation operator, and adopting appropriate objective function, the retrieval process speeds up, and has a greater probability to get the optimal result. Hybrid algorithm is proposed, which can eliminate the synonyms and the characteristics of interference.
Key wordsgenetic algorithm    text classification    term
年卷期日期: 2015-03-10      出版日期: 2017-11-08
:  TP301.6  
基金资助:大夏基金项目,项目编号:2013DX-241。
作者简介: 宋倩,女,四川南充人,学士,研究方向:电磁通讯。
引用本文:   
宋倩王, 东明. 基于遗传算法及概率论的文本分类算法[J]. 电脑与电信, 2015, 1(3): 49-52.
Song Qian, Wang Dongming. Text Classification Algorithm Based on Genetic Algorithm and Probability Theory. Computer & Telecommunication, 2015, 1(3): 49-52.
链接本文:  
https://www.computertelecom.com.cn/CN/  或          https://www.computertelecom.com.cn/CN/Y2015/V1/I3/49
[1] 刘星晨 袁一平. 基于改进的BP神经网络负荷预测[J]. 电脑与电信, 2024, 1(3): 68-.
[2] 刘逸琛.
基于变分自编码器的商品文本分类算法设计
[J]. 电脑与电信, 2022, 1(6): 37-.
[3] 李清旭 张琛 成雪.
基于特征融合的文本情感分类
[J]. 电脑与电信, 2022, 1(1-2): 1-6.
[4] 徐 红.
网络舆情演化模型研究
[J]. 电脑与电信, 2022, 1(12): 73-.
[5] 韩 菊.
基于遗传算法的机器人自定位、路径规划研究
[J]. 电脑与电信, 2022, 1(12): 77-.
[6] 刘良斌 刘德玉. 基于遗传算法的焊接机器人路径规划[J]. 电脑与电信, 2021, 1(5): 18-21.
[7] 王雯雯. 基于遗传算法考虑服务质量的服务组合方式的研究[J]. 电脑与电信, 2017, 1(8): 48-.
[8] 张辉, 李竹. 一种基于隔离自适应算子的遗传算法研究[J]. 电脑与电信, 2017, 1(1-2): 34-37.
[9] 王海波. 基于改进遗传算法的智能排课研究[J]. 电脑与电信, 2017, 1(12): 88-91.
[10] 金智. 基于遗传算法的网格任务调度方法分析[J]. 电脑与电信, 2017, 1(11): 9-11.
[11] 陈闽韬, 匡芳君. 数据挖掘技术在医疗大数据中的应用研究[J]. 电脑与电信, 2017, 1(11): 34-36.
[12] 刘燕. 基于三链混合遗传算法的WSNs 中 Sink节点布局优化[J]. 电脑与电信, 2016, 1(8): 13-15.
[13] 黄菊. 基于遗传算法的产品基因重组设计[J]. 电脑与电信, 2016, 1(12): 53-55.
[14] 刘燕, 杨冬涛. 基于三链混合遗传算法的贴片机贴装过程优化[J]. 电脑与电信, 2015, 1(6): 69-71.
[15] 张晓艳 华英 . 文本挖掘的方法及应用研究[J]. , 2011, 1(12): 0-0.
No Suggested Reading articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
  Copyright © 电脑与电信 All Rights Reserved.
地址:广州市连新路171号广东国际科技中心 邮编:510033
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn
粤ICP备05080322号-4