投稿指南
一、本刊要求作者有严谨的学风和朴实的文风,提倡互相尊重和自由讨论。凡采用他人学说,必须加注说明。 二、不要超过10000字为宜,精粹的短篇,尤为欢迎。 三、请作者将稿件(用WORD格式)发送到下面给出的征文信箱中。 四、凡来稿请作者自留底稿,恕不退稿。 五、为规范排版,请作者在上传修改稿时严格按以下要求: 1.论文要求有题名、摘要、关键词、作者姓名、作者工作单位(名称,省市邮编)等内容一份。 2.基金项目和作者简介按下列格式: 基金项目:项目名称(编号) 作者简介:姓名(出生年-),性别,民族(汉族可省略),籍贯,职称,学位,研究方向。 3.文章一般有引言部分和正文部分,正文部分用阿拉伯数字分级编号法,一般用两级。插图下方应注明图序和图名。表格应采用三线表,表格上方应注明表序和表名。 4.参考文献列出的一般应限于作者直接阅读过的、最主要的、发表在正式出版物上的文献。其他相关注释可用脚注在当页标注。参考文献的著录应执行国家标准GB7714-87的规定,采用顺序编码制。

基于改进的算法的新闻聚类的研究(3)

来源:新闻大学 【在线投稿】 栏目:期刊导读 时间:2021-04-30
作者:网站采编
关键词:
摘要:综上所述,本文的方法在一定程度上降低了传统k-means算法对初始值的依赖,降低了算法的不稳定性,有效提高了算法聚类结果的准确率。 4 结论 k-means 聚

综上所述,本文的方法在一定程度上降低了传统k-means算法对初始值的依赖,降低了算法的不稳定性,有效提高了算法聚类结果的准确率。

4 结论

k-means 聚类算法作为基于划分聚类算法的一个典型算法,在数据挖掘中被广泛应用,经常被用来作为预处理步骤。本文使用基于k-means 算法的方法对新闻数据集进行聚类分析,以找到数据集中包含的新闻类别与主题。对新闻数据集进行分词、去除停用词预处理后,先使用k-means 算法对新闻数据集进行多次聚类,然后使用分级聚类算法对运行k-means算法得到的多个结果进行融合,克服k-means算法因初始聚类中心的选择而导致的局部最优。实验证明本文的方法对聚类结果的准确率有较大提高。

[1] 黄文成.结合膜计算与人工蜂群算法的K 均值算法[J].现代计算机,2019:39-44.

[2] 王雷, 刘小芳, 赵良军.基于ARIA的K均值聚类算法研究[J].四川理工学院学报:自然科学版,2019,32(2):65-70.

[3] 汪晶,邹学玉,喻维明,等.分布式MVC-Kmeans算法设计与实现[J].长江大学学报:自然科学版,2019,16(6):113-119.

[4] 方利梅,王柳婧,徐元根.基于K均值聚类和改进遗传算法的制丝工艺研究[J].安徽农业科学,2019,47(12):191-196.

[5] 钟熙,孙祥娥.基于Kmeans++聚类的朴素贝叶斯集成方法研究[J].计算机科学,2019,46(6A):439-451.

[6] 李咏豪.基于改进K 均值聚类算法的燃气泄露检测研究[J].软件,2019,40(5):86-89.

[7] 刘佳鸣,况立群,尹洪红,等.灰狼优化的k均值聚类算法[J].中国科技论文,2019,14:1-6.

[8] 代翔,黄细凤,唐瑞,等.基于层次聚类的子话题检测算法[J].华南理工大学学报:自然科学版,2019,47(8):84-95.

[9] 张振宇,林杰,苗润生.犹豫模糊语言凝聚式层次聚类算法与应用[J].统计与决策,2019,21:71-74.

[10] 张雨金,杨凌帆,葛双冶,等.基于Kmeans-SVM 的短期光伏发电功率预测[J].电力系统保护与控制,2018,46(21):118-124.

[11] Shizeng Lu,Hongliang Yu,Xiaohong Wang,et of the 37th Chinese Control Conference[C].Wuhan:2018.

文章来源:《新闻大学》 网址: http://www.xwdxzz.cn/qikandaodu/2021/0430/1399.html



上一篇:基于技术的新闻信息聚类与热点研究
下一篇:技术的媒体适应性分析

新闻大学投稿 | 新闻大学编辑部| 新闻大学版面费 | 新闻大学论文发表 | 新闻大学最新目录
Copyright © 2018 《新闻大学》杂志社 版权所有
投稿电话: 投稿邮箱: