中教数据库 > 贵州科学 > 文章详情

基于关键句的K-means算法在热点发现领域的研究与应用

更新时间:2023-08-14

【摘要】由于"互联网+"提出的,网络信息呈现爆炸的趋势。面对海量数据如何准确找到热点事件成了网民关注的话题。文章从实际应用出发,首先对每一篇文本选取5句话作为该文本关键句,然后用TF-IDF计算特征词值,特征向量选择时不考虑单个字的权重,再用K-means算法进行聚类。以新浪新闻为例,将环境、住房和违法三类话题共322篇文本作为测试语料进行聚类,聚类准备率达到70%以上,说明选取关键句比将整个文本作为聚类对象的聚类效果好。

【关键词】

18 2页 免费

发表评论

登录后发表评论 (已发布 0条)

点亮你的头像 秀出你的观点

0/500
以上留言仅代表用户个人观点,不代表中教立场
相关文献

推荐期刊

Copyright © 2013-2016 ZJHJ Corporation,All Rights Reserved

京ICP备2021021570号-13

京公网安备 11011102000866号