博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
wordcloud—词云的表示方法
阅读量:5149 次
发布时间:2019-06-13

本文共 1135 字,大约阅读时间需要 3 分钟。

import jieba import wordcloud def shuchu():     txt=open('threekingdoms.txt','r',encoding='gb18030').read()     excludes={'将军','却说','荆州','二人','不可','不能','如此'}     words=jieba.lcut(txt)     counts={}     for word in words:         if len(word)==1:             continue         elif word=='诸葛亮' or word=='孔明曰':             rword='孔明'         elif word=='关公' or word=='云长':             rword='关羽'         elif word=='玄德' or word=='玄德曰':             rword='刘备'         elif word=='孟德' or word=='丞相':             rword='曹操'         else:             rword=word         counts[rword]=counts.get(rword,0)+1     for word in excludes:         del counts[word]     items = list(counts.items())     items.sort(key=lambda x:x[1],reverse=True)     for i in range(10):         word,count=items[i]         print('{0:<10}{1:>5}'.format(word,count)) shuchu() f=open('threekingdoms.txt','r',encoding='gb18030') t=f.read() f.close() ls=jieba.lcut(t) txt=' '.join(ls) w=wordcloud.WordCloud(font_path='msyh.ttc',width=1000,height=700,background_color='white',) w.generate(txt) w.to_file('grwordcloud.png')

 

转载于:https://www.cnblogs.com/Aluosen/p/11503937.html

你可能感兴趣的文章
【OpenJ_Bailian - 2287】Tian Ji -- The Horse Racing (贪心)
查看>>
循环引用 。 @class
查看>>
rabbitmq
查看>>
Java网络编程--socket服务器端与客户端讲解
查看>>
Git 中README.md中MarkDown语法示例
查看>>
Android实现双进程守护
查看>>
IPC,Hz(Hertz) and Clock Speed
查看>>
C++ Primer 第二章 学习笔记
查看>>
List_统计输入数值的各种值
查看>>
Cocos2d-x 的“HelloWorld” 深入分析
查看>>
别让青春再浪费_个人经历
查看>>
POJ2566-Bound Found (尺取法)
查看>>
学习笔记-KMP算法
查看>>
学习笔记--树链剖分
查看>>
设计模式《JAVA与模式》之访问者模式
查看>>
Timer-triggered memory-to-memory DMA transfer demonstrator
查看>>
《架构之美》阅读笔记六
查看>>
boa web服务器
查看>>
将博客搬至CSDN
查看>>
AngularJS ng-model在ng-if里面无效
查看>>