博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【词云】代码
阅读量:6614 次
发布时间:2019-06-24

本文共 1179 字,大约阅读时间需要 3 分钟。

1 import sys 2 reload(sys) 3 sys.setdefaultencoding('utf-8') 4  5 from os import path 6 from PIL import Image 7 import numpy as np 8 import matplotlib.pyplot as plt 9 10 from wordcloud import WordCloud11 import jieba12 d = path.dirname(__file__)13 14 stopWordFile = u'stopwords.txt'15 stopWordList = []16 for L in open(path.join(d , stopWordFile)).readlines():17     stopWordList.append(L.strip().decode('utf-8'))18 stopWordList = set(stopWordList)19 20 new = 'words.txt'21 22 text = open(path.join( d , new )).read().strip('\r')23 wordDict = {}24 for w in jieba.cut(text):25     if w not in stopWordList:26         wordDict.setdefault(w , 0)27         wordDict[w] += 128     29 maskImg = 'china.jpeg'30 alice_mask = np.array( Image.open(path.join(d , maskImg)))31 32 wc = WordCloud(background_color = 'white', max_words = 2000 , mask = alice_mask ,33                font_path = path.join(d , 'msyh.ttf'))34 wc.generate_from_frequencies(wordDict)35 36 wc.to_file(path.join(d, "example.png"))37 38 # show39 plt.imshow(wc, interpolation='bilinear')40 plt.axis("off")41 plt.figure()42 plt.imshow(alice_mask, cmap=plt.cm.gray, interpolation='bilinear')43 plt.axis("off")44 plt.show()

 

转载地址:http://jweso.baihongyu.com/

你可能感兴趣的文章
Tomcat配置日志生产功能
查看>>
js的自执行函数
查看>>
移植Qt与Tslib到X210开发板的体会
查看>>
Nginx + webpy 和FastCGI搭建webpy环境
查看>>
new static 跟 new self 区别
查看>>
使用JdbcTemplate过程中使用到多个参数和like模糊
查看>>
解决eclipse中无法删除Tomcat服务器中的项目,报maven is required and cannot be removed from the server错误情况...
查看>>
修改页面JS 360浏览器
查看>>
尚学linux课程---3、linux网络说明
查看>>
Git 跟 GitHub 是什么关系?
查看>>
String.split()方法
查看>>
IE6下jQuery选中select的BUG
查看>>
Tensorflow在win10下的安装(CPU版本)
查看>>
嵌入式平台做深度学习算法,不可不重视的4件事
查看>>
一次优化记录
查看>>
如何调用一个数据完整的firefox浏览器
查看>>
cgroup代码浅析(2)
查看>>
会计的思考(42):会计如何转变为公司的内部财务顾问
查看>>
利用钥匙串,在应用里保存用户密码的方法
查看>>
final,finally和finalize之间的区别
查看>>