WordCloud词云的简单使用

# -*- coding:utf-8 -*-

import jieba  #分词
from matplotlib import pyplot as plt  #绘图,数据可视化
from wordcloud import WordCloud  #词云
from PIL import Image   #图片处理
import numpy as np  #矩阵运算
import mysql.connector   #数据库



#调取数据库数据
mydb = mysql.connector.connect(host="127.0.0.1", user="root", passwd="", database="python_db")
mycursor = mydb.cursor()

sql = "select inq from test2"
mycursor.execute(sql)
myresult = mycursor.fetchall()
text = ""
for item in myresult:
    #print(item[0])
    text = text + item[0]

#print(text)
mycursor.close()
mydb.close()

#分词
cut = jieba.cut(text)
strings = ' '.join(cut)
#print(strings)
img  = Image.open('11.jpg')
img_array = np.array(img)
wc = WordCloud(
    background_color='white',
    mask=img_array,
    font_path="msyh.ttf"
)
wc.generate_from_text(strings)


#绘制图片
fig = plt.figure(1)
plt.imshow(wc)
plt.axis('off')
#plt.show()

plt.savefig('word.jpg')

原图如下:

结果图如下:

补充内容:

Wordcloud词云包的下载地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

注意事项:

在使用pycharm编写程序并安装wordcloud时,或许显示安装成功,但调用后图片生成总是失败,可以在上方链接地址下重新下载安装,切记下载与Python同版本的词云包。

比如Python3.8版本32位,Wordcloud就需要是:

pip install wordcloud‑1.8.1‑cp38‑cp38‑win32.whl