Python 绘制悼念的词云蜡烛

谨以此文悼念伟大的李文亮医生。

《有的人》— 臧克家
有的人活着,他已经死了。
有的人死了,他还活着。
有的人,骑在人民头上:“啊,我多伟大!”。
有的人,俯下身子给人民当牛马。
有的人,把名字刻入石头,想“不朽”。
有的人,情愿作野草,等着地下的火烧。
有的人,他活着别人就不能活。
有的人,他活着为了多数人更好地活。
骑在人民头上的,
人民把他摔垮。
给人民作牛马的,
人民永远记住他!
把名字刻入石头的,
名字比尸首烂得更早;
只要春风吹到的地方,
到处是青青的野草。
他活着别人就不能活的人,
他的下场可以看到;
他活着为了多数人更好地活着的人,
群众把他抬举得很高,很高。

无奈才学疏浅,无法用更多的语言描述我对他的敬意。但是作为程序员,我也有我的悼念方式:用代码绘制词云组成的蜡烛用以悼念。

1.准备

基于Python,绘制悼念的词云蜡烛我们需要用到的包有:

  • pip install matplot
  • pip install scipy==1.2.1
  • pip install wordcloud
  • pip install jieba
  • pip install codecs
  • pip install pandas
  • pip install numpy

打开CMD/Terminal 输入以上命令即可安装。如果你还没有安装Python,可以阅读此篇文章:超详细Python安装指南

然后需要找到生成词云的文本和相关图片,这里我用的是BBC的一篇报道,还有这张蜡烛图片:

来源:图品汇

2.编写代码

整体代码如下,我编写了非常详细的注释,大家不懂得可以根据注释的提示进行查询和学习。

# coding:utf-8
import jieba
import numpy
import codecs
import pandas
import matplotlib.pyplot as plt
from scipy.misc import imread
import matplotlib.pyplot as plt
from wordcloud import WordCloud, ImageColorGenerator
from wordcloud import WordCloud
  
def load_file_segment():
    # 加载我们自己的词典
    jieba.load_userdict("mywords.txt")
    # 读取文本文件并分词
    f = codecs.open(u"text.txt",'r',encoding='utf-8')
    # 打开文件
    content = f.read()
    # 读取文件到content中
    f.close()
    # 关闭文件
    segment=[]
    # 保存分词结果
    segs=jieba.cut(content) 
    # 对整体进行分词
    for seg in segs:
        if len(seg) > 1 and seg != '\r\n':
            # 如果说分词得到的结果非单字,且不是换行符,则加入到数组中
            segment.append(seg)
    return segment
 
def get_words_count_dict():
    segment = load_file_segment()
    # 获得分词结果
    df = pandas.DataFrame({'segment':segment})
    # 将分词数组转化为pandas数据结构
    words_count = df.groupby(by=['segment'])['segment'].agg({"计数":numpy.size})
    # 按词分组,计算每个词的个数
    words_count = words_count.reset_index().sort_values(by="计数",ascending=False)
    # reset_index是为了保留segment字段,排序,数字大的在前面
    return words_count
 
words_count = get_words_count_dict()
# 获得词语和频数

bimg = imread('candle.jpeg')
# 读取我们想要生成词云的模板图片
wordcloud = WordCloud(background_color='white', mask=bimg, font_path='simsun.ttc')
# 获得词云对象,设定词云背景颜色及其图片和字体
 
# 如果你的背景色是透明的,请用这两条语句替换上面两条 
# bimg = imread(candle.jpeg')
# wordcloud = WordCloud(background_color=None, mode='RGBA', mask=bimg, font_path='simhei.ttc')
 

words = words_count.set_index("segment").to_dict()
# 将词语和频率转为字典
wordcloud = wordcloud.fit_words(words["计数"])
# 将词语及频率映射到词云对象上
bimgColors = ImageColorGenerator(bimg)
# 生成颜色
plt.axis("off")
# 关闭坐标轴
plt.imshow(wordcloud.recolor(color_func=bimgColors))
# 绘色
plt.show()

其中candle.jpeg是位于当前文件夹的蜡烛文件,simhei.ttc是位于当前文件夹的字体文件,mywords.txt是我自己生成的词表,text.txt便是用于生成词云的文本。

以上全部文件和源代码我都已上传到公众号后台,回复:悼念蜡烛 即可下载。

3.生成蜡烛词云

我将这份源代码命名为candle.py, 通过在命令行中运行:

python candle.py

即可获得该蜡烛词云

中华民族需要永远记住李文亮医生。


​Python实用宝典 (pythondict.com)
不只是一个宝典
欢迎关注公众号:Python实用宝典

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注