ITPub博客

首页 > 人工智能 > 人工智能 > 人工智能-python 生成词云(词频统计)图

人工智能-python 生成词云(词频统计)图

原创 人工智能 作者:xiaomajia 时间:2020-05-21 11:50:21 0 删除 编辑

生成的词云图,如下:

安装wordcloud,jieba,其他包自行安装:

conda install -c conda-forge wordcloud

conda install -c conda-forge jieba

注:conda-forge是github的一个组织,提供了conda recipes库,就是一份相互关联的可打包在一起的东西。具体使用方法如上,首先加上conda-forge,然后安装所需要的工具包。这是最推荐的安装包的方式,因为是社团首选的一个可以使用的包,版本关联性等都是经过测试的。


代码示例如下:

1. 导入使用的库, 每个库的作用具体参见注释。

2. 读取要分析的文件,并对文本进行预处理

注:在打开文件文件时遇到一个错误,如下,注意open的写法。

打开文件的时候就指定编码的类型,就可以避免出现类似的错误,如下。

fn=open('ana_test.txt',encoding='utf-8')


3. 文本分词,结果放到object_list 使用了用户定义字典。

4. 词频统计,获取前20最高频词,并输出

5.  词频 显示,图像可以设置成自己喜欢的样式。

6. 词云图像显示:参见注释步骤,从字典生成词云(词频统计), 从背景图建立颜色方案,并将词云颜色设置为背景图方案,显示出词云图像。

7. 输出结果图,如下:



来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/61939/viewspace-2693463/,如需转载,请注明出处,否则将追究法律责任。

全部评论
从事信息化工作20年,记录生活和工作中的思考和实践,希望能够给您带来一点点的价值。微信公众号:guszhang02

注册时间:2020-03-28

  • 博文量
    28
  • 访问量
    9926