DATE: 2018-01-27 20:46:35
本文参考链接: https://zhuanlan.zhihu.com/p/20432734 https://www.cnblogs.com/Yiutto/p/5998262.html 细节参考官方手册稍作调整,Python官方链接 https://pypi.python.org/pypi/jieba/ https://pypi.python.org/pypi/pytagcloud/
我的开发环境 Windows7 Python2.7.11
pip install -U pytagcloud
pip install pygame
注:会因网络问题失败,多试几次总会有一次安装成功的。
pip install simplejson
官网测试代码
vim test.py
from pytagcloud import create_tag_image, make_tags
from pytagcloud.lang.counter import get_tag_counts
YOUR_TEXT = "A tag cloud is a visual representation for text data, typically\
used to depict keyword metadata on websites, or to visualize free form text."
tags = make_tags(get_tag_counts(YOUR_TEXT), maxsize=120)
create_tag_image(tags, 'cloud_large.png', size=(900, 600), fontname='Lobster')
测试代码生成结果
python test.py
生成图片cloud_large.png
,如下图
pip install jieba
官网测试代码
# encoding=utf-8
import jieba
seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
print("Full Mode: " + "/ ".join(seg_list)) # 全模式
seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
print("Default Mode: " + "/ ".join(seg_list)) # 精确模式
seg_list = jieba.cut("他来到了网易杭研大厦") # 默认是精确模式
print(", ".join(seg_list))
seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造") # 搜索引擎模式
print(", ".join(seg_list))
测试结果
执行 python test_cutCN.py
,结果如下:
至此,中文分词生成标签云的环境搭建完成。