Python搭建环境实现中文分词标签云(官方手册稍作调整)

Python搭建环境实现中文分词标签云(官方手册稍作调整)


DATE: 2018-01-27 20:46:35

本文参考链接:
https://zhuanlan.zhihu.com/p/20432734
https://www.cnblogs.com/Yiutto/p/5998262.html
细节参考官方手册稍作调整,Python官方链接
https://pypi.python.org/pypi/jieba/
https://pypi.python.org/pypi/pytagcloud/

我的开发环境 Windows7 Python2.7.11

标签云环境搭建

pip install -U pytagcloud
pip install pygame

注:会因网络问题失败,多试几次总会有一次安装成功的。

pip install simplejson

官网测试代码

vim test.py
from pytagcloud import create_tag_image, make_tags
from pytagcloud.lang.counter import get_tag_counts

YOUR_TEXT = "A tag cloud is a visual representation for text data, typically\
used to depict keyword metadata on websites, or to visualize free form text."

tags = make_tags(get_tag_counts(YOUR_TEXT), maxsize=120)

create_tag_image(tags, 'cloud_large.png', size=(900, 600), fontname='Lobster')

测试代码生成结果

python test.py

生成图片cloud_large.png ,如下图
这里写图片描述

中文分词

pip install jieba

官网测试代码

# encoding=utf-8
import jieba

seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
print("Full Mode: " + "/ ".join(seg_list))  # 全模式

seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
print("Default Mode: " + "/ ".join(seg_list))  # 精确模式

seg_list = jieba.cut("他来到了网易杭研大厦")  # 默认是精确模式
print(", ".join(seg_list))

seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造")  # 搜索引擎模式
print(", ".join(seg_list))

测试结果
执行 python test_cutCN.py,结果如下:
这里写图片描述

至此,中文分词生成标签云的环境搭建完成。

版权声明

弈心博客


本文首发site_name,转载请附上博文链接!