威斯尼斯人娱乐官方网站登录
Mou Mou Jidian Generator
发电机维修 发电机回收
发电机出售 发电机租赁
客户统一服务热线

047-74308488
12992334529

4发电机出租
您的位置: 主页 > 产品中心 > 发电机出租 >
威斯尼斯人娱乐官方网站登录:在Python中建立文字云或标签云

威斯尼斯人娱乐官方网站登录:在Python中建立文字云或标签云

本文摘要:先容从开始从事数据可视化事情的那一天起,我就爱上它了。我总是喜欢从数据中获得有用的看法。 在此之前,我只相识基本图表,例如条形图,散点图,直方图等,这些基本图表内置在tableau中,而Power BI则用于数据可视化。通过天天完成此任务,我遇到了许多新图表,例如径向仪表盘,华夫图等。因此,出于好奇,最近我正在搜索数据可视化中使用的所有图表类型,这些词云引起了我的注意,我发现它很是有趣。

威斯尼斯人娱乐官方网站登录

先容从开始从事数据可视化事情的那一天起,我就爱上它了。我总是喜欢从数据中获得有用的看法。

在此之前,我只相识基本图表,例如条形图,散点图,直方图等,这些基本图表内置在tableau中,而Power BI则用于数据可视化。通过天天完成此任务,我遇到了许多新图表,例如径向仪表盘,华夫图等。因此,出于好奇,最近我正在搜索数据可视化中使用的所有图表类型,这些词云引起了我的注意,我发现它很是有趣。

直到现在,看到这个词云图像迫使我认为这些只是随机排列的图像,这些单词是随机排列的,可是我错了,而且一切都从这里开始。之后,我实验使用Tableau和Power BI中的少量数据制作词云。

威斯尼斯人娱乐官方网站登录

在乐成实验之后,我想通过编写条形图,饼图和其他图表的代码来实验使用它。词云是什么?界说:词云是一个简朴但功效强大的可视化表现工具,用于文本处置惩罚,它以更大,更粗的字母和差别的颜色显示最常用的词。单词的巨细越小,重要性就越小。

标签云的用途1)社交媒体上的热门标签(Instagram,Twitter): 全世界,社交媒体都在寻找最新更新的趋势,因此,我们可以获取人们在其帖子中使用最多的标签。2)媒体中的热门话题: 分析新闻报道,我们可以在头条新闻中找到关键字,并提取出前n个需求较高的主题,并获得所需的效果,即前n个热门媒体主题。3)电子商务中的搜索词: 在电子商务购物网站中,网站所有者可以制作被搜索次数最多的购物商品的词云。这样,他就可以相识在特定时期内哪些商品需求量很大。

让我们开始在python中编码以实现这种词云首先,我们需要在jupyter notebook中安装所有库。在python中,我们将安装一个内置库wordcloud。在Anaconda下令提示符下,输入以下代码:pip install wordcloud如果你的anaconda情况支持conda,请输入:conda install wordcloud虽然,这可以直接在notebook自己中实现,只需在代码的开头添加“!”即可。像这样:!pip install wordcloud现在,在这里,我将生成拥有任何主题的维基百科文本的词云。

因此,我将需要一个Wikipedia库来会见Wikipedia API,可以通过在anaconda下令提示符下安装Wikipedia来完成,如下所示:pip install wikipedia现在我们还需要其他一些库,它们是numpy,matplotlib和pandas。停止现在,我们需要的库就安装好了import wikipediaresult= wikipedia.page("MachineLearning")final_result = result.contentprint(final_result)机械学习维基百科页面的输出:上图是我们通过检索Wikipedia的机械学习页面获得的输出的图像。在那里,我们还可以看到它可以向下转动,这表现将检索整个页面。

在这里,我们还可以通过摘要方法获得页面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)print(result)这里我们有句子的参数,因此我们可以用它来检索特定的行数。输出5个句子让我们一起建立wordcloudfrom wordcloud import WordCloud, StopWordsimport matplotlib.pyplot as plt def plot_cloud(wordcloud): plt.figure(figsize=(10, 10)) plt.imshow(wordcloud) plt.axis("off");wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)plot_cloud(wordcloud)停用词是没有任何寄义的单词,例如‘is’, ‘are’, ‘an’, ‘I’ 等。Wordcloud带有内置停用词库,该库将自动从文本中删除停用词。有趣的是,我们可以通过stopwords.add()函数在python中添加停用词的选择。

Wordcloud方法将设置宽度和高度,我将它们都设置为500,配景色设置为粉红色。如果不添加随机状态,则每次运行代码时,词云都市看起来差别。应该将其设置为任何int值。

从上面的代码中,我们将获得这样的词云:通过检察上图,我们可以看到机械学习是最常用的词,另有一些其他经常使用的词是模型,任务,训练和数据。因此,我们可以得出结论,机械学习是训练数据模型的任务。我们还可以在这里通过配景颜色方法更改配景颜色,并通过colormap方法更改字体颜色,还可以在配景颜色中添加颜色的哈希码,可是mapcolor带有内置的特定颜色。让我们通过使用哈希码将配景色更改为蓝绿色,将字体颜色更改为蓝色:from wordcloud import WordCloud, StopWordsimport matplotlib.pyplot as pltdef plot_cloud(wordcloud): plt.figure(figsize=(10, 10)) plt.imshow(wordcloud) plt.axis("off");wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)plot_cloud(wordcloud)在这里,我指定了ocean,如果我添加了一些错误的颜色图,jupyter将抛出一个值错误,并向我显示颜色图的可用选项,如下所示:还可以使用PIL库在任何图像中实现词云。

威斯尼斯人娱乐官方网站登录

尾注在本文中,我们讨论了词云,词云的界说,应用领域以及使用jupyter notebook的python示例。


本文关键词:威斯,尼,斯人,威斯尼斯人娱乐官方网站登录,娱乐,官方网站,登录,在,Python,中

本文来源:威斯尼斯人娱乐官方网站登录-www.bj-bcm.com

Copyright © 2005-2022 www.bj-bcm.com. 威斯尼斯人娱乐官方网站登录科技 版权所有  ICP备案:ICP备90144662号-6