プログラミングで暮らしをハック
ITで暮らしを便利にするブログ
作ったアプリ紹介

Python「ワードクラウド」で遊んでみた【人口の多い国TOP15】

pythonのライブラリ「ワードクラウド」で遊んでみたのでご紹介します!

 

ワードクラウドとは

ワードクラウドについて簡単に説明します!

ワードクラウドは、Pythonのライブラリのひとつで、下のような画像を出力するライブラリです。

 

これは、アイドルグループ嵐の楽曲に使われている歌詞を分析した画像です。

「どんな言葉が多く使われているか?」

「多く使われているいる言葉を、より大きな文字にして表示する」

というライブラリです。

 

つまり、ワードクラウドでできることとは

  1. 文章データを入力すると、、
  2. 出現頻度の多い文字を判定して、大きな文字にして、画像化する

のように使えるライブラリです。

 

 

ワードクラウドで遊んでみた

ではさっそく、ワードクラウドで遊んでみましょう!

世界の人口が多い国を知りたくて。

「人口の多い国TOP15」を作成してみました。

完成した画像がこちらです。

意外な結果にテンションが上がってしまいました。

インドネシアとパキスタンの人口が多いことが意外でした。

 

 

ワードクラウドにできること

ワードクラウドで出力する画像には各種の設定ができます。

たとえば、以下のようなことができます。

  • 文字のフォントを変更する
  • 文字の色を変える
  • 文字の並び方を変える(縦並びか横並びか混合か)
  • 背景色を変える
  • 画像のサイズを変える

 

 

サンプルコードをご紹介

作ったプログラムを載せておきます!

駆け出しエンジニアの皆さんコピペして遊んでみてください!

 

入力データは、人口の多い順に並べて配列aに入れます!

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 世界の人口ランキング15
a = ['中国','インド','アメリカ','インドネシア','パキスタン','ブラジル','ナイジェリア','バングラデシュ','ロシア','メキシコ', '日本', 'エチオピア', 'フィリピン','エジプト', 'ベトナム']

count = len(a)

b = []
text= ''

for num in range(len(a)):
    b = (a[num]+' ') * count
    text = text + b
    count = count - 1

#日本語に対応しているフォントを指定する、背景色を指定、重複を防ぐ、縦文字をやめる
word_cloud = WordCloud(font_path="/System/Library/Fonts/ヒラギノ丸ゴ ProN W4.ttc", collocations=False, prefer_horizontal=1)
word_cloud.generate(text)

#表示する
plt.figure(figsize=(10,8)) #画像のサイズを変える
plt.imshow(word_cloud)
plt.axis("off") #目盛りを消す
plt.show()

 

 

参考サイト

コードを作る上で参考にさせてもらったサイトを紹介します!

 

記事を読んでくださりありがとうございました。

当サイトは「好きなんだから、日曜エンジニアでもいいじゃない」をテーマにしたエンジニアの交流サイトです。

非IT企業の私ですが、Webが好きで「ITエンジニアと繋がりたい」という思いからブログをはじめました。

この記事が参考になった、おもしろかったという方は、広告をクリックしていただけると励みになります。

これからもよろしくお願い致します。