社会情報学環

文学作品でワードクラウド(今年も力作揃いです)

2024-01-31
学科のまなび

「AIとデータサイエンス入門」の授業の後半は、データの可視化の実習として、文学作品のテキストデータを用いて、ワードクラウドを作成します。

ワードクラウドとは、テキストデータの中の単語を出現頻度に合わせて大小をつけて視覚化する手法です。

通常のワードクラウドは四角や丸で作成しますが、Wolfarm言語では、様々な形を使ったワードクラウドを作成することができます。学生は、文学作品のイメージに合った形や色を使って、まるでアート作品のようなワードクラウドを作成してくれました。

先日の発表会では、なぜこの形を選んだのか?工夫した点や苦労した点はどこか?、何がわかったか等、各自の実習での学びとともに作品を発表してくれました。

作品紹介

では、作品を紹介しましょう。それぞれ何の小説(童話)かわかりますか?

左から順に「みにくいあひるのこ」「白雪姫」「吾輩は猫である」です。

「みにくいあひるのこ」は、白鳥の白を表現したくて「あひる」の形を白で表現したそうです。周りがカラフルなのは「あひる」が明るく生きてほしいという思いが込められているそうです。「白雪姫」と言えば「りんご」。真っ赤なりんごをイメージして赤を基調にしたそうです。「吾輩は猫である」は「猫」。しっぽの先まで小さな文字で表現されているのがわかります。

それぞれ、学生の作品に対する思いが伝わってきますね。

もっと作品の印象を全面に出した作品もありました。以下は、「人間失格」「ラプンツェル」です。それぞれ、黒をバックに作品の暗いイメージを表現しています。ラプンツェルは長年魔女に囚われてるイメージを色で表現しています。

さらに面白い試みも

これは何の文学作品かわかりますか?「源氏物語」です。以下のプログラムをみると、「源」であることがわかりますね。

「文学作品」の可視化にワードクラウドを使うことの意味

ワードクラウドは、データ可視化の一種であり「必要な情報を分かりやすく適切に伝えること」が最大の目的です。イメージをかたどったワードクラウドが分かりやすいかどうかは人によって判断が分かれるところですが、情報提供者が伝えたいイメージを色や形で表現することは、情報伝達の手段の一つであり、視覚的に訴える効果的な手法と言えます。

学生のワードクラウド作品は、その文学作品にどんな単語が沢山使われているかが一目でわかるだけでなく、学生自身のその文学作品に対する印象や感想が含まれています。それが読み取れるのも楽しいですね。

過去のブログサイトはこちら

Scroll up