学科NEWS・BLOG

文学作品を使ってワードクラウドに挑戦! 〜今年も力作揃いです〜

2025-01-26
学科のまなび
BLOG

毎年恒例になった「AIとデータサイエンス入門」の授業の文学作品を使ってワードクラウドに挑戦!

第12回の授業は「データの可視化(データビジュアライゼーション)」がテーマです。データの可視化といえば、棒グラフや折れ線グラフが代表例ですが、近年では、地図を使った手法やテキストの可視化等さまざまな可視化の手法があります。授業では、これらの手法を学ぶとともに

データの可視化は

  • データの内容に興味を持ってもらえる
  • データをわかりやすく伝える

というプラスの効果がある一方で、

  • 過剰な装飾やデザインでグラフを加工することでデータの中身を歪められ伝わってしまう
  • グラフによってデータ内容の印象操作ができる

という可視化の功罪についても学びます。

さて、実習で用いるワードクラウドは、テキストの中に含まれている単語の出現回数によって、単語の大きさを変えることで、テキストにどんな単語が多く含まれているかを一目で知ることができる、大変シンプルで強力なテキストの可視化方法です。Wolfram言語を使うと、簡単にワードクラウドを作ることができるだけなく、さらに、プログラムコードを少し工夫するだけで、形を変えたり、色合いを調整したりすることもできます。

授業では、学生自らが、文学作品のテキストデータによるワードクラウドを、自らのアイデアでデザインすることで、データの見え方、グラフが与える印象がどのように変わるかを体験することとができます。さらに、自ら作ったワードクラウドを分析することで、テキストの特徴を見つけ、その小説の新たな事実を発見することができます。

ワードクラウド発表の様子

それでは、今年も素晴らしい学生の作品を紹介しましょう。(昨年の作品はこちらからご覧いただけます。)

文学作品のワードクラウド

何の文学作品かわかりますか?

上段左から、「若草物語」「グスコーブドリの伝記」「吾輩は猫である」「みだれ髪」

下段左から、「みにくいあひるのこ」「吾輩は猫である」「銀河鉄道の夜」「源氏物語(桐壺)」

同じ作品でも学生のイメージは様々です。学生の皆さんお疲れ様でした。