新着情報

news

テキスト マイニング

2022.06.08
魚津駅前校滑川駅前校

今回は、魚津事務局の宮井先生が『魚津事務局だより2022年6月号』の中で、最近注目されている「テキストマイニング」について書かれましたので、ご紹介したいと思います。本編にあるように様々な情報分析、傾向分析、それを使った営業活動だけでなく、物事を連想し紐付けながら、まとめていくことは勉強の仕方や暗記にも役立ちそうです。皆さん、ぜひお読みください。(倉元)

~テキストマイニング~

最近、ニュース番組やネット上で、下のような画像をご覧になったことはないでしょうか。この画像を見たことで、私は初めて「テキストマイニング=text mining」という言葉を知りました。ウィキペディアによる定義では、「通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である。」とあります。

下図は、ある日のNHKのニュース番組『あさイチ』での、字幕データから単語を取り出したものと思われます。中央に大きく「お芝居」とあり、周囲に多くの単語が散りばめられています。ここから私に読み取れるのは、「川端康成原作の『雪国』がドラマ化された。島村役が高橋一生、駒子役は奈緒である。」ということです。本来はフルネームでなければ人物は特定できないのですが、次のように私は推定しました。

『あさイチ』であるのは「華丸大吉」から気づきました。川端康成の『雪国』である理由は、「島村」と「駒子」が決め手でした。男優さんが特定できた理由は、同じ「高橋」さんでも、「高橋英樹」さんのたくましい印象ではなく、「高橋一生」さんのやさ男の印象が「島村」に合うだろうということ。女優さんについては、下の名前だけで活動される方が最近多いので、ピンと来ました。名前がポツンと出ているだけでは、当然特定することは難しいですが、他の名前や事柄とのつながりで推定できます。つまりひとつの事柄・名前だけでは「情報」にはならず、ふたつ以上のものの関わりの中で、生き生きとして有意義な「情報」になることが分かります。

 

次のものは、ある教養番組からのテキストマイニングだということです。そもそも私がテキストマイニングを話題にしたのは、これらの図が私たちの記憶のモデルのように思えたからです。私たちの頭の中に、教科書の説明文がそのまま格納されているとは考えにくく、おそらく「後鳥羽上皇」を話題の中心に据えれば、このような人名・事柄の群れが周辺に漂ってくるのでしょう。その中からいくつか選んで、つなげて文を作ってみる……すると、その文に使ったある事柄・人名はより精彩のある情報として、強化された記憶となり、よみがえりやすくなってくるはずです。ぜひ、お試しください!

魚津事務局 教師 宮井 徹(指導歴14年 小中学・5教科、高校・国語、英語、倫理などを指導)

 

 


デジタルパンフレットはこちら


TOP