読み物化をする前に「テキストマイニング」
今日は令和元年9月8日。
昨晩、またいい番組を見ました。
8月22日放映の「偉人たちの健康診断
戦艦大和 男たちの“健康”」です。
この番組ついて調べていたら、面白いサイトに出合いました。
「テキストマイニング」は初めて聞く言葉。
Wikipediaには次のように書いてありました。
文字列を対象としたデータマイニングのことである。
通常の文章からなるデータを単語や文節で区切り、
それらの出現の頻度や共出現の相関、出現傾向、
時系列などを解析することで有用な情報を取り出す、
テキストデータの分析方法である。
この説明だけではまだよくわかりません。
でも上のサイトをみると、わかるような気がします。
番組中のすべての言葉が聞き書きされています。
1時間番組の全てです。
人力で聞き書きをされたのか、
それとも機器を使っての聞き書きでしょうか。
見事な聞き書きです。
その聞き書きデータを使って、”テキストマイニング”され、
「ワードクラウド」という形で、結果が示されています。☟
こうやって、見える化するのが、”テキストマイニング”なのかなと
考えました。
番組を見た後だと、この「ワードクラウド」が
少し理解できます。
「乗組員」「健康」「食事」「カレー」などの大きな文字を見ると
この番組の大事なことを表現しているなと思います。
う~ん、”テキストマイニング”の勉強は、
いずれまたするとして、
このサイトの聞き書きを利用させてもらって、
読み物化をしようと思います。
次の記事から。
コメント