« 落花生ではなくて枝豆でした | メイン | 「健康診断 戦艦大和」その1/大和以前は、狭くて暑かった »

2019年9月 8日 (日)

読み物化をする前に「テキストマイニング」

 

今日は令和元年9月8日。

 

昨晩、またいい番組を見ました。

8月22日放映の「偉人たちの健康診断 

戦艦大和 男たちの“健康”」です。

  

この番組ついて調べていたら、面白いサイトに出合いました。

電波ログテキストマイニング

 

「テキストマイニング」は初めて聞く言葉。

Wikipediaには次のように書いてありました。

  

文字列を対象としたデータマイニングのことである。

通常の文章からなるデータを単語や文節で区切り、

それらの出現の頻度や共出現の相関、出現傾向、

時系列などを解析することで有用な情報を取り出す、

テキストデータの分析方法である。

 

この説明だけではまだよくわかりません。

でも上のサイトをみると、わかるような気がします。

番組中のすべての言葉が聞き書きされています。

1時間番組の全てです。

人力で聞き書きをされたのか、

それとも機器を使っての聞き書きでしょうか。

見事な聞き書きです。

その聞き書きデータを使って、”テキストマイニング”され、

「ワードクラウド」という形で、結果が示されています。☟

Photo こうやって、見える化するのが、”テキストマイニング”なのかなと

考えました。

番組を見た後だと、この「ワードクラウド」が

少し理解できます。

「乗組員」「健康」「食事」「カレー」などの大きな文字を見ると

この番組の大事なことを表現しているなと思います。

  

う~ん、”テキストマイニング”の勉強は、

いずれまたするとして、

このサイトの聞き書きを利用させてもらって、

読み物化をしようと思います。

  

次の記事から。

 

コメント

コメントを投稿

最近の写真

  • Img_8523
  • Img_8520
  • Img_8519
  • Img_8518
  • Img_8522
  • Img_8521
  • Img_8517
  • Img_8512
  • Img_8510
  • Img_8508
  • Img_8507
  • Img_8504

楽餓鬼

今日はにゃんの日

いま ここ 浜松

がん治療で悩むあなたに贈る言葉