AIテキストマイニングとは? ~実データを使って解説~

アンケートを行った際に、自由回答で回答を収集したものの、業務が多忙で時間がない、分析がよくわからない等の理由で、眠ったままになっているデータをお持ちの方は、少なからずいるのではないでしょうか。弊社にもそのようなお問い合わせを頂くこともあります。

最近、色々な場面でAIの活用を目にすることが増えてきましたが、マーケティングリサーチの場面においてもAIを活用したテキストマイニングが使われるようになってきました。

今回はAIテキストマイニングがどのようなものなのか、実際にデータを用いて解説していきたいと思います。

【実際に利用した調査概要】

弊社で定期的に実施している「メニューセンサス」で聴取している「キッチンに関する不満」の自由回答データを用いて、AIテキストマイニングを行いました。

<メニューセンサスの概要>
調査概要:食卓の日記調査
実際に食べたメニュー及びそのメニューに使用した材料等を聴取。また食生活に関する意識についても聴取。
手法:郵送調査
調査地域:首都圏30km圏内
対象者:夫婦二人以上の世帯の主婦(最新の国勢調査・既婚率から主婦年代別のサンプル数を割り付け)
サンプルサイズ:年齢20代-70代の1000世帯(4季節合計)
調査期間:夏/秋/冬/春の4季節、各35日間
     1世帯あたり2週間の連続日記(季節ごとにフレッシュサンプル)

※詳細内容はこちら

AIテキストマイニングについて

テキストマイニングとは?

AIテキストマイニングを解説する前に、そもそもテキストマイニングとはどのようなものなのかと言うと、テキストマイニング(text mining)を直訳するとテキストは文章、マイニングは採掘という意味です。つまり、文章情報を分析して有益な情報を掘り出すということになります。その目的は主に顧客が抱える課題点、ニーズ、インサイトなどを把握することです。

利用されている場面

テキストマイニングが以前からよく使われているのは、コールセンターのオペレータとのやり取りやクレームの記録の分析の場面です。そのほか、ホームページへの問い合わせ記録の分析がよく行われていますが、自社商品・サービスのSNSにおける書き込みや口コミの分析も行います。そして、私どもリサーチ会社でよく行っているのがアンケート調査のフリーアンサー(自由回答)の分析です。
また、最近では、音声データをテキスト化し分析するケースも増えているようです。

AIテキストマイニングの特長(メリット)

AIテキストマイニングでは、データを入力し、分析を行うと自動で種類(カテゴリー)分けされるため、どのような内容の回答が多いのかを瞬時に把握することができます。(csv形式などで保存されたデータが利用できるため、数万件のデータでも簡単に扱うことができます。)

つまり、労力の削減と精度の向上が最大のメリットだと言えます。また、使うツールにもよりますが、瞬時に可視化できることもメリットの一つです。

AIテキストマイニングの実際

利用したデータについて

・メニューセンサスの2017年-2018年及び2021年-2022年(夏~春)の2期分を集計し、それぞれの年度を比較
・データマイニングの対象件数(FA回答者数)は2017-2018年757件、2021年-2022年758件

コロナ禍以前とコロナ禍ではキッチンに関する不満の種類が異なるのではないか、という仮説のもと、『2017-2018年調査』と『2021-2022年調査』の結果を比較しました。

※今回はYOSHINA(株式会社レトリバ)を利用して分析

―「不満の内容」について、実際の回答例(抜粋) -

『収納に関すること』
-食器棚が狭い。広い収納庫がほしい。(50代)
-収納量が少なく、入りきらない。(食品、棚がない)。ホットプレート、土鍋、コーヒーメーカーが収納出来ない。(50代)
-調味料を収納出来るスペースがもっとほしい。(30代)
-家電や調理器具に対して収納がとても少なく、出して使うのが不便。(30代)

『スペースに関すること』
-狭い為食器洗い乾燥機などが置けない 調理をする場所が少ない。(50代)
-子どもと一緒に料理できる広さ、スペースが欲しい。(40代)
-料理を一時的に置く場所がなく作業スペースも狭いこと。(40代)

『ガスコンロ・IHについて』
-ガスコンロで料理しなれていた物がIHだと難しい。上手に行かない。(40代)
-IHにしたが、ガスの火力に劣るのが残念です。(40代)
-IHコンロが2つしかないからもう少し欲しい。(40代)

『調理台(シンク)について』
-古い家なのでキッチンが低い。背が高いので腰が痛くなる。作業スペースが狭い。(30代)
-キッチンの調理台の高さが低くて使いづらく、腰が痛くなる。切ったり、盛り付けたりといった作業をするためのスペースが足りず、いつも困る。(30代)
-調理台スペースがもう少し広いと使いやすいと思う。(50代)

『掃除・汚れについて』
-魚焼きグリルの掃除が大変。(50代)
-歳を重ねると高い収納戸棚はつらくなる。換気扇のそうじが苦になってきた。清掃が簡単に出来る設備にしたいが。(70代)
-ガスコンロ(古いタイプ)なので汚れた時の掃除が大変。シンプルなガスコンロにしたい。(40代)

「カテゴリー分けとその結果」について

『2017-2018年調査』と『2021-2022年調査』の合計したデータを投入すると、回答内容は自動分類されます。今回は8つの分類を採用しました。
分類数は自分で選択することができ、分類されたカテゴリーをまとめたり、その分類されたカテゴリーをさらに分類することもできます。

  1. 1.収納に関すること
  2. スペースについて(狭い)
  3. ガスコンロ・IHについて
  4. 調理台(シンク)について
  5. 掃除・汚れについて
  6. 食洗器・オーブン等について
  7. 対面式・アイランドキッチンについて
  8. リフォーム(古さ)について

次に、この分類をもとに『2017-2018年調査』と『2021-2022年調査』それぞれのデータでも分析を行いました。『2017-2018年調査』、『2021-2022年調査』とも、「不満なし」が約2割を占めており、他の種類の不満についても割合に大きな差は見られませんでした。
コロナ禍によってキッチンへの不満の種類が変化した、とは結論づけられない結果となりました。

この2期比較では大差が見られませんでしたが今度は、年代別に違いがないか分析してみました。

「不満なし」は20-30代で20%程度、40代で15%、50代で19%、60-70代では30%程度となっており、40代の主婦の家庭は他の世代の家庭よりもキッチンに関する不満が顕在化していると考えられます。

不満の種類別にみてみると、20-50代の幅広い年代で「収納に関すること」と「スペースについて(狭い)」が合わせて30%を超えており、キッチンに関する不満は主に“キッチンスペースの狭さ”であると言えます。

では、「収納に関すること」や「スペースについて(狭い)」に分類された自由回答では、どのような単語が多く使われ、ほかのどのような単語とあわせて使われることが多いのか、見ていきます。

『よくある関連ワード』について

AIによるテキストマイニングでは、カテゴリー分けだけでなく、どの単語と同時に使用していることが多いのか、「よくある関連ワード」を確認できることができます。

「収納に関すること」に含まれる「よくある関連ワード」 *()内は件数

「収納に関すること」では、「収納」という単語が最も多く、「収納に関すること」に分類された271件中115件登場します。単に「収納が不満」といった回答を除けば、「収納」と「少ない」という単語が同時に使われている件数が26件となっており、端的に「収納が少ない」という表現で不満を述べているひとが多いことがわかります。
また、質問文が「あなたのご家庭のキッチンに対して、不満、もしくは改善したい点があればご自由にお書きください。」です。そのため「収納スペース」といった書き方をしている場合が多く、「収納」と「スペース」が同時に使われているケースが多かったです。

また、「よくある関連ワード」のほかに「注目ワード」も自動で提案されます。
「注目ワード」は、そのカテゴリーに分類された回答のなかでもどのような回答に注目すべきかをAIが提案するものです。例えば「収納に関すること」では「調味料」が注目ワードとして提案されました。「収納が少ない」というだけでは、何を収納するためのスペースが足りないのか?といったことまでは把握することができませんが、注目ワードが提案されることによって、「調味料」の収納場所についての不満に着目すべきであることがわかり、効率的にデータを活用することが可能になるのです。

次に「スペースについて(狭い)」をみてみます。

「スペースについて(狭い)」に含まれる「よくある関連ワード」 *()内は件数

「狭い」が最も多く「スペースについて(狭い)」に分類された260件中、135件登場しました。「狭い」と同時に使用されている単語では「スペース」が54件登場しており、キッチン自体が「狭い」という回答が多かったことがわかりました。「収納に関すること」では「収納」が中心となっていましたがが、こちらは収納ではなく、キッチンスペース自体の狭さが挙げられていることがわかります。

注目ワードをみてみると「広い」「作業」などが提案されており、とにかく広さを求めていること、特に“作業のため”の広いスペースが欲しいという回答が多いことがわかりました。

まとめ

今回は1,515件のデータ(自由回答結果)を用いてAIテキストマイニングを行いました。テキストマイニングで扱うデータ量としてはさほど多くないですが、通常、1,515件を人力でアフターコーディングして傾向を明らかにするには、1)すべての回答に目を通し、2)コードガイドを作成、 3)アフターコーディング 、4)コーディングのチェック 、5)集計のステップが必要となるため、思いのほか時間とそれに伴う費用がかかります。

それに対して、AIテキストマイニングでは、データを投入し、分析を行う(場合によっては分析後に微修正が必要となる)だけで、大量のテキストデータの傾向を明らかにし、何に注目すべきかまで明らかにすることができるのです。

ただし、AIテキストマイニングは従来のテキストマイニングに比べて労力は軽減されますが、まだ完全に人間の手がかからないという領域までは達しておらず、入力データに誤字や省略した用語が使われていた場合には辞書登録を手作業で行わなければなりませんし、カテゴリー分けをする判断などは人間がしなければなりません。そして、その作業には、やはりある程度の経験や知見が必要となります。

もしテキストマイニングでお困りのことやAIテキストマイニングに関する質問等ございましたら、お気軽に問い合わせください。

また、AIを活用したテキストマイニングや自然言語処理開発が得意な会社が下記のサイトにてまとめられていますので、ご参考ください。

参考:自然言語処理AIの開発が得意な会社をご紹介!|AI Market

(digmar編集部)