ChatGPT-4oで未整形のレビューデータを整形されたCSVに変換する

軽いAIメモネタです。

課題

  • サービスや商品のデータが100件ほどある
  • データはユーザー名(匿名)、自由記述コメント、年月日で構成
  • 自由記述コメントは自由のため改行も入るし、文章量は可変
  • 評価項目が5段階であるが、コピーできない
  • 評価項目以外はテキストコピーできるが、データが不揃いのため整形したい

みたいなことがありました。最後のコピーできない評価は100件なので手打ちしたので、そこだけは無視してください(笑)

解決策

ChatGPT-4o(以下ChatGPT)で、不揃いのデータを整形することが出来ます。

データ例イメージ

データ例

匿名のユーザー

良い体験となった。ありがたい。家族で楽しめた。

2024年XX月XX日

こんな感じのデータが100件ほどあります。イメージとして。

そしてこれらは先に示した通りで、連続していて「区切り」がないんですよ。

よって、ChatGPTには、指示は以下のように「レコード単位」の定義を示してみました。

命令文

1レコードの定義は、

  • 「匿名のユーザー」からはじまり、「XXXX年XX月XX日」まで、がデータです
  • 匿名のユーザー以降の、テキストデータは「コメント」データです。
  • 1レコードの要素は、「匿名のユーザー」「コメント」「日付」の3つとなります。
  • 100レコードあるので、これらをCSV形式で整形してください。

として、この定義に基づいて整形してくださいと伝えます。

アウトプット

まとめると、

  • 未整形のレビューデータ100件ほど
  • ChatGPTに読み込ませて、レコード定義をして命令する
  • 整形済みのレビューデータ(CSVファイル)で100件ほどが得られる

データは公開データですが、一部だけにしときます。これで、未整形のテキストデータが、整形されたCSVデータになったと。(画面にある評価は手作業なので無視してください)

今回の学びポイント

今回、こんなの出来るんだと思ったのは、

  • 区切りなど目印がなくても、定義を教えてカウントするみたいな単純作業で具体化に持ち込めばやってくれる

ということです。

また、上のデータ分析もしたのですがそこからは、やはりデータがあればかなり精度高くやってくれるので、「推測」は苦手ですが、「論理、分析」はかなりパワフルだなと。とくに手元に生データがある場合は威力を発揮してくれるのではないかなというところです。

それで、今回は100件くらいなので目視できるレベルと想定していますが、これが500とか1000とかになると、やっぱ無理というか大変ですから。だからAIに頼る。そこで頼っていって注力するところに絞り込む。それが賢い使い方じゃないかというところでした。

筆者プロフィール

シゴトクリエイター
シゴトクリエイター
「シゴクリ」運営者。アイデアの力でお客様に貢献するゼロイチ大好きアイデアマン。ビジネスアイデア相談実績等は400超。好きな言葉は三方良し。詳しい自己紹介仕事実績も合わせてご覧ください。お仕事メニューお問い合わせはお気軽にどうぞ。

違和感で発想のやり方が学べます

日常生活で感じる違和感を用いて、アイデアを出すやり方が学べます。「違和感発想法」は誰でも気軽に出来るサービスです。