ChatGPT-4oで未整形のレビューデータを整形されたCSVに変換する
軽いAIメモネタです。
課題
- サービスや商品のデータが100件ほどある
- データはユーザー名(匿名)、自由記述コメント、年月日で構成
- 自由記述コメントは自由のため改行も入るし、文章量は可変
- 評価項目が5段階であるが、コピーできない
- 評価項目以外はテキストコピーできるが、データが不揃いのため整形したい
みたいなことがありました。最後のコピーできない評価は100件なので手打ちしたので、そこだけは無視してください(笑)
解決策
ChatGPT-4o(以下ChatGPT)で、不揃いのデータを整形することが出来ます。
データ例イメージ
データ例
匿名のユーザー
良い体験となった。ありがたい。家族で楽しめた。
2024年XX月XX日
こんな感じのデータが100件ほどあります。イメージとして。
そしてこれらは先に示した通りで、連続していて「区切り」がないんですよ。
よって、ChatGPTには、指示は以下のように「レコード単位」の定義を示してみました。
命令文
1レコードの定義は、
- 「匿名のユーザー」からはじまり、「XXXX年XX月XX日」まで、がデータです
- 匿名のユーザー以降の、テキストデータは「コメント」データです。
- 1レコードの要素は、「匿名のユーザー」「コメント」「日付」の3つとなります。
- 100レコードあるので、これらをCSV形式で整形してください。
として、この定義に基づいて整形してくださいと伝えます。
アウトプット
まとめると、
- 未整形のレビューデータ100件ほど
- ChatGPTに読み込ませて、レコード定義をして命令する
- 整形済みのレビューデータ(CSVファイル)で100件ほどが得られる
データは公開データですが、一部だけにしときます。これで、未整形のテキストデータが、整形されたCSVデータになったと。(画面にある評価は手作業なので無視してください)
今回の学びポイント
今回、こんなの出来るんだと思ったのは、
- 区切りなど目印がなくても、定義を教えてカウントするみたいな単純作業で具体化に持ち込めばやってくれる
ということです。
また、上のデータ分析もしたのですがそこからは、やはりデータがあればかなり精度高くやってくれるので、「推測」は苦手ですが、「論理、分析」はかなりパワフルだなと。とくに手元に生データがある場合は威力を発揮してくれるのではないかなというところです。
それで、今回は100件くらいなので目視できるレベルと想定していますが、これが500とか1000とかになると、やっぱ無理というか大変ですから。だからAIに頼る。そこで頼っていって注力するところに絞り込む。それが賢い使い方じゃないかというところでした。
筆者プロフィール
- 「シゴクリ」運営者。アイデアの力でお客様に貢献するゼロイチ大好きアイデアマン。ビジネスアイデア相談実績等は400超。好きな言葉は三方良し。詳しい自己紹介、仕事実績も合わせてご覧ください。お仕事メニューやお問い合わせはお気軽にどうぞ。
最新の投稿
- アイデアネタ2024年12月5日大学入試の赤本が豆本カプセルトイに。かわいい!
- アイデアネタ2024年12月3日旅行ストレスを緩和してくれるかわいいアルパカさん達に出会えるサービスがあるらしい
- アイデアネタ2024年12月2日かまぼこグッズ開発部がスマホスタンドを発売。食べ物ではないグッズが生まれていく。
- ビジネスニュースカフェ2024年11月29日ビジネスニュースカフェダイジェスト:2024年11月第5週