【PR】議事録サービス「AI GIJIROKU」は個人で使えるかどうか

こんにちは。シゴクリ大橋です。

今回は、議事録を自動で作ってくれる議事録サービスを紹介します。

議事録といえば、発言者と発言内容の記録です。僕の場合は、会議や打ち合わせで、会議メモや打ち合わせメモとしてお客さんと共有することがあります。この時、まさに自分でゴリゴリ書いているのですが、案件が多くなったり、会議や打ち合わせが多くなるとこういった議事録サービスは使えるだろうなあと感じていました。

わりと誰でも思うことかもしれませんが、僕が参加しているプロジェクトでは、わりと定例会議をすることが多いです。そこで、議事録を自動化できたら面白いと思っていたのですが、実用に耐えられそうなものがあまりなかった(登録が面倒、費用が合わない、精度が微妙など)ので諦めていたこともあります。

そんな中、今の議事録サービスはどうかというところで、AI GIJIROKUを中心に他サービスと比較してみたいと思います。

僕のようなライターやフリーランスなどの個人にとって使いやすいかを検討してみたいと思います。

紹介するサービスの抽出の仕方

比較する前に、ここで取り上げた紹介するサービスの基準や目安を紹介します。個人(僕)が使いやすいかを一番重視しています。外したサービスは最後に参考までに挙げてあります。

ポイントは以下の3点になります。

1.音声認識機能があること

取り上げるサービスは、議事録作成において、音声認識(マイク入力)があり、そこから文字を起こしてくれるものです。議事録サービスを調べてみて分かったのは、「議事録サービス」といっても色々あるからです。

例えば、チーム情報共有サービスなどで、議事録テンプレートがあるとか、議事録を簡単に作れる、共有できるというものも「議事録作成」が含まれたりしますので、これは外しました。

他には、音声データをアップロードして変換するようなタイプものです。テキスト変換サービスという認識で外してあります。

2.複数人が話したものが記録されること

利用人数が一人(セルフ)でなく、複数人に対応しているということです。

例えばGoogleドキュメントなどでは、音声認識から自動で文字起こしが出来ます。この場合は一人で活用しているので自分の声を文字化できますが、複数人が行うのは想定されてないはずです。

通常、会議や打ち合わせは、二人以上の複数人で行うので、そこで複数人の認識が出来るかどうかがポイントになります。

3.個人でも使えるサービスであること

端的にいえば、個人向けが想定されていて、高くないということですね。会社で法人契約していて使うなどは想定していません。今回はあくまで個人で使えるか、使いやすそうなものを選んでいます。費用感としては月1万円を超えるものはまずないなということで外しました。

1.AI GIJIROKU(株式会社オルツ)

AI GIJIROKUは、株式会社オルツが提供する日本初のSaas型AIスマートミーティングです。1日50円から始められるというハードルの低さが特徴です。商品PV動画も分かりやすかったのでさくっと見てみるのもいいでしょう。

AI GIJIROKU自体の使い方動画もありました。

特徴

  • ブラウザベースなので、Chromeブラウザとネット環境があればすぐ使える(マイクはもちろん必須)
  • チュートリアルがあり、ITに疎い初心者でも導入がしやすい
  • メンバーの招待はメールアドレスで招待メールを送るだけ
  • 複数人の会話文字起こしを同時に行ってくれる
  • 声紋認証など話者識別、辞書登録などがあり議事録作成向けの機能が豊富
  • 様々な利用環境を想定しているのが強い(オフライン会議での集合会議型から、オンラインで別端末での収録まで対応。イヤホンやスピーカーという違いもカバーしているのは非常に大きい)

機能やプラン

リアルタイム音声認識、話者識別、翻訳機能等など多数。詳細は機能/価格表をどうぞ。

スタンダードプランは1500円/月。個人向けはこのスタンダードプランを利用するのが最適だと感じる。

費用感

スタンダードプランで月1,500円は安く感じる。個人でも手が出やすい価格帯といえる。

無料トライアル

無料トライアル可能。グループ機能(複数人会話)は制限されて使えないため、スタンダードプランにする必要あり。

使ってみてどうだったか

僕と友人の二人で使ってみました。

基本的にPC環境でChromeブラウザを立ち上げ、画面を見ながら、別ツールで音声通話をします。今回はFacebookメッセンジャーの音声通話でしたが、ZoomやGoogleハングアウトなどが想定されているはずです。

声紋認証機能もありますが、今回は使っていません。PC1台ずつで、リモート通話なのでその必要はなかったからです。

AI GIJIROKUで会話が自動文字起こしされている
※プライバシー保護のためにぼかしをいれています。

実際にどのように使ったかですが、

1.Facebookメッセンジャーなどで通話を開始しておく
2.AI GIJIROKUでStartRecording(録音を開始)ボタンを押す
3.二人で話すと声が自動認識され文字起こしされたものが出てくる(上画面参照)
4.会議が終わったらEnd Meeting(録音終了)を押して完了です。

やってみるとあっけないくらい簡単に文字起こしがされるという感じでした。録音終了をすると、キーワード化も自動的にされているのが面白いです。

自動で作られるキーワードリスト。誤認識のものもあるが、不要なものは消していけば良い。

議事録の修正も行ってみました。基本的にですが、文字起こしで出てきたものは誤認識があるので、それを修正していくという形です。

議事録修正のやりかた。音声を聞きながら確認し、テキストを修正する

議事録を修正するのは、直観的に使えました。上の画像で説明していますが、修正したい部分をマウスでクリックして、音声を再生して聞きながら修正できます。ちなみに、削除ボタン(ゴミ箱アイコン)でテキストを消すと復元はできないので注意してください。

議事録の音声だけ欲しい場合も「音声をダウンロード」でダウンロードできます。文字起こしテキストが欲しいなら「テキストをダウンロード」でCSVファイルがダウンロードされました。CSVファイルは、Excel等で修正しやすい形なのがいいですね。

録音が終わると、収録完了メールが来てリマインダ代わりとなり便利でした。よくありそうなのは、収録後そのまま議事録作成でなく、後でやるという場合にメールを見て議事録作成忘れ防止ということもできそうですね。他には、会議に出席して参加者が担当者以外の他の参加者がいるケースがありえます。その場合は、例えば参加者へ通知されるので議事録確認メールなどを出さなくても事足りるのは嬉しいですよね。

音声認識についての認識程度は、肌感覚としてGoogleドキュメントであったり、iPhoneのSiriだったりと変わらない感じでしょうか。家でGoogleHomeを使っていますが、ゆっくりとはっきりと言えばかなり認識率は高くなります。僕は早口傾向なので、このゆっくりはっきりは、正直じれったい(笑)ので誤認識がわりとあったという印象です。例えば、上の画像にある「(00:27)お鍋で見ました」という文字起こし結果は、実際は「並べてみました」と僕が言ったものだったりします。ぼそぼそと早口だと厳しい感じです。

2.Texta(株式会社Lightblue Technology)

Textaは、株式会社Lightblue Technologyが提供するWeb会議向け議事録作成支援ツールです。2020年12月末まで無償提供となっています。

特徴や機能

AI GIJIROKUと比べて、主要機能では大きな違いはない模様。ただし、翻訳機能、声紋認識、辞書登録などはなし。

費用感

現在無償提供ということで、プラン等は確認出来ず。

使ってみてどうだったか

こちらも友人と使ってみました。

Textaでの議事録収録の様子

サービスにログインし、議事録開始ボタンで議事録が作れるという流れはAI GIJIROKUと同様です。ただし、友人を招待する必要はないこと(同一画面を共有して見るわけではない)が異なっています。(この点は何度もヘルプ等を見たのですが、共有するURLがあるわけでもないという認識です)

PCのChrome利用で、相手の音声がスピーカーでというのが基本想定のはずなので、そのようにやってみました。実際には、イヤホンの場合はミキサーをインストールする必要があり、このあたりは一般個人ではきつい気がしたのでその点は試していません。

結論的には、使ってみたところ、残念ながら友人の声が入らずうまくできませんでした。具体的には、僕の声はもちろん収録されますが、それだけという結果です。

ここからは仮説に過ぎませんが、相手の声をこちらのスピーカーからマイクで音を取る仕掛けはハウリングなどが発生するため出来ないはずです。よって、どう音を得るかというと、イヤホン利用時に想定されるミキサー利用なら理解できるというところでした。

僕はネットラジオ等でミキサーで「パーソナリティーの声とBGMのミックス」などは実はやったことがあって、その経験からすると、ミキサーで音声を混ぜる(相手の声と自分の声が同一のところを通るイメージ)ことをしないと、できないのではないかと感じました。しつこいですが、ミキサー利用は一般向けではない、このあたりの知識がないとしんどいのでイヤホンでミキサー利用は今回は検討していません。

PCスピーカーでいけるという根拠ですが、ページ説明にあるデモ画面ではZoomで接続した音が収録されているように見えたんですね。よかったら確認してみてください。

結果はちょっとうまくいかなかったというところですが、気になる方は、2020年内は無料ですので試してみて検討してみてください。

3.音声議事録システム(株式会社ユーザーローカル)

音声議事録システムは、株式会社ユーザーローカルが提供する音声議事録の自動化サービスです。

オンライン会議の自動議事録作成・可視化サービスを無償提供開始のプレスリリースが参考になります。

機能や特徴

AI GIJIROKUと同様で、複数人対応や文字起こし化などは共通といえる。

特徴的なのは、感情分析、ネガポジ、品詞分析などのテキストマイニング的な視点があること。

費用感

無料での提供。

使ってみてどうだったか

ユーザー登録などは不要で使えるのがユニークです。毎回作成されるURLが異なるようです。

メイン画面の動き。自動的に文字起こしされ、単語クラウドのような分析が面白い。

メイン画面は、画面のように、自分だけの発言がリアルタイムに収録される動きでした。友人と使用していて気づいたのは、複数人の場合は、画面にある「参加者全員の発言を分析」ボタンを押す必要があるということで、AI GIJIROKUのようにリアルタイムに複数人の文字起こしが見られるのとは違っていました。

「参加者全員の発言を分析」ボタンを押した画面。複数人の文字起こしがされている

こちらの「参加者全員の発言を分析」画面は、上では「大橋、User591(友人)」がいますが、リアルタイムでの音声認識はされているのですが、表示がリアルタイムではないということですね、

上の画面を手動で更新したり、一度個人画面に戻ってまた見るなどの手間がかかります。あくまで、最終的に会議が終わった後に見る画面という想定といえます。

ちなみに、音声データはダウンロードはできず、テキストデータはCSV形式でダウンロードできる形になります。議事録作成という点では、テキストはダウンロードできて編集できるのはいいのですが、音声が録音されないため、別ツール等で音声録音をしておく必要があります。誤認識は変わらずあるので、テキスト修正の際に音声がないという点は注意が必要です。

一方で、感情分析やネガポジ判定が出てくるのは面白くユニークだと感じました。少し会議を違った形で楽しんだり、打ち合わせの雰囲気を変える意味ではありかもしれません。

音声認識性能のチェックをしてみた

肌感覚での違いというのでなく、実際に見かけたニュース記事を一部読んでみてどうかを更に検証してみました。読み上げ原稿は、NTT、遠隔ロボのオリィ研究所と資本業務提携の冒頭1段です。

なお、会話形式を整理して、本文1文単位で整形しています。

AI GIJIROKU

  • NTT とふくロボット開発のオリィ研究所は15日資本業務提携したと発表した
  • オリィ研究所が開発する 遠隔操作のロボットで障害が障害などで外出が難しい人の就労を拡大する
  • 次世代通信規格5 d などと ロボットの連携も進める
  • 新型 コロナウイルス対策としても活用し グループでの受付業務携帯 店舗のスマホ教室で導入を広げる

Texta

  • NTT と福祉ロボット開発のオリー研究所は15日資本業務提携したと発表した
  • オリィ研究所が開発する 遠隔操作のロボットで障害などで外出が難しい人の就労を拡大する
  • 次世代通信規格 5 GB などと連携も進める
  • 新型 コロナウイルス対策としても活用し グループでの受付業務携帯 店舗のスマホ教室で導入を広げる

音声議事録システム

  • NTT と福祉ロボット開発の研究所は15日資本業務提携したと発表した
    オリィ研究所が開発する 遠隔操作のロボットで東海などで外出が難しい人の就労を拡大する
  • 次世代通信規格 5 d などと ロボットの技術連携も進める
  • 新型 コロナウイルス対策としても活用し グループでの受付業務 携帯 店舗のスマホ教室で導入を広げる

音声認識性能の比較表

以下、簡単な表でまとめてみました。結論的には、AI GIJIROKUがパーソナライズやAI学習というところで認識精度に期待が出来るというところでしょう。


AI GIJIROKUTexta音声議事録システム
認識精度
音声反応
パーソナライズ不明不明
AI学習不明不明
音声認識チェックの比較結果

認識精度

認識精度は、どのサービスでもほぼ変わらないという印象でした。誤認識として共通していたのは、「5G」(ファイブ・ジー)が「5D」「5GB」などとなったことです。

音声反応

全てChromeでPCマイクを用いていますが、とくに声を感知する感度の違いは見られませんでした。例えば大きく話さないと反応しないなどはとくにありませんでした。

パーソナライズ

パーソナライズとは、利用者に最適化されるものです。ここでは未検証ですが、AI GIJIROKUのみがその機能を有していると言えそうです。何度も話していくとより自分にあったサービス(例えば話し方の癖などを修正してくれる)となりそうです。この機能があることで、認識精度が上がっていくことが期待できます。

AI学習

AIが学習する要素を含んでいるのは、AI GIJIROKUのみで確認できました。収録した議事録を修正していくと賢くなるという感じでしょうか。そのデータから更に学習し認識精度が上がることが期待できます。

番外編:個人が作ったサービス

一つだけ見つけた個人が開発したサービスもみてみましょう。

Talk To CSV

Talk To CSVは、iwatendoさんが開発した音声認識で会話ログが取れるサービスです。サービスの詳細は音声通話やビデオ通話と併用し、音声認識で会話ログが取れるサービスを作ってみましたを見てみてください。

特徴や機能は、音声認識、複数人参加、自動文字起こし、CSVダウンロードがあり、個人で無料で使うには十分かもしれません。一方で、音声ダウンロードは出来ません。正確には「録音」ボタンを押せば、「会話一文」毎で音声アイコンが出て再生はできますが、ポイントかつ一時的にしか使えないというところでした。

議事録作成においては、画面上の吹き出し該当テキストを押せば修正可能です。まとめて音声ダウンロードはできないけれど、議事録作成補助にはなりそうという印象でした。

ところで、音声ファイルダウンロード自体がない点を少し気になって調べてみたところ、SkyWay無料版では録音機能がありませんでした。有料版では録音機能があるものの高コストになるため、提供はおそらく厳しいと思われます。おそらくですが、音声アイコンで会話一文毎で聞けるのは、保存するストレージをブラウザ側つまりユーザ側で保持しているという仕掛けだと推測します。

無料で気軽に使えてそこそこ議事録作成補助にはなるというところでは、選択肢としてありという印象です。

今回検討しなかったサービス

今回検討しなかったサービスを以下に紹介します。

Smart書記

個人として10万円からは費用感として厳しい。法人向けの印象でした。

COTOHA Meeting Assist

こちらも月5万円という費用感がネックでした。法人向けですね。

GIJI

議事録作成とはあるのですが、音声認識機能はあるが詳細が不明でした。執筆時点では試したところ、議事録作成をブラウザ上で出来るということで、音声認識は見つからないので外しました。留意点としては、こちらで音声認識の話があるので、おそらく実装予定か別開発という気がしました。

VMeeting

公式にはありませんでしたが、こちらの記事から法人向けと判断して外しました。

ProVoxt

法人向けで、音声アップロード型でした。

MOJIMOJIくん

文字起こし外注サービスであり、異なると判断しました。

SpeechRec Plus

法人向けでした。SpeechRec Cloudで初期15万、ランニング月額15万円からという費用感でした。

RIMO

データをアップロードして行う変換サービス型のため、外しました。

trasc

音声変換は高精度の印象ですが、データ変換型のため外しました。また費用感も従量課金で3分100円は個人では厳しそうです。(AI GIJIROKUは1時間150円)

まとめ

AI GIJIROKUを中心に議事録サービスを見てきました。個人で使えるかどうかという観点として振り返ってみます。

AI GIJIROKUは個人で使いやすいといえる

AI GIJIROKUは、音声認識、複数人認識、音声データDL、テキストDLなどベーシックを抑えつつ、議事録修正がしやすいというところで、完成度が高く、個人で月1500円という価格帯はもちろんどれくらい議事録を取るかによりますが十分いけると感じました。さらに翻訳機能や辞書機能、声紋登録などの機能も充実しているため、今後も期待ができるでしょう。

Textaは、うまく使えなかったので評価しづらいのですが複数認識も出来ていればどうかというところです。他にはUIUXなどがもっと分かりやすいと良いかもしれません。

音声議事録システムは、登録不要で使える手軽さが評価できるのと、特徴的な感情分析がユニークでした。音声認識、複数人認識、テキストDLは出来るのですが、議事録作成において音声ファイルが欲しいので、別で録音が必要という点がやや気になりました。その手間を省けば議事録作成として使えなくはないでしょう。

番外編としてTalk To CSVは、音声DLが出来ないという点以外では、登録不要で使える便利な点が評価できます。個人開発という点で継続の懸念点などを考慮すれば、優れたサービスと言えそうです。

総合的にみてAI GIJIROKUはどうだったか

比較したサービスでも上記のように、音声DLができて、議事録修正がしやすくという点で上回っている印象的でした。とくに強いと感じたのは「様々な利用環境が想定されている」点です。今はリモートワークや様々な環境でアクセスすることが想定されるので、時代に合っているサービスとも言えるでしょう。

検討を外したサービスにおいても、費用感は法人向けサービスが多い中、個人でも使える費用感であったこと。音声データアップロード型が多い中、リアルタイム認識サービス自体があまりなかった点で(AI GIJIROKUではインポート機能で音声変換できる機能もあります)優れていると言えそうです。

以上をもって、個人で使える議事録サービスとしてAI GIJIROKUは使えると言っていいでしょう。

気になった方はトライアル無料で試すことができるので、まず使ってみてはどうでしょうか。

以上、個人で議事録サービスを検討している方の参考になれば幸いです。

筆者プロフィール

シゴトクリエイター 大橋 弘宜
シゴトクリエイター 大橋 弘宜
「シゴクリ」運営者。アイデアの力でお客様に貢献するゼロイチ大好きアイデアマン。ビジネスアイデア相談実績等は200超を超える。好きな言葉は三方良し。詳しい自己紹介仕事実績も合わせてご覧ください。お仕事メニューお問い合わせはお気軽にどうぞ。

リサーチとアイデアの出し方講座

大橋のアイデアの出し方やリサーチの仕方などのやり方などを初心者向けに解説したUdemy講座です。本ブログのアイデアやリサーチネタが気になって、どうやってやっているんだろう?と思った方はぜひ。

気になる方はハードルを極限まで下げているのでチェックしてみてください!