上司が忙しくて話を聞いてくれないのでAIにしてみた。ブイキューブのAI 1on1化プロジェクト

近年、ChatGPTをはじめとする大規模言語モデル(LLM)の進化により、知識豊富なAIと対話することができるようになってきました。ビジネスの現場でもAIを活用する機会が増え、今後は業務サポートや意思決定のパートナーとしてAIの役割が期待されています。

また、音声合成技術も進化しており、実在の人の声を再現するTTS(テキスト読み上げ)機能によって、AIがよりリアルな会話体験を提供できるようになっています。これにより、AIと対話するだけでなく、まるで本物の人と話しているような感覚が味わえるようになりました。

こうした技術を活用し、ブイキューブでは、社内テレキューブに「AIと1on1ができるチャットボット」を導入する実験を開始しました。これはAIを業務相談のパートナーとして活用する新しい試みです。

目次[ 非表示 ][ 表示 ]

「上司が忙しく、気軽に相談できない」問題

ビジネスの現場では「上司が忙しく、気軽に相談ができない」という問題がよくあります。

ブイキューブでも、社員が新しいアイデアを提案する「新規事業コンテスト」を毎年開催していますが、社員たちはコンテストの準備段階で多くの悩みやアイデアの検証が必要になります。

特に、経験豊富なベテラン社員の意見を聞きたい場面が多くあるものの、そうしたベテラン社員たちは通常業務が多忙であり、1on1の時間を確保するのは難しい状況でした。せっかく斬新なアイデアがあっても、フィードバックを得られないことで進め方に不安を抱えることもあります。

このような課題を解決するために、ブイキューブはAI ChatBotを活用した1on1の仕組みを実験的に社内に導入しました。

AI 1on1システムの構成

AI 1on1システムは、社員の皆さんがリラックスしてAIと1対1の対話を行えるように、シンプルで使いやすいハードウェア構成になっています。主な構成は以下の通りです。

blog_AI_1on1_03

  • 小型PC:音声データのテキスト化、分析処理、そしてAIによる回答生成を行います
  • 液晶モニター:AIのアバターや回答が表示され、視覚的に対話内容が確認できます
  • マイク・スピーカー:音声の入力と、生成された回答の音声出力を担当します
  • 音声入力ボタン:音声入力を制御し、押している間のみ音声が認識されるようになっています

AI 1on1システムの仕組み

ブイキューブのAI 1on1システムは、社員が簡単に質問や相談ができるよう、次のような流れで応答を行っています。

1. 音声入力のテキスト化

社員が音声入力ボタンを押しながらマイクに向かって質問すると、その音声はブラウザ上のWeb Speech APIを通じて自動的にテキストデータに変換されます。

2. テキストデータの分析処理

文字に変換された質問内容は、「Dify」と呼ばれるAIアプリの仕組みに送られます。Difyは、登録されている社内データやFAQをもとに必要な情報を探し出し、最も適した回答ができるように準備します。

3.AI(GPT-4o)による回答生成

選ばれた情報をもとに、AI(GPT-4o)が「社内のデータ」「ネット上の最新情報」「AI自体が持つ知識」の中から最も適切な情報を選び、質問に対する回答を作成します。

4. 回答のテキスト表示と音声変換

AIが作成した回答は画面に表示されるだけでなく、音声にも変換されます。親しみやすい声で回答が返されるので、実際に対話をしているような感覚で相談が可能です。

AI 1on1システムで使用される技術の概要

ブイキューブのAI 1on1システムでは、以下の主要技術を用いて音声認識から回答生成までのプロセスを支えています。

AITuberキット(v1.x.x)

AITuberキットは、音声認識、自然言語処理、AI応答生成といった機能を備えたオープンソースのAIキャラクター対話システムソフトウェアです。このソフトウェアをカスタマイズし、AI 1on1システムを実現しています。

詳細はこちら:AITuberキット

Dify

Difyは、データやAPIを通じてAIアプリケーションを構築できるオープンソースの開発プラットフォームです。このプラットフォームには「Retrieval-Augmented Generation(RAG)」機能が搭載されており、質問に対する回答を、社内データやネット情報を活用して正確に生成します。

このAI 1on1システムにおけるDifyの役割は、データレイヤーとしての機能です。登録済みのドキュメントやFAQといった社内情報から関連データを抽出し、ユーザーの質問内容に最適な回答を選択します。Difyのワークフローを適切に設定することで、ネット上の最新情報も同時に取り込み、AIの知識と組み合わせた回答を提供する仕組みが整っています。こうして、内部データと外部情報を織り交ぜた柔軟かつ信頼性の高い助言が可能になります。

詳細はこちら:Dify

Style-Bert-VITS2

Style-Bert-VITS2は、BERTベースの自然言語処理とVITS2の音声生成技術を組み合わせた音声合成フレームワークです。社員の声を学習させた音声モデルを用いることで、AIの回答を自然な音声として再生し、まるでいつもの上司と対話しているような親しみやすい応答が可能です。

社員は画面上のテキストとともに、音声でも回答を確認できるため、スムーズな1on1の体験が得られます。

詳細はこちら:Style-Bert-VITS2

テレキューブ(防音個室ブース)への設置

当初、このAIシステムは執務エリアに設置されましたが、「声が漏れる」「相談が筒抜けになる」といった声が寄せられました。そこで、周囲を気にせず集中できるテレキューブ内での利用に切り替えました。

blog_AI_1on1_04

また、ブイキューブが出展した「働き方改革EXPO」でも、テレキューブの活用アイディアとして、このAIと1on1ができるシステムを紹介しました。ブースでは多くの来場者がテレキューブに興味を示し、AIと対話できるという機能が、集中できる空間でさらに役立つ使い方のひとつとして注目されました。

利用者の反応と今後の展望

テレキューブ内でAIと1on1で対話ができることについては、社員からも概ね好評です。AIの応答は基本的にポジティブな反応を示すため、相談者が前向きな気持ちで話を進めやすくなり、「落ち着いて考えをまとめやすい」という声も聞かれています。AIが常に前向きな姿勢を見せることで、リラックスして対話を楽しむことができるのもAI相談のメリットです。

一方で、「反応に時間がかかる」という意見も複数寄せられました。これに対しては、リアルタイム通信プラットフォームの「Agora」がOpenAI の Realtime API と連携しているため、この仕組みを使っての改善が検討されています。

ブイキューブの生成AI室について

ブイキューブでは「生成AIを活用して社内外に新たな価値を創出する」をミッションにとした新たな商品研究・開発部門が設立されました。

具体的には、最先端の生成AI関連情報を社内外へ提供し、その知見を基にしたプロトタイプの開発と発信を行います。また、生成AIを活用した他社のプロダクトを弊社のサービスに統合することで、さらなる価値の提供を目指しています。

このブログを通じて、活動の進捗や成果を定期的にお伝えしていきますので、ぜひご期待ください。

【過去の記事はこちら】

原稿データだけで自分のアバターがプレゼン?ブイキューブが活用を進める「バーチャルヒューマン」とは

動画生成AIってどれくらい使えるの?ブイキューブがGen-3で試してみた

山本脩太郎
著者情報山本脩太郎

ブイキューブのはたらく研究部 編集長?部長? 2018年株式会社ベーシックに新卒入社。 インサイドセールスを経て、マーケティングメディアferretの編集部でインタビュー記事を中心とした企画・執筆などを担当。 同時期に数社のコンテンツマーケティング支援・インタビュー取材を経験。 2020年3月に株式会社ブイキューブに入社。

関連記事