快適さを得るにはお金の力が必要かもしれない。
流行りのChatGPTを搭載した、VRでの会話シーン。応答時間が長くて無視されているみたいだし、会話と言えるようなラリーはしていないんだけども、会話しているような雰囲気を醸せます。
ちょっと複雑なのでここでは実際のコードは書きませんが、以下に手順を示します。
- Micボタンを押すと、録音が開始。
- 録音したオーディオクリップをOpenAIのWhisperに渡してテキストに変換してもらいます。
- 変換されたテキストを同じくOpenAIのChatに渡して、AIの返答テキストをもらいます。
- そのAIの応答文をVOICEVOXという音声合成ソフトに渡して、音声に変換してもらいます。
- 再生するときにRipSyncを使って3Dモデルの口をパクパクさせます。
あとはMetaQuest2などで動かすとこんな感じで目の前でキャラが喋ってくれます。
Chatには3つのロールがあり、ユーザーの文章であるuser、AIの応答文であるassistant、そのどちらでもなく設定に使うsystemがあります。systemとして文章をAPIで渡せば、「日本語で返事して」とか「100文字以内で返して」とか、今回は設定していませんが「語尾ににゃんってつけて」など、設定から性格、キャラクターの要素まで与えることができます。文字数(トークン数)にも上限はあるので何でもかんでもというわけにはいきませんが。
少しお金がかかったりもしますが、こんなふうに組み合わせるだけでAIを搭載したゲームが作れるかもしれないと思うと楽しいですね。