ページの本文へ

第28回もしも会議室で隣にロボットがいたら
2章 テキストには載らない情報

キーワード

  • #ネットワーク
  • #AI活用
  • #Plus one

こんにちは、いつも当コラムをご覧いただき、ありがとうございます。
前回は、削ってまとめるAIの話でしたが今回は、その反対で情報を拾う話です。

口に出さない言葉を、わたしたちは聞いている

「空気を読む」とは何でしょうか。
聞こえないもの、見えないものは、記録できません。
正確には、音声情報の中で、文字と認識する音と、その他の認識しない音があり、後者はノイズとして処理されてしまいます。
口に出していない言葉を補完して聴いている会議の参加者はメモに書いています。
ミーティングの中に議論の要点やそこに至る背景、理由などを書きながら考え整理をすれば議論への理解が深まります。
発言者ごとの考え方の違いに気づければ言いたい意図も補足して書くことができます。
書いた議事録の原稿を上司にみせると、重要事項の優先順序や見過ごした内容の指摘などアドバイスをもらって、見えなかったもの、聞こえたが端折った言葉の意味に気づき、勉強になった経験がある方も、少なくないのではないでしょうか。
それゆえ、議事録をとることは面倒ではありますが、その分獲得できた経験値がありました。

言葉の外側にあるデータ

そもそも言葉以外の音について、どんな情報が隠れているでしょうか。
雑音、ためらい、息づき、周囲の気配、など会議の場だからこそ、分析・予測につながるさまざまな情報が隠れていたりします。

 ・健康状況、精神状態につながる
 ・機械の故障具合につながる
 ・環境の変化につながる

また複数のマイクアレイの音量差や時間差を利用して音の発生源がどこかもわかります。 会議室でリモート中継用のカメラも発話の声や音に反応して、自動追尾してズームする機能もこの応用です。 このように削られた情報が持つポテンシャルが別の価値につながる可能性が秘められています。

感情まで読む時代へ

■今回のピックアップ・ブログ

音声認識技術により、問い合わせ電話の音声をシステムがテキスト化します。
電話をかけてきた人の会話内容をテキスト化してそれをAIが分析し、FAQにある回答候補を自動的に検索して画面に表示します。
また、問い合わせ電話に対しシステムが回答を自動的に検索し、その結果をコンピューター音声で発話する自動応答(バーチャルオペレーター)も登場しています。

このようなAI技術の登場により、システムが自動でリアルタイムにオペレーターの方々を支援する動きが加速しています。
記事内には直接触れられていませんが、お客さまとの通話録音からAIを使って感情分析する例も最近でてきています。

“おと”と“ね”のあいだ

日本語の音は「おと」と読むときと「ね」と読むときがあります。
「風の音」、「笛の音」、「鈴の音」、「声音(こわね)」。「ね」とよぶときはと情感が伴うときが多いですね。
音楽も空気の振動の物理現象なのに、心に響くのは音だけではなくノイズ(余白)も含めて、感じているものがあるのかもしれません。

そういえばVAK*1という知覚志向の分類がありました。
視覚、聴覚、触覚の志向型で行動特性が分類されるというものです。私は聴覚タイプでした。

みなさんは、どのタイプでしょうか。

次回のテーマは少し想像が入ってしまうかもしれませんが、会議室とロボットを取り上げたいと思います。

*1
VAK:NLP(Neuro-Linguistic Programming:神経言語プログラミング)で用いられる、人が情報を処理する際の優位な感覚を「視覚(Visual)」「聴覚(Auditory)」「身体感覚(Kinesthetic)」の3つに分類したモデル。この特性を知ることで、コミュニケーションの改善や学習効率の向上に活用できる。

2026年5月
株式会社 日立情報通信エンジニアリング
経営戦略本部 ブランド・コミュニケーション部
阿部 哲也

※編集・執筆当時の記事のため、現在の情報と異なる場合があります。編集・執筆の時期については、記事末尾をご覧ください。