見出し画像

“ボイスデザイナー”という未知なる仕事への挑戦

パイオニアが2022年3月に満を持して発売した、“会話するドライビングパートナー”「NP1(エヌピーワン)
次世代通信型ドライブレコーダー、スマート音声ナビ、クルマWi-Fiなど多彩な機能を搭載し、運転中のあらゆる場面で会話を通してドライバーをサポートする世界初※のAI搭載通信型オールインワン車載器です。

NP1の中でも要となる"音声"技術。その開発の裏側について、Cross Technology CenterのPiomatix情報サービス部より6回に渡り連載をお届けしています。

※ドライビングパーソナル音声AIを搭載したコネクテッドデバイスとして、ESP総研調べ (2022年3~4月実施のカーエレクトロニクス製品に関する市場調査)

今回話を聞いたのは……

Cross Technology Center
Piomatix情報サービス部 情報サービス戦略グループ

髙田 祥行
2002年4月新卒入社
 
松村 悠馬
2017年4月新卒入社

音声AIの“発話内容”と真摯に向き合う

髙田:
私たちのグループでは、パイオニアが手がけるボイステックの中の“ボイスデザイン”の部分を担当しています。
具体的には、音声AIを搭載した車載デバイスである「NP1」が発話する内容を精査、設計するのが仕事。クラウドに集められたユーザーの使用状況のログを調査して行動分析をおこない、どのようなコマンドがあればよいだろうか、ということを考えます。

たとえば、「明日の天気は?」というコマンドは必要か?という議論が起こった際に、ログ分析を行い、ユーザー全体の30%以上が1度は発話したことがあれば、実装するなどです。

松村:
また、“どういう話し方をすればユーザーにとってわかりやすいか”ということを考えるのも、僕たちの業務です。
「ボイスユーザーインターフェース(VUI)」といって、音声により端末をコントロールするデバイスが昨今注目されていますが、その設計や評価をしていくのが“ボイスデザイン”。VUIとしてはAmazonの「アレクサ」やGoogleの「グーグル ホーム」などがよく知られていますが、こうした製品は、それぞれ細かな言葉づかいに独自の“キャラクター”が設定されているんです。

「NP1」のキャラクターの定義設定を行うのも、ボイスデザイナーの仕事。“硬くなりすぎない”とか、“言葉を崩しすぎない”といったガイドラインを例文つきで作成し、随時ブラッシュアップしています。


社内公募から飛びこんだ、未経験のボイスデザインの世界

髙田:
我々のグループは社内公募を経て編成されたチームで、“ボイスデザイン”という業務自体が社内ではまだ新しいものであるといえます。

私についてお話しすると、入社して10年ほどは生産技術に携わっていましたが、その後異動して音響ビジネスの営業職に。
技術のことも理解しながら、BtoBの営業や技術関連の業務、ときには経理業務……と、なんでもやりました(笑)。

ですがあるとき、所属部署全体が関連会社の東北パイオニアへと引き継がれ、東京オフィスには自分ひとりだけが残った状態に。業務に対して受け身モードに入ってしまっている自分を感じていたタイミングで、社内公募の募集を見つけました。
そこで、社内でも新しく一からスタートできる貴重な職種だというポイントに興味が湧き、手を挙げたんです。

高田氏


松村:
僕も入社4年目までは、機構設計といって、メカの図面を描く仕事をしていました。
ですが、モノをつくって売るビジネスモデルからサービスを提供する“コト”売りにシフトしている会社の流れを感じて、“このままでいいのかな”とも考えていて。

ちょうどプライベートで引っ越しをして「アレクサ」や「グーグル ホーム」のことを調べたり、実際に触れてみたりしているタイミングだったので、音声インターフェースには興味があったんです。

そこでちょうどボイスデザインチームの社内公募を目にし、チャレンジしてみたいなと感じました。基本的にポジティブな性格なので、とくに不安はなかったですね。

松村氏

対話とは?“本質”を探る難しさとおもしろさ

髙田:
今の「NP1」のように、クラウドを通してサービスの更新が頻繁におこなわれている製品って、社内でもまだそれほど存在しないんです。
なので、自分たちの取り組んだ内容がすぐに実際のサービスに反映されるのは、おもしろいなと思いますね。

また“ボイスデザイナー”という職種名を初めて知ったときは、「ユーザーとの接点である“言葉”だけをつくる仕事なのかな?」と思っていたのですが、“ユーザーの価値創造”というところまで踏みこまなければならない、ということは今のチームに入ってからわかりました。

例えば「白糸の滝に行きたい」とユーザーが発話したとして、その候補地は日本全国にたくさんありますよね。その対話検索を成功させるためには、自分もユーザーの視点に立って発話意図や求める結果について考えなければなりません。会話のキャッチボールの本質について、深く考えるようになりました。 

松村:
そうですよね。自分の携わった業務の結果が、製品そのものに直接影響してくるのは、僕もいいなと感じています。
また携わってみて思うのは、ボイスデザインってとても感応的だということ。
外部から与えられる音声刺激に対しての反応は、人によって正解や解釈がまったく異なるんです。ひとつの内容を音声だけで正確に伝えるためには、単語の並びも重要ですし、“どの文節を頭に持ってくるか”とか“2文ではなく1文にする”といった細かい点も精査が必要。

人によって意見が異なりますし、個人レベルの感想が行き交う世界なので、そこには難しさと同時に挑戦しがいを感じています。


これからの展望──学びを深め、スタンダードを創りたい

髙田:
“ボイスデザイン”という業務自体が比較的社内でまだ新しいこともあって、今は社外の有識者による講座やさまざまな書籍を通し、学びを深めながら取り組んでいるところです。

「NP1」にどのように発話させればユーザーが気持ちよく使えるかを考えるために、行動経済学の一概念である“ナッジ理論”までかじりました(笑)。「人にどういう仕掛けを施しておくと、この動きをするようになるか」といった、ちょっと心理学っぽい考え方ですね。

当面の目標としては、さまざまな部署の方々と連携する中でノウハウを聞かれることもあるので、何か尋ねられたときに細かなこともパッと答えられるようになりたいですね。それができてこそ“ボイスデザイナー”と名乗れるのかなあ、と。
 
松村:
「NP1」が発話する内容に対して、一言一句きちんとした理論づけとともに体系化し、ガイドラインをつくっていくことも必要だなと考えています。

「NP1」に関しては、社内でも徐々に僕たちのやっていることの意味をきちんと理解してもらうことで、細かなことであっても相談してもらえるようになってきました。

とはいえ“音声ナビ”は「NP1」以外にもいろいろあるので、今後は製品を横断して携われるようになれるといいなと思います。
その中で、「パイオニアのボイスデザイン」の基準を、自らの手でつくっていけるようこれからもどんどんチャレンジしていきたいです!

最後に・・・

パイオニアでは一緒に新しいサービスを作ってくれる仲間を募集しています。
カジュアル面談も随時、受け付けています。
興味を持っていただけた方はぜひ、採用情報からご応募お待ちしています!


この記事が参加している募集

AIとやってみた

みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!