12

ユーザーの声をリアルタイムに
変換する「AI声質変換技術」

クリムゾンテクノロジー株式会社

アピールポイント

● AI技術をエンターテインメントに応用し、ビジネス化した技術。
● 録音された音声があれば、ユーザーの声をその音声に近づけていくことが可能。
● 派生技術として、ユーザーの声をシンセサイズ(合成)しての変換も可能。

テーマ概要

ユーザーの声を様々な声にAIでリアルタイム変換する技術。機械学習でキャラクターの声の特徴量を抽出することにより、ユーザーの声を変換する。音質をより良くするにはユーザーの声とキャラクターの声、両方の学習が必要となるが、汎用的に様々な人の声をキャラクターの声に変換することができる。現在はWindows、macOSのアプリケーションとして展開中。当技術はテーマパークやイベントでの使用が中心だったが、新型コロナウイルス感染症の影響で、Web会議技術が一般化したことにより、当AI声質変換技術を使った遠隔接客を推進している。また、派生技術として、シンセサイジングによる声質変換も実現。もう少し落ち着いた声や元気な声など声の雰囲気を変換することも可能になっている。

特許・受賞歴・実績・クチコミ

世界発信コンペティション2020 製品・技術部門大賞受賞  特許取得済み 特許6664670号、商標登録済み 商願2019-077593 TBSテレビ番組 審査員長松本人志にて、部門賞まつもトロフィーを受賞

Q.自社ならではの強み、他社との違いは?

AI声質変換技術を一般ユーザー向けにビジネスとして提供できる。他社に先駆けてAIリアルタイム声質変換技術に注目し、開発および事業化を進めてきた。従来の類似製品として「ボーカロイド」や「ボイスロイド」などの技術を使った音声合成ソフトがあるが、これらはあらかじめ入力された音符やテキストから機械的に音声を合成するため、人間的な感情表現やスムーズさに課題がある。それらと比較し、弊社の声質変換技術は使用者の声をリアルタイムに変換するため、誰でも人間的なコミュニケーションが可能である。

Q.いま抱えている課題は?目指していることは?

Vtuberやアニメ好き、ボカロ好きなオタク層からの支持を得ているが、やはりマニアックであるため、販売量が伸びていない。一般消費材目線での提案に期待する。また、クラウドを利用しての独自サブスクリプションサービスは敷居が高く、技術を生かして一般向けにWeb会議や遠隔接客で使える製品として販売量を大幅にアップさせたい。

Q.提案に期待していることは?

UI/UX、ネーミングなどへの提案はもちろんのこと、サブスクリプションサービスでの展開などを検討したい。(現在ユーザー・データベースは保有していない)SDKも用意しており、他社とのコラボレーションも可能である。現在売り上げの多くは音楽配信(アグリケーション)だが、利益率はよくなく自社製品事業で経営効率を高める必要がある。このボイスチェンジ市場での自社製品事業をヒットさせ、安定した事業としていきたい。

Q.デザイナーとの協業に期待していることは?

音と音楽、そしてエンターティンメントに拘ってきた会社だけに、専門的すぎて、一般ユーザーの「声」におけるニーズや感性を掴むことが難しい。機能を削ぎ落として販売チャネルを考えることで、ヒット商品を生み出したいと期待している。

審査委員よりコメント

AI技術により、リアルタイムにユーザーの声を様々に変換する、高い技術を持つ企業。使用シーンや技術活用のアイデアにとどまらず、ブランディングやビジネスデザインの提案も見てみたい。全く新しい発想を期待する。

クリムゾンテクノロジー株式会社(世田谷区)

2002年2月創業。創業当時は携帯電話の着信音サービスがこれから始まろうとする時期で、自社保有の音に関する技術や人脈を活かし、新たな音楽市場をネットワーク上で実現することを当初の目標に掲げる。その後、通信カラオケ、着信メロディといったMIDIの技術を用いた市場から、さらに現在の音楽配信と、音楽を身近に届けることが可能となった。「技術革新で人々の創造性を支援します」をスローガンに、技術で音楽制作者やアーティストなどの創造性やビジネスを拡大。社員は20代前半から50代まで幅広く在籍し、技術ベースの会社らしく取締役や代表にも事業についての意見を言うことができる社風である。大学シーズの社会実装を目論み、大阪大学ベンチャーキャピタル等からの出資を受けビジネスを拡大中。AIを利用したエンターテインメント利用の世界での活躍を目指す。

https://crimsontech.jp

テーマ企業プレゼンテーション

工場見学/会社訪問ムービー

↑

この企業へのインタビューを読む