概要
Kotoba Technologies は、プロの通訳者に匹敵する精度のリアルタイム翻訳モデル
から、AI エージェント向けの超低遅延音声モデルまで、東アジア言語に特化したリアルタ
イム音声モデルを構築しています。Salesforce Ventures は、同社のシードラウンドに参画
できることを誇りに思います。
- 創業者: 小島 熙之 (CEO)、笠井 淳吾 (CTO)
- セクター: 音声 AI / 音声基盤モデル
- 所在地:米国・サンフランシスコ、および日本・東京
事業機会
話し言葉は、グローバルなコミュニケーションにおける最も根本的な障壁であり、とりわ
け日本をはじめとする東アジアにおいてその課題は顕著です。何十年もの研究を経た今で
も、言語の壁を越えたリアルタイムの音声コミュニケーションは実現していません。既存
のソリューションは、日本語、韓国語、中国語が持つ音韻的な複雑さに対して、速度が遅
すぎるか、精度が低すぎるか、あるいは最適化が不十分だからです。AI エージェントが普
及し、音声が AI の主要なインターフェースになりつつある今、グローバルプラットフォー
ムが提供するものと東アジアのユーザーが求めているものとのギャップは、かつてないほ
ど広がっています。そして、このギャップを埋めることには非常に大きな価値があります。
ソリューション
Kotoba Technologies が独自に開発したモデル「Koto」は、リアルタイムの音声翻訳およ
び音声インターフェース専用に構築されており、日本語、韓国語、中国語において業界を
リードするパフォーマンスを誇ります。Koto は、エンド・ツー・エンド型と従来のアーキ
テクチャの双方に対応しており、音声処理のパイプライン全体を担う場合でも、既存の大
規模言語モデル(LLM)スタックに最高峰の音声認識(STT)および音声合成(TTS)レ
イヤーとして組み込む場合でも、超低遅延な処理を実現します。
Koto の同時通訳アプリを使えば、普段通り自然に話すだけで、その内容が別の言語にリア
ルタイムで翻訳され、プロの人間通訳者に匹敵するクオリティで相手に届きます。企業向
けとしては、音声認識および音声生成技術として自社製品に直接統合することが可能です 。
リモートサーバーに接続することなく、一般的なスマートフォンなどのデバイス上で直接
動作させることもできます。
Kotoba Technologies を支援する理由
Kotoba Technologies の創業メンバーは、自らの手でプロダクトを開発することを選んだ 、
最先端の AI 研究者たちです。この「優れた研究者であり、同時に優れた開発者でもある」
という組み合わせは、本当に稀有なものです。
CEO の小島熙之氏(コーネル大学・博士)は、自然言語処理のトップ国際学会「 EMNLP
2022」で最優秀論文賞(Best Paper Award)を受賞したほか、スーパーコンピュータ
「富岳」を活用した日本の大規模言語モデル開発プロジェクト「 LLM-Fugaku」の共同発
起人でもあります。CTO の笠井淳吾氏(ワシントン大学・博士)は、シカゴトヨタ工業大
学(TTIC)の助教を務め、「NAACL 2022」で最優秀論文賞を受賞するなど、日本で最も
論文が引用されている自然言語処理(NLP)研究者の一人です。また、両氏ともに「孫正
義育英財団」のフェローでもあります。
グローバルな競合他社が模倣できないのは、Kotoba Technologies が構築した「世界トッ
プレベルの研究に基づくモデルの品質」「アジア言語への深い特化」「企業の導入現場が
求める柔軟な開発力と迅速な対応力を備えた、サンフランシスコと日本を拠点とするチー
ム」という独自の強みです。AI エージェントがソフトウェアの主要なパラダイムとなる中、
Kotoba Technologies は東アジアにおける次世代デバイスやエージェントシステムの「音
声モデルのデファクトスタンダード」として、Koto の地位を確立しようとしています。
今後の展望
私たちは、Kindred Ventures とともに Kotoba Technologies のシードラウンドに参画で
きることを誇りに思います。同社の卓越した創業者たち、技術的に差別化されたモデル、
そして消費者向け(コンシューマー)と企業向け(エンタープライズ)の双方における強
力な勢いは、今後このカテゴリを定義するような一大企業へと成長していくものと確信し
ています。