トラック地図 · OPC ATLAS

AI 言語チューター:GPT-4o Voice が本当にこじ開けた初めての教育バーティカル

Speak は ARR $50M を突破。Duolingo Max は音声を投入。インディーには何が残されているのか

更新日 2026-05-12

言語学習は、ポスト GPT-4o Voice 時代に「マーケティングではなくプロダクトが実質的に変わった」初めての EdTech バーティカルです。2024 年 5 月以前、「AI 言語チューター」とは「ぎこちない TTS つきテキストチャット」のことで、iTalki の時給 $15 の人間講師より明らかに劣る体験でした。GPT-4o、Realtime API、そして競合の音声モデル(Gemini Live、ElevenLabs Conversational、Sesame)の登場後、AI チューターは 300 ミリ秒で返答し、自然に割り込み、リアルタイムで発音を矯正し、人間講師の数分の一のコストでセッションを提供できるようになりました。Speak は韓国 + 日本 + ベトナムを背景に 2025 年に ARR $50M を超え、OpenAI Startup Fund が出資。Duolingo Max は $30/月で音声機能を提供し、欧米コンシューマー需要の大半を握っています。Loora は $12M を調達して社会人向け英会話に特化、Lingvist はアルゴリズム特化のニッチを守り、Praktika.ai は新興のモバイル先行プレイヤーです。市場規模は世界の語学学習で $61B、AI がやっとここを噛み砕き始めた局面。2026 年のインディーへの率直な見立て:英語 EFL の真っ向勝負はもう終わりました — 資金を持つプレイヤーが推論コストと CPI で押し切ります。しかしニッチな言語ペア(標準中国語話者向けの広東語、ウクライナ人向けのポーランド語、古典学習者向けのラテン語)、特定のユースケース(看護師向けの医療英語、アジアの弁護士向けの法律英語、退職者向けの観光イタリア語)、ニッチな形式(ラジオドラマ、ディベート練習、アクセント矯正のみ)には、$500K-$2M ARR の事業を組める綺麗な余地が残されています。日本市場の視点:日本人成人の英語学習層は支払い率が非常に高い(Speak が日本を 2024-25 に積極展開したのはこのため)。日本語ネイティブ向け(中国語学習、韓国語学習、ビジネス英語、TOEIC、英検)の特化型 AI チューターは、海外プレイヤーが日本語ローカライズを完璧に詰めない限り、ローカルに残る余地があります。

2025 年に 3 つのレイヤーが安定。(1) マスコンシューマーアプリ:Duolingo Max(Duolingo の有料層、約 $30/月、音声機能は GPT モデル駆動、欧米市場のデフォルト)、Speak(2025 ARR $50M+、韓国主導、OpenAI 出資で評価額 $1B+、日本・ベトナムへ拡張中)、Babbel(大人向け老舗、AI 投入は遅いが依然黒字)。価格は $15-30/月のサブスクリプションに収斂。(2) バーティカル・スペシャルティ:Loora($12M 調達、社会人英会話)、Lingvist(タリン、アルゴリズム駆動の語彙、黒字インディー)、Praktika.ai(モバイル先行の AI アバター、最近の伸び良し)、ELSA(発音特化、$15M 調達、Series B)。(3) チューターマーケットプレイス:iTalki($100M+ 売上、まだ成長中。AI チューターが代替するのではなく補完するため)、Preply($120M 調達、似た形)、Cambly(子ども & ESL、$50M+ ARR)。2026 のダイナミクス:(a) 音声モデルのコストは 18 ヶ月で 5 分の 1 になり、以前は赤字だった AI チュータリングが安定して黒字化;(b) コンシューマー Big 3 のプロダクト形態が(リアルタイム音声会話、構造化カリキュラム、ゲーミフィケーション)収斂し、差別化は別軸からしか取れない;(c) 韓国・日本・中国・ベトナムは欧米よりはるかに安定して払う — Speak の地理ミックスが教訓;(d) B2B が開きつつある。サムスン、トヨタ、LG などの企業 L&D 担当者が従業員英語に $20-50/月で席ライセンスを買う流れは、コンシューマーチャーン戦争よりはるかにきれいなエンタープライズ販売。日本ではリクルート(スタディサプリ ENGLISH)、ベルリッツ、ECC、GABA がローカル既存プレイヤー。
Speak 2014 · Series C+ · 評価額 $1B+ · 2025 ARR $50M+
OpenAI Startup Fund · 韓国 + 日本主導

Connor Zwick と Andrew Hsu が創業。LLM 以前はフラッシュカードアプリだったが、2022-2023 に GPT-3.5 が出てきたタイミングで会話 AI チューターへ大転換。韓国先行の GTM が決定的だった — 韓国の大人英語学習者は支払いが安定。現在は日本、ベトナム、フランスへ拡張。

Duolingo Max 2023 ローンチ · Duolingo 有料層 · 約 $30/月
上場 ($DUOL) · 2024 売上 $748M · 有料層の転換が速い

Duolingo のプレミアム AI 層。Explain My Answer、Roleplay(ライブ AI 会話)、Video Call をバンドル。カジュアル学習者にとって無敵の組み合わせ — 1 億 + MAU のファネルが、年 40%+ で伸びる有料サブベースを養う。すべてのインディーチューターアプリの上にかかるダモクレスの剣。

Loora 2021 · Series A · $12M 調達
社会人英会話 · イスラエル発

テルアビブ創業、社会人の英会話に特化。仮説:GPT クラスの音声で入門レベル会話講師の仕事の 80% を代替できる、価格は 1/10。UX が強く有料ベースが伸びる、Speak の後を追う集団のトップ。

Lingvist 2014 · エストニア · 黒字インディー
アルゴリズム的語彙習得 · ニッチだがキャッシュを生む

タリン拠点、創業者 Mait Müntel は Skype 出身エンジニア。会話ではなくアルゴリズム駆動の語彙 SRS。MAU は小さいが、VC バックの同業より健康な利益体質。「強い単位経済を持つニッチ EdTech」は音声 AI に転換しなくても成立する、ということの証明。

Praktika.ai 2022 · Seed · YC W23
モバイル先行の AI アバターチューター

英国拠点、モバイル専用、AI アバターが会話を進行。アバター路線で Speak の音声のみ体験と差別化。「画面に顔がある」体感が本物の練習に近く感じられる新興市場で強い。

ELSA Speak 2015 · Series B · $15M 調達
発音特化 · 音素レベルのフィードバック

サンフランシスコ / ベトナムチーム。コンシューマーアプリで最も狭い領域 — 純粋に発音トレーニング、独自の音素分類モデル。本当の堀は LLM ではなく音響モデル。「私の韓国語の R を評価して」のようなユースケースは、汎用音声 AI に対して防御性が高い。

iTalki 2007 · 北京 → グローバル · 売上 $100M+(業界推定)
人間チューターマーケットプレイス · 平均 ~$15/時

世界最大の人間チューターマーケットプレイス。学生 500 万+、講師 3 万+。AI チューターが台頭した 2024-2025 に人間チュータリングはむしろ伸びた — 学生は AI を人間レッスンの代替ではなく合間のドリルとして使うから。競合ではなく補完。

Babbel 2007 · ベルリン · 売上 約 $300M · 上場
大人向け老舗ブランド

AI 以前の老舗。音声投入が遅く、2024-2025 に Duolingo Max + Speak にシェアを譲っている。それでも黒字、有料ユーザー 1,000 万+。反面教師:ブランドエクイティは時間を稼ぐが、AI ネイティブ競合とのプロダクトギャップが広がってくると、そう長くは稼げない。

🟢 青信号 · 参入を検討
大手が無視している非英語のペアを狙える

Duolingo と Speak は英語を最優先。ウクライナ難民向けのポーランド語、中国語話者向けの広東語、ディアスポラ帰国者向けのヘブライ語、インドネシア在住外国人向けのインドネシア語 — これらは大手があと数年は来ない過疎マーケット。$500K-$2M ARR の集中事業は現実的。日本人向けでは中国語、韓国語、ベトナム語、ポルトガル語(ブラジル系日系)のスロットが空いています。

コンシューマーアプリが無視している明確なユースケース

看護師向け医療英語、アジアの弁護士向け法律英語、退職者向け観光フレーズ、IELTS 試験英語、俳優のアクセント矯正。これらドメイン特化のチューターは $50-100/月を払う — コンシューマー床価格をはるかに超える。日本では TOEIC、英検、医師国家試験英語、技能実習生向け日本語などが該当。

支払いの良い地理を理解している

韓国、日本、中国、ベトナム、ブラジルは米欧より語学学習に確実に金を払う。Speak の ARR $50M はおおよそ 70% が非米。あなたまたは共同創業者がこのいずれかでトラクションを持つなら、本当のチャンスがある。「欧米向けに作る」なら、より弱い分配で Duolingo と戦うことになる。

🔴 赤信号 · 一旦保留
「汎用 AI 英語チューター」を作っている

Speak、Duolingo Max、Loora、ELSA、Praktika がこのスロットを取り合っている。資金潤沢な 5 社が真っ向勝負。6 番目の汎用英語アプリの楔はもうない。前進する道はバーティカルか地理特化のみ。

ビジネスモデルが「音声 AI は安いから安く売る」

価格競争は死の螺旋。Speak は $20/月で黒字。Duolingo Max は $30/月。低価格プレイヤーは推論、コンテンツ制作、マーケ、チャーン戦争の費用を負担できない。楔は価格ではない — 信頼、特異性、成果。

資金調達ができず、ニッチもない

このカテゴリのコンシューマーアプリは CPI / LTV の戦争 — Speak と Duolingo はそれを勝つために数億ドルを調達した。$500K のシードで汎用英語コンシューマーを戦うと、LTV が CAC に追いつく前に資金が尽きる。資本かニッチのどちらかが必須。

ニッチ言語ペア(軽資本インディー)

過疎言語のネイティブ/ニアネイティブのバイリンガル創業者

資金
$50K-$300K ブートストラップ
時間
$30K MRR まで 12-18 か月
GTM
500 万+ 話者がいて支配的アプリがない L1 → L2 ペアを選ぶ:ウクライナ人向けポーランド語、中国語話者向け広東語、日本人向け中国語など。そのペア専用の音声チューター + 独自カリキュラムを構築。ニッチコミュニティ(subreddit、Facebook グループ、海外コミュニティ)で配布。月額 $30 サブスク。目標:18 か月で 1,000 有料ユーザー。
バーティカルユースケース(B2B フレンドリー)

専門分野 + ESL 角度を持つ創業者(医療、法律、技術、ホスピタリティ)

資金
$300K-$1M シード
時間
最初の 50 法人席まで 9-15 か月
GTM
コンシューマーが触らない英語バーティカルを選ぶ:フィリピン人看護師向け看護英語、アジアのアソシエイト向け法律英語、カリブ海スタッフ向けホスピタリティ英語。ドメインエキスパートとカリキュラム共作。人材紹介会社、研修学校、雇用団体に B2B 販売。$30-$80/席/月、50-500 席の契約。目標:12 か月で $30K MRR。
資本駆動コンシューマー正面戦(フル VC ルート)

コンシューマーアプリ経験ある連続起業家 + 地理アクセス

資金
$3-$10M シード / Series A
時間
PMF まで 24-36 か月
GTM
Speak がまだ勝っていない地理で Speak と正面勝負。ベトナム、インド、ブラジル、インドネシア、メキシコがすべて該当。大量の有料 CPI 投資 + ローカライズドカリキュラム + K-12 や政府パートナーシップ。これは「Speak 型」の賭け — 真の資本と実証された実行が必要だが、賞金は本物(ARR $100M+)。
コンシューマーサブスク価格:$15-30/月が帯域。$15 未満では 2026 価格での音声推論コスト $0.10-0.20/会話時間で単位経済が崩れる。$30 超では、企業や試験対策バイヤーでない限りチャーンが急上昇。無料→有料転換:コンシューマーで 3-7% が健全、Speak はハイエンド近辺。月次チャーン:コンシューマー 6-12% が帯域、5% 未満は B2B か試験対策バイヤー前提。獲得コスト(有料):欧米成熟市場で $20-60、新興アジアで $5-20。LTV 目標:コンシューマー $80-200、B2B $400-1,000。音声推論コスト(2026 年):GPT-4o Realtime や Gemini Live でアクティブセッション 1 時間あたり約 $0.10-0.20、2023 年の $1-3 と比較。エンゲージメント目標:継続ユーザーで週 4-6 セッション、有料ユーザーで週 8+;週 2 セッション未満は 90 日以内にチャーン。インディーの MVP 期間:OpenAI Realtime API + シンプルなカリキュラムフレーム + 基本モバイルアプリで 6-10 週。ニッチバーティカルインディーが最初の $10K MRR に到達する時間:通常 9-15 か月、創業者がオーガニックな分配を持つ市場で。

今週の 5 つの具体的アクション

  1. Google Doc を開き、ニッチを 1 文で書き出す:「【特定の学習者】が【特定のアウトカム】のために【言語ペア】を学ぶ」。あいまいな名詞は負ける。「フィリピン人看護師が NCLEX-RN 合格のためにアメリカ医療英語を学ぶ」が勝つ。
  2. 今週中に OpenAI Realtime API か Vapi で 10 分の音声チューターのプロトタイプを作る。20 語のカリキュラムサンプルを与え、ターゲットニッチの友人 1 人に使ってもらう。摩擦面は巨大、堀は使いやすさから始まる。
  3. ニッチで潜在有料ユーザーを 5 人見つける。友人ではない。関連 subreddit や LinkedIn の見知らぬ人。聞く:X 特化のチューターに月いくら払いますか?彼らの答えがあなたの価格下限。
  4. 自分のスタックで音声推論コストを 1 時間あたりに見積もる。有料ユーザー 1 人あたりの月セッション数を掛ける。$20/月サブスクで単位経済が崩れるなら、ニッチが合っていない、もっと単価の高いバーティカルが必要。
  5. 分配の堀を列挙する。1 つのチャネル(韓国の大学とのコネ、フィリピン看護師フォーラムの管理人と友人、ラテン古典の先生のネットワーク)を指せないなら、分配のエッジはなく、有料獲得で勝負するとあなたが持っていない資本を燃やすことになる。少なくとも 1 つ持てるまでニッチを磨く。

読む価値あり

コミュニティ

フォローしたい人

隣接トラック

  • コホート型コース同じ教育、逆の形 — コホートはハイタッチ集団学習、AI チューターは 1on1 ローテッチ。両方を互いのファネルとして運用する事例あり。
  • クリエイター AI ツール音声と TTS のインフラが大きく重なる。多くの言語チュータースタックは同じ基盤音声モデルの上に乗っている。
  • YouTube多言語 YouTube チャンネルは、ニッチ言語チューターアプリにとって最も安い獲得チャネルになりうる。Easy Languages や Comprehensible Input チャンネル参照。

あなたはどんな創業者タイプ?

5 分 · 12 問 · 無料 · アーキタイプとマッチするトラック上位 3 つを表示

クイズを始める →
← ホーム 教育地図 →