Indiában minden adott ahhoz, hogy a hang legyen a „következő billentyűzet” — csak épp a nyelvek, a kevert beszéd és a fizetési hajlandóság pont ott tesz keresztbe, ahol a legtöbb AI-startup gyorsan skálázna.

Mi történt

A Bay Area-i Wispr Flow hangalapú, AI-val támogatott szövegbeviteli szoftvert épít, és azt állítja, hogy India lett a leggyorsabban növekvő piaca. Ez azért érdekes, mert a hangalapú AI-termékek az országban még korai, széttöredezett fázisban vannak: sok a használati szokás (hangüzenet, hangalapú keresés), de nehéz belőlük egységes, fizetős terméket csinálni.

A cég India-fókuszú lépései több irányból jönnek egyszerre. Először is a Hinglishre (hindi–angol keveréknyelv) ment rá: idén béta tesztet indított egy ilyen hangmodellel, és a tapasztalatok alapján gyorsult a növekedés. Másodszor Androidon is megjelent — ez Indiában a domináns mobilplatform —, miután korábban Macen és Windowson indult, majd 2025-ben iOS-re is kiterjesztette a támogatást. Harmadszor lokális árazást vezetett be: éves csomagban havi ₹320 körüli díjjal, ami jóval alacsonyabb a globális, kb. 12 dolláros havi árnál.

Miért fontos

A hangalapú AI Indiában nem csak „kényelmi extra”. Gondolj rá úgy, mint egy univerzális beviteli rétegre: ha a telefonon és az üzenetküldőkben amúgy is beszélsz, akkor a következő logikus lépés, hogy a beszéd közvetlenül szöveggé, parancsokká és szerkeszthető tartalommá váljon — gyorsabban, mint gépeléssel. Csakhogy Indiában a valós beszéd ritkán „tiszta” egyetlen nyelven: a mondaton belüli nyelvváltás (code-switching) mindennapos. Egy hangfelismerő modellnek ilyenkor nem elég „tudni hindiül és angolul”, azt is értenie kell, mikor melyik nyelv szabályai szerint értelmezzen hangokat, szavakat, neveket és rövidítéseket. Ehhez jön a monetizáció: a tömegpiac eléréséhez sokkal alacsonyabb ár és szélesebb készüléktámogatás kell.

Mire figyelj

  1. Többnyelvű váltás a gyakorlatban: a következő 12 hónapra tervezett bővítésnél az lesz a döntő, mennyire természetesen tudsz majd angolról más indiai nyelvekre váltani beszéd közben, és ez mennyire marad pontos zajos, hétköznapi környezetben.
  2. Ár és terjesztés: a célként említett ₹10–20/hó szint már tömegpiaci logika — itt az a kérdés, milyen üzleti modell (pl. csomagok, partnerségek, vállalati keresztfinanszírozás) tudja ezt fenntarthatóvá tenni.
  3. Használat a „munka” után: a cég azt látja, hogy a fókusz egyre inkább személyes appokra (pl. üzenetküldés, közösségi felületek) tolódik. Ha ez stabil trend, az erős jel arra, hogy a hangbevitel nem egy szűk produktivitási eszköz marad, hanem általános felhasználói szokássá válik — viszont ezzel együtt nő a hibák és a félreértések tétje is.

A TechCrunch-nak nyilatkozó vezérigazgató, Tanay Kothari ambíciója („mindenki használhassa”) jól mutatja, hogy itt nem egy prémium réteg finomhangolásáról, hanem egy nyelvileg sokszínű tömegpiac meghódításáról beszélünk — és ez a hang-AI egyik legkeményebb valóságtesztje lehet.