شرکت SoundHound AI، یکی از پیشروهای هوش مصنوعی صوتی هست که در سال ۲۰۰۵ توسط کیوان مهاجر، یک دانشمند کامپیوتر و کارآفرین ایرانی-کانادایی تأسیس شد. این شرکت که دفتر مرکزیاش در سانتا کلارا، کالیفرنیا قرار داره، به صورت جهانی فعالیت میکنه و در کشورهای آمریکا، کانادا، فرانسه، آلمان و ژاپن حضور داره. SoundHound تخصصش در توسعه تکنولوژیهای پیشرفته تشخیص صدا، درک زبان طبیعی و تشخیص صداست. محصولات و پلتفرمهای اصلی این شرکت شامل:
- Houndify: یک پلتفرم هوش مصنوعی صوتی که به کسبوکارها اجازه میده رابطهای گفتگویی رو به محصولات و خدماتشون اضافه کنن.
- SoundHound Chat AI: یک دستیار صوتی که از تکنولوژی هوش مصنوعی تولیدی استفاده میکنه.
- Dynamic Interaction: یک رابط چندرسانهای در زمان واقعی که صدا، تصویر و لمس رو ترکیب میکنه.
- Speech-to-Meaning® و Deep Meaning Understanding®: تکنولوژیهای اختصاصی که دقت تعاملات صوتی رو افزایش میده.
موارد استفاده از تکنولوژیهای SoundHound
- خودرو: همکاری با تولیدکنندگان بزرگ برای تعامل صوتی در خودروها.
- رستورانها: سیستمهای سفارشگیری صوتی و درایو-ثروهای هوش مصنوعی برای زنجیرههای بزرگ.
- بهداشت و درمان: مدیریت قرار ملاقاتهای بیماران و خدمات بهداشتی دیگر.
- مالی: راهحلهای هوش مصنوعی صوتی برای خدمات مالی و بانکداری خردهفروشی.
- خردهفروشی: اکوسیستمهای تجارت صوتی و راهحلهای خاص خردهفروشی.
نقاط عطف تاریخی SoundHound
- ۲۰۰۹: تغییر نام اپلیکیشن کشف موسیقی Midomi به SoundHound.
- ۲۰۱۵: اولین سرویس شناسایی موسیقی که به خودروها اضافه شد و راهاندازی پلتفرم هوش مصنوعی صوتی.
- ۲۰۱۸: همکاری با شرکتهای بزرگ خودروسازی.
- ۲۰۲۲: اتمام ادغام SPAC و فهرست عمومی در Nasdaq (SOUN).
- ۲۰۲۳-۲۰۲۴: خریدهای استراتژیک و گسترش در رستورانها، خدمات مالی و بهداشت و درمان.
SoundHound جوایز متعددی دریافت کرده، از جمله جایزه وبی ۲۰۲۰ برای بهرهوری (صوتی) و “بهترین راهحل متصل سال” در برنامه جوایز AutoTech Breakthrough ۲۰۲۴. این شرکت از ۲۵ زبان پشتیبانی میکنه و میتونه لهجهها و تنوعهای زبانی منطقهای رو درک کنه، که خودش رو به عنوان یک رهبر جهانی در راهحلهای هوش مصنوعی صوتی برای کسبوکارها در صنایع مختلف معرفی میکنه.
تیم رهبری
تیم رهبری SoundHound AI، Inc. شامل افرادی با تخصص فنی عمیق، دیدگاه استراتژیک و تجربه گسترده در زمینه هوش مصنوعی صوتی، مهندسی و توسعه کسبوکار هست. اعضای کلیدی شامل:
- کیوان مهاجر – همبنیانگذار، رئیس و CEO
- مجید امامی – همبنیانگذار، مدیر علمی و SVP مهندسی
- جیمز هوم – همبنیانگذار و مدیر محصول
- مایکل زگورسک – COO
- نیتش شاران – CFO
- تیم استونهاکر – رهبر مهندسی
- امیر عربابی – VP توسعه کسبوکار
- مایکل اندرسون – EVP هوش مصنوعی برای شرکتها
- وارن کارپ – SVP حقوقی و مشاور عمومی
این تیم رهبری با ترکیب برتری علمی، تجربه صنعتی و تفکر نوآورانه، رشد و پیشرفتهای تکنولوژیکی SoundHound در بازار هوش مصنوعی صوتی رو هدایت میکنه.
تاریخچه ابزار هوش مصنوعی SoundHound
SoundHound . که در ابتدا به عنوان Melodis Corporation در سال ۲۰۰۵ تأسیس شد، از یک اپلیکیشن شناسایی موسیقی به یک ارائهدهنده پیشرو در راهحلهای هوش مصنوعی صوتی تبدیل شده. نقاط عطف کلیدی در سفر این شرکت شامل:
- سالهای تأسیس و اولیه (۲۰۰۵-۲۰۰۹): تأسیس توسط فارغالتحصیلان استنفورد کیوان مهاجر، مجید امامی و جیمز هوم و توسعه Midomi.
- گسترش و نوآوری (۲۰۱۰-۲۰۱۷): معرفی پلتفرم Houndify و رشد سریع پایگاه کاربری به بیش از ۳۰۰ میلیون کاربر.
- شراکتها و رشد (۲۰۱۸-۲۰۲۱): همکاری با شرکتهای بزرگ خودروسازی و گسترش کاربردهای تکنولوژی هوش مصنوعی صوتی.
- فهرست عمومی و تحولات مالی (۲۰۲۱-حال): اعلام برنامههای عمومی از طریق ادغام SPAC و فهرست شدن در Nasdaq.
محصولات و راهحلها
SoundHound AI یک مجموعه کامل از محصولات و راهحلهای هوش مصنوعی صوتی رو برای صنایع مختلف ارائه میده:
- اجزای هوش مصنوعی صوتی
- کلمات برند: کلمات یا عبارات قابل تنظیم برای افزایش ارزش برند و تعامل کاربر.
- تشخیص گفتار خودکار (ASR): تبدیل گفتار به متن به صورت دقیق و در زمان واقعی.
- درک زبان طبیعی (NLU): تفسیر مکالمات پیچیده با استفاده از تکنولوژی Deep Meaning Understanding.
- تبدیل متن به گفتار (TTS): صداهای دیجیتال قابل تنظیم متناسب با هویت برند.
- گزینههای اتصال: راهحلهای Edge، Cloud و Edge+Cloud برای نتایج سریع و دقیق.
- زبانهای متعدد: پشتیبانی از ۲۵ زبان با دقت بالا.
- تشخیص محتوای خودکار (ACR): تکنولوژی پیشرفته شناسایی موسیقی.
راهحلهای خاص صنعت
- خودرو: ادغام با مرسدس بنز، هیوندای، کیا و دیگران برای دستیاران صوتی در خودرو.
- رستورانها: راهحلهای درایو-ثرو و سفارشگیری تلفنی خودکار.
- خردهفروشی و مالی: اکوسیستم تجارت صوتی و دستیار صوتی هوش مصنوعی برای بانکداری.
- بهداشت و درمان: SoundHound Chat AI ادغام شده با خدمات بهداشتی.
فناوریهای اصلی
تکنولوژیهای اصلی SoundHound شامل چندین مؤلفه کلیدی و نوآوریهای اختصاصی هست:
- Speech-to-Meaning: پردازش گفتار و تفسیر معنی در یک مرحله، بدون نیاز به مراحل دوگانه سنتی.
- Deep Meaning Understanding: درک زمینه و سوالات پیچیده، پاسخ به چندین پرسش به طور همزمان.
- Dynamic Interaction: رابط چندرسانهای که بازخورد صوتی و تصویری در زمان واقعی ارائه میده.
- Extensive Domains: پشتیبانی از بیش از ۱۲۵ دامنه درک، فراتر از رقبایی مثل سیری و گوگل.
رقبای صنعتی
SoundHound AI در بخش نرمافزار کاربردی در صنعت فناوری اطلاعات فعالیت میکنه. رقبای مستقیم و همصنعتی شامل:
- Valyant AI: تخصص در هوش مصنوعی گفتگویی برای رستورانهای سریع.
- Resemble AI: تمرکز بر تکنولوژیهای صوتی هوش مصنوعی تولیدی و شناسایی صوتی دیپفیک.
- Picovoice: ارائه پلتفرمی برای ویژگیهای صوتی سفارشی مثل تبدیل گفتار به متن.
- Mycroft AI: تخصص در تکنولوژی دستیار صوتی متنباز.
این شرکتها به طور مداوم در حال رقابت در بازار هوش مصنوعی صوتی هستن و هر کدوم در زمینههای خاص خودشون تخصص دارن.
منبع : aipathly