ElevenLabs是一家剛剛完成1.8億美元融資的人工智能初創(chuàng)公司,主要以其音頻生成能力而聞名。該公司通過推出首個獨立的語音轉(zhuǎn)文本模型Scribe,邁出了另一個技術(shù)方向。該初創(chuàng)公司估值為33億美元,已幫助許多其他公司提供語音轉(zhuǎn)文本服務(wù),利用其龐大的聲音庫。然而,該公司現(xiàn)在希望進入語音檢測領(lǐng)域,與Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型競爭。
美國第一國民銀行 (FNBO) 與語音安全專家 Pindrop 合作,采用創(chuàng)新技術(shù)來識別和驗證客戶身份。通過結(jié)合云端欺詐檢測和身份認證系統(tǒng),FNBO 實現(xiàn)了無摩擦的客戶驗證,提高了安全性和用戶體驗。該銀行還在測試新的深度偽造檢測功能,以應(yīng)對日益嚴重的 AI 語音欺詐威脅。這種合作體現(xiàn)了銀行業(yè)應(yīng)對網(wǎng)絡(luò)犯罪挑戰(zhàn)的新趨勢。
在顯示技術(shù)上,Orion采用了碳化硅鏡片和先進的光波導技術(shù),結(jié)合Micro LED投影儀,提供了70度的視場角,這在小型AR眼鏡中是前所未有的,為用戶提供了更為沉浸式的體驗。
多模態(tài)AI系統(tǒng),融合語音對話和音頻分析功能,支持超過8種語言和方言,無需自動語音識別即可進行語音交互,提供音頻信息分析和多語言支持。
國際頂級學術(shù)會議ACM SIGKDD(國際數(shù)據(jù)挖掘與知識發(fā)現(xiàn)大會,KDD)正于美國華盛頓召開。會上,火山語音多篇論文被KDD 2022 Research track接收并發(fā)表,創(chuàng)新性地提出基于語音合成來有效攻擊語音識別系統(tǒng)的新技術(shù)路徑,用于高效并準確發(fā)現(xiàn)語音安全領(lǐng)域的新漏洞。