主页 > 资讯 > 正文

出门问问语音技术加持 Insta360 X3 新一代旗舰 重新定义运动相机

  近日,全球知名智能影像品牌影石 Insta360 发布新一代专业级旗舰相机 Insta360 X3。作为 Insta360 系列产品的长期语音技术合作伙伴,继今年8月上市的 Insta360 Link 之后,出门问问AI算法再次加持 Insta360 重磅专业级旗舰新品,通过内置4麦阵列、全景声、AI降噪、自动增益、人声增强、语音识别等技术,保证 Insta360 X3 在运动场景及嘈杂环境下依然保持高质量的音频效果。

图片1.jpg

  作为影石全景运动相机旗舰产品,「X系列」面世后重新定义运动相机,至此历经4年,迎来第三代更新。经过不断迭代打磨的X3,将全景影像、防抖科技与运动拍摄创新结合,并提升AI语音的用户体验,以出门问问加持的全新语音控制,轻松实现语音指令,并使用出门问问全新升级的48K音频增强算法,为用户带来“声临其境”般的听觉盛宴。

  出门问问语音识别与降噪算法

  赋能 Insta360 X3 专业级旗舰相机

  出门问问 TicHear™ 为保证语音质量的清晰优质 ,全新升级到48K高采样率音频处理引擎,为 Insta360 X3 带来身临其境般的听觉盛宴,并充分利用麦克风阵列前端+深度学习降噪协同来增强语音质量。

  Insta360 X3 搭载了4颗高性能的MEMS麦克风来配合 TicHear™ 工作,形成多个垂射阵列方向的波束成形器,来实现4指向的全景声、增强目标方向上的信号,同时抑制非目标方向上的信号,波束形成对于抑制噪音干扰和抑制混响方面都有一定的效果 。

  为了实现更出色的运动表现,风噪处理是不可避免的问题。Insta360 X3 搭载出门问问 TicHear™ 引擎,内置深度神经网络降风噪功能。关于风噪压抑算法,在常规的降风噪算法中,再引入自研的深度神经网络降噪引擎,可进一步压制平滑多种风噪,同时采用海量风噪标注过的数据作为样本,通过机器自主进行样本数据集学习处理模型和模型参数,在特定场景以及瞬时非平稳情况下均可以获得比传统方法更好的效果。

图片2.jpg

  为了实现更出色的语音控制表现,Insta360 X3 内置出门问问 TicHear™ 引擎的Always-on voice 模块,结合麦克风阵列前端处理,并优化了训练方式和丰富数据集,保证了低信噪比场景下语音识别的准确性。同时使用级联的结构,在保持高召回率的前提下,将误唤醒压到最低。

  外部带噪语音进入麦克风之后,会经波束成形、噪声压制、自动增益控制(AGC)和动态范围控制(DRC)和音频均衡器(EQ)等一系列算法处理,最终输出清晰的HiFi级别立体声48K音频,极大提升宽容度,并同时保证远场拾音和自然度和还原度。

  出门问问语音技术持续升级  

  加持专业级产品体验

  基于出门问问在智能穿戴算法方面的领先优势,产品支持使用中英文唤醒词来唤醒语音助手,辅以通话降噪、快捷口令等功能,让用户随时随地体验语音交互带来的高效数字生活服务。除旗舰新品 Insta360 ONE X3之外,Insta360 ONE R系列、GO2 系列、ONE RS系列、ONE X2系列、Insta360 Link系列 等 Insta360 产品,均搭载出门问问 TicHear™ 解决方案,实现产品的质优体验。

  出门问问 TicHear™ 解决方案包含完整的信号处理与识别的技术栈,获得的成果频频得到合作伙伴们的高度赞许。目前,出门问问将 TicHear™ 整套算法移植到自家无线音频芯片M510系列芯片上,利用M510系列芯片先进制成及特有的流水线设计,如并行指令、长指令等进行了大量汇编级别优化,使之占用更低的内存和功耗,以满足客户对能耗的高要求。

  出门问问M510软硬一体无线智能音频芯片 实现产品化落地量产

  除 Insta360 之外,目前出门问问已携手大众汽车集团、vivo、一加、三星、高通、BES、ASR、RTL等业界头部合作伙伴,将前沿语音技术落地在车载、智能手表、真无线耳机、智能手机、直播和会议类、专业相机、笔记本电脑、智能家居等诸多领域。出门问问一直以定义下一代人机交互为使命,不断加持专业级产品体验,赋能以语音交互为主的技术落地场景。