联系我们合金采样电阻贴片采样电阻保护元件FAE

品质诚信服务

当前位置:首页 >> 产品和行业资讯 >> 如何使用音频估计与说话用户的距离并识别周围的声音

如何使用音频估计与说话用户的距离并识别周围的声音

最新研究表明,苹果公司正在研究HomePod或其他设备如何使用音频来估计与语音用户的距离并识别周围的声音。

Apple的HomePod已经非常擅长听取您的声音,即使它正在大声播放音乐。

苹果公司有两个单独的新专利申请,它们表明苹果公司希望对其进行改进,并将设备的聆听能力提高到一个新的水平。

其中之一是“基于学习的距离估计”。

不仅涉及使用音频来识别用户,还包括确定他们在哪里。

该专利申请说:“通常,该设备期望使用[其]紧凑的麦克风阵列来估计从该设备到用户的距离”。

例如,设备可以基于从用户到设备或从智能辅助设备的估计距离来调整回放音量。

回应”。

续:“因此,如果用户离设备非常近,它将不会播放很多音乐或声音”。

或者,如果用户离得很远,则可以将媒体播放或智能助手设备的响应调整为更大的音量。

“相同的想法还意味着将其引入Apple当前令人印象深刻但有些缺陷的系统中,在该系统中,所有设备都将尝试确定您对“嘿,Siri”说的是什么。

苹果说:“在具有多个设备的应用程序中,这些设备可以相互协调或仲裁,以根据从每个设备到用户的距离来确定是否回答来自一个或多个设备的查询。

“ Apple已经提出了简单和更复杂的解决方案,并且它们都可以同时使用。

比较简单的方法是让设备执行HomePod工作并首先绘制其环境图。

然后,它实际上具有“在声学环境中”。

测量点或模拟点的网格”。

在这种情况下,可以将声音与该“网格”进行比较。

粗略了解演讲者的位置。

但是,Apple认为这本身还不够好,而且据说至少与Siri一起使用。

那是因为一个人讲话时可能会移动并且他们需要快速反应,因此该建议不适合。

备选地,然后,“如果至少两个麦克风阵列可用”,则“可以使用三角测量法来估计语音源的距离”。

但是,这里的关键部分是至少需要两个带有麦克风的设备。

因此,Apple提供了涉及更多的另一种解决方案,其涉及“基于学习的系统,例如深度神经网络(DNN)”。

并且不需要多个设备。

该专利申请说:“深度学习系统可以基于紧凑型麦克风阵列接收的语音信号来估计每个时间帧中语音源的距离。

该DNN系统可以做的是确定什么是语音和什么是背景噪声。

然后,它可以计算“关于直接信号传播的信息”。

和“混响效果和噪声”。

该申请归功于三位发明家,包括MehrezSouden和Joshua D. Atkins。

他们先前的相关工作包括一项专利技术,该技术如何使用比普通麦克风少的声音来录制完整的空间声音。

这尤其涉及AppleAR中的音频。

最新的专利申请涉及真实环境中的物理学。

设备。

但是,如果只是为了避免太大声的HomePodmini弄伤别人的耳朵,还有很多事情要做。

该专利申请说:“例如,辅助助听器和增强型助听器(例如助听器)可以基于语音源的距离来增强音频信号。

“这也是第二个新发布的专利申请的重点。

识别重要的声音“一种基于所观察到的声音来识别声源的系统和方法”。

是关于让某些设备识别其他声音并响应我们。

专利申请开始了:“许多家用电器,例如微波炉,洗衣机,洗碗机和门铃,会发出声音提醒用户该设备的状况已经改变”。

它继续说:“但是,由于各种原因,用户可能无法听到家用电器发出的声音警报。

“例如,用户可能听力受损,用户可能在室外或在另一个房间中,或者设备可能发出被家庭声学场景遮挡的声音。

“不必一定是您的煮蛋计时器已关闭。

该专利还涉及“公共场所(政府建筑物),半公共场所(办公厅)和私人场所(住宅或办公大楼)”中的声音。

它说:“(这些)也有声学场景,其中可能包含信息性声音。

“例如,铃,铃或蜂鸣器可能指示门已打开或关闭,或者警报器可能会发出警报声。