音频讲座

音频讲座

VOIP中的语音前处理技术

对端数据传输过来，解码。混音、播放。
本地讲话、采集、3A前处理、编码，网络传输到对端
实现了两端、多端通话

前处理核心算法

- 音频讲座

回声消除

房间1 通过自己麦克风采集传到房间2
房间2 听到了房间1的人话，但是2也会采集到播放出来的1点声音，
这样传输到1,1听到了回声。
播放信号与采集信号对齐，做AEC
全双工
同时讲话，都能听到
做的不好，只能单工
- 对齐后，用自适应滤波器做滤波
– 智能音箱不需要对齐？
-手机的播放和采集都有时钟控制，不需要对齐
- voip 是从app 拿信号，所以要自己做对齐
- 使用采集时间戳做粗对齐
- webrtc 根据能量信号做查找对齐
- webrtc的不太准，有时候
- 所以用指纹对齐，更稳定

自适应滤波器的收敛速度

双讲判断? 导致发散
现在控制步长/因子，不会发散
自适应滤波器后面加一个NLP处理
双讲通透性
-

-

– 手机俩麦克风是用来降噪的

-

语音降噪 ANC

单通道
时域变换到频域
噪声估计方法
–
倾向于能量最小值追踪，最简单

–
- 音频讲座

找不同，与语音信号的不同

– webrtc只降高频，webrtc又拖尾

– 解决拖尾

–
瞬时噪声
单声道降噪
要控制麦克风的增强

–

AGC 的数字部分

-

–
-

语音增强

–
-

–
-

–

–
-

–

-

–

–

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode