使用微信扫一扫分享到朋友圈
深度盘点实时互联网行业大事件、深入洞察实时互动产业发展、前瞻分享实时音视频技术趋势、积极探索实时互动公益价值……实时互动行业的多位资深大咖将从多个维度深入解读2022年实时互动产业的发展与前瞻。
聚享万象
Dissecting The Metaverse
感知实时互联网
Promoting Youth Well-being through Technological Innovation
数字化领航:如何打造高效能、创新力的企业?
聚焦音频算法、技术在实时互动场景的落地实践,探讨音频相关的 音频 AI 算法与传统算法的融合,音频 AI 算法模型在手机端、芯片层面的优化现状与未来。同时,从多种场景视角出发,分享音频技术的落地经验,以及为用户带来的体验提升。
AI和传统信号技术在实时音频通话中的应用
在实时语音通信中,通常3A技术为基本的音频处理基础。随着人工智能的发展,AI在音频处理方面扮演越来越重要的角色。AI和传统信号处理技术都有其优势和局限性,在实际系统中如何有效的进行结合,发挥各自的优势,改善整体系统的性能。本次分享会重点介绍各技术的特性和如何有效的进行融合。
元宇宙场景下空间音频的工程落地
随着虚拟现实(VR)/混合现实(MR)技术的快速发展以及众多元宇宙场景的落地,基于耳机的空间音频在沉浸式体验中显得是格为重要。空间音频实际上是仿真一个真实声源产生声音,传播以及被人耳接收的过程。如何用有效地模拟这一个过程,让 3D 音频沉浸式地再现,是空间音频的主要研究和发展的方向。除此之外,如何有效地渲染大规模的声源是一个值得讨论的问题。
基于深度学习的语音降噪和去混响
噪声抑制和去混响算法可消除视频会议、语聊房、游戏语音等众多场景中的背景噪声和混响干扰,提升复杂场景下的实时互动体验。本次分享主要介绍降噪和去混响的应用场景和技术演进、声网AI降噪和去混响系统的设计方案、性能特点、增强效果和竞品对比等。
基于深度学习的语音增强技术新进展
在深度学习的推动下,基于数据驱动的语音增强技术已经逐步在各种应用中落地。本报告在回顾基于深度学习语音增强技术的发展脉络的基础上,重点探讨当前新技术发展,包括基于复数谱、多阶段增强方案,基于声纹先验的目标说话人提取,基于深度学习回声抑制等。同时对未来发展趋势进行展望。
NaturalSpeech: 构建人类水平的语音合成系统
近年来,文本到语音合成(Text to Speech, TTS)取得了较大进展,受到了业界的广泛关注。如何构建高质量的语音合成系统,达到和人类录音相当的水平,一直是领域从业者追逐的目标。在本次报告中,我将介绍微软在构建人类水平的语音合成系统方面的努力。首先,我将回顾当前语音合成领域的研究现状,然后对人类水平提出了详细的定义和评测方法,并且评测了当前的语音合成系统,发现它们均不能达到人类水平。接着,我将介绍微软构建的NaturalSpeech语音合成系统,在LJSpeech数据集上的评测结果显示,NaturalSpeech达到了人类录音水平。最后,我将介绍语音合成的研究挑战和未来研究方向。
流媒体音质全链路分析
在以声音为主要媒介的应用中,音质是核心的考核指标,例如语音直播、音乐流媒体平台、音频点播类的应用。本次分享通过解构直播类和流式点播类两大应用场景中端到端的链路环节,分析影响音质的各个要素并介绍保障高音质的相关实施技术细节。
音频信号的盲源分离
鸡尾酒会问题是指说人可以在复杂的声学环境中将注意力集中在某一个感兴趣的声音而忽略掉其它声音。如何使得计算机能像人一样从混合音频信号中提取出各个说话人的声音信号是一个非常有趣的问题并且具有潜在的重要应用价值。目前,该问题的研究取得了一些不错的进展,但距离彻底解决可能还有漫长的道路要走。本报告将简要综述模型驱动和数据驱动的音频盲源分离研究进展。对于前者,我们将介绍ICA/IVA/ILRMA/MNMF/CTF-MNMF的基本原理和思路;对于后者,我们将介绍现状的基于深度学习的单通道语音分离方法并讨论其存在问题。
多媒体智能硬件中的声学系统基础研究
人工智能产业领域的技术着眼点会更关注算法和数据,但是随着技术的落地,不可避免的要涉及到硬件产品的基础体验问题。而人工智能硬件和传统具有音频功能的硬件有着较大的差异,本次分享从声学硬件系统的角度来剖析各硬件指标及技术对于语音交互体验的影响,探讨智能硬件及嵌入式系统上的声学性能实现和优化的相关话题。
圆桌:实时互动音频的下一个五年
本技术专场,不仅会探讨新一代视频编解码技术的落地实践、AI 在视频编解码中的应用,还会围绕 AR、全景视频、实时视频传输等场景,分享背后的技术落地、前沿研究。
Software or Hardware encoding for RTE video experiences?
RTE场景下高清能力迭代升级的若干关键问题
在RTE场景下,进行高清能力的升级面临不少技术问题。在落地诸如H.265或者AV1等下一代codec的过程中,需要在端上以及整个传输框架上进行整体的适配。另外,针对codec的特点,对其适用范围也应有所限制。同时,基于RTE场景下应用终端在网络/算力等方面分布不均衡的前提,如何动态自适应地调整应用方案,以最合适的方案组合输出最优的视频体验,是高清能力迭代中无法避免的关键问题之一。本次分享将以H.265在RTE场景落地为例,基于声网的经验,对这些关键问题进行分析解构。
HDR视频处理与质量评价
RTC 场景UHD视频应用和探索
单目2D 摄像头面捕技术的应用
为实现高精度面捕,苹果ARKIT使用了结构光3D摄像头,笨笨网络通过先进的AI算法也能实现一模一样的对标效果。同样,在姿态动捕领域,笨笨智能通过持续不断的迭代,一样能提供不输于穿戴动捕进度的姿态捕获效果。本次重点分享笨笨智能如何基于单目视觉AI技术,为业界提供高精度,低门槛的面捕及动捕解决方案。
OPPO实时视频传输全链路的关键技术与思考
基于人工智能的拥塞控制算法
在实时音视频通信中,为了达到低延时高质量的传输效果,拥塞控制算法至关重要。而传统的拥塞控制算法在应对一些网络变化时往往表现不尽人意。近年来人工智能算法的兴起给拥塞控制算法的演进提供了一个新的方向,基于人工智能的拥塞控制算法也被越来越多的讨论和研究。本次分享主要介绍了现有的一些基于人工智能的拥塞控制算法,以及在实际场景中应用的一些方案。
基于单目的三维人体重建方法
使用单张RGB图片进行人体表示,从而进行人体姿态和形状估计,已成为计算机视觉领域的一个新兴研究课题,其广泛应用于主流增强现实、虚拟现实、人机交互等技术中。然而,由于人体的非刚性结构以及在高度自由的姿态和不同视角下的灵活性,使用单张图片预测人体的姿态面临着诸多挑战。本次介绍着重分享主流的人体表示方式和其具体的应用流程。
多年来,开源文化始终迸发着蓬勃的生命力,它是技术向前发展的重要驱动力之一。在这个专场中,我们一起来聊聊开源项目的落地、商业化,以及开源文化的方方面面。
从页面录制到Web云原生应用
声网在2020年推出了一个新型的录制业务-页面录制,有别于主流的RTC频道内的音视频录制服务,页面录制与RTC解耦且可以录制任何的网页内容,而网页由于方便易上手的开发特性使得该产品拥有强大的定制化及快速上线特性,深受国内外用户喜爱,而该服务稳定运行至今2年我们开始从中提炼通用的系统层技术能力,如云端WebView,虚拟桌面、虚拟音频驱动、WebGL离屏渲染等构件一个高度定制化的WebApp微服务架构,拓展了WebRTC的音视频体验提供了更丰富的用户场景能力支持。
基于开源 YoMo 框架构建“全球同服”的 Realtime Metaverse Application
在前不久结束的SIGGRAPH 2021中,NVIDIA向公众展示了最新的AI技术在计算机图形学中的应用。而在这些技术中,又以如neural radiance cache、GauGan等DeepLearning技术尤为引人注目。本报告将为大家简介NVIDIA近期的DeepLearning应用成果。同时,为提升神经网络的实时推理能力,NVIDIA还在最新的Ampere架构及相关SDK中,进行了一增两减。一增,是指在Ampere架构中,通过引入新一代Tensor Core,来大幅提升计算性能。两减,一是通过引入结构化稀疏的特性,来降低冗余的计算开销;二是通过新版本的SDK来支持QAT等量化方式,在确保结果精度的前提下,使用定点数值降低推理过程中的计算开销。
和社区共建一个好看、好用、好改的开源教室
FreeSWITCH开源与商业应用
面向实时互动的网络架构、传输、边缘云计算等话题,始终是直播、娱乐、教育,甚至 IoT、元宇宙等领域在业务发展过程中需要关注的技术点。本专场将分享实时边缘云架构、Severless、架构演进等话题。
RTE场景下的serverless架构挑战与实践
SD-RTN™ 架构演进:解锁同频道超千人实时互动新场景
声网自研传输层协议AUT演进之路
元宇宙实时互动架构——分布式实时数据服务
实时互动技术已经被应用于多个行业的上百个场景中。然而不同的场景在应用开发落地过程中,都会遇到不同的难题。本专场围绕社交、娱乐、元宇宙、游戏、IoT 等行业中的实时互动场景,邀请多位技术专家分享他们在场景落地过程中总结的实践经验、迈坑经历、技术选型。
如何在元宇宙里举行一场派对
小红书直播业务端到端体验优化的工程实践
虚拟角色的创作闭环与业务迭代
协同空间在AR领域的全新探索
天准低延时平行驾驶系统的落地应用
随着实时互动技术的快速发展与愈发成熟,开发者的关注点逐渐从技术能力本身转为如何落地最佳实践。本次以「开发者灵感之夜」为主题的 Workshop,旨在围绕几个优秀的实操项目,分享和探讨如何利用声网的各种技术,构建和优化属于自己的实时互动应用。
用声网 SDK 构建元宇宙应用 Metalife
随着元宇宙的持续升温,越来越多的会议、展览、演唱会等线下活动搬到了线上,虚拟活动已逐渐渗透各行各业,并持续改变着用户的社交习惯和心智。通过声网 RTE 技术为仿真世界赋能,提升临场感,从传统意义的“在线”迈向“在场”。本次分享以元宇宙应用 MetaLife 为例,介绍声网 SDK 如何为元宇宙场景赋能。
一个月快速落地一款看房应用
本次分享主要以参赛作品「SuperRent 随心租」为例,分享一款产品如何在一个月内,快速完成从立项到发布上线的全流程。其中包括如何划定产品边界,如何进行技术选型,如何配置研发资源等等。
基于 Flat 白板项目快速开发在线互动小游戏的实践
声网 Flat 开源项目提供了白板 SDK,支持开发自定义 App,为在线教育和白板应用提供了巨大的想象空间。本次分享从一个初次接触 Flat 的开发者的视角出发,介绍互动白板的特点,并以一款互动小游戏为例,分享小游戏前后端框架的选择与使用、整体架构的设计思路和开发流程等。分享也会介绍一些实用的 window-manager APIs,并结合实战说明这些 APIs 如何快速解决一些原本比较复杂的问题。
后疫情时代,RTE行业迎来爆发,元宇宙持续升温,面对增长的线上实时互动需求,声网也在不断精进技术,丰富RTE产品版图,以契合开发者与客户多样化的创新需求。本次声网 Product Channel不仅会带来RTE行业最前沿的产品及解决方案发布,也将分享声网对RTE-PaaS未来发展的思考。
次世代实时互动社交
声网 RTC Next Gen SDK 为下一代场景而生
RTM2.0因元宇宙而生
声网灵隼专注音视频硬件「一站式」开发
声网融合协作赋能数字化转型
直播体验进化
环信超级社区2.0
在庞大的市场需求、利好政策的推动下,职业教育不仅吸引了大批资本注资,还迎来一众玩家入局,职业教育赛道将迎来用户、规模双增长时代。在产业升级和技术变革的大趋势下,人工智能、大数据、互联网等数字技术的突破也为职业教育市场带来了更多新的增长点,职业教育赛道将迎来“黄金发展期”。
中国职业教育趋势及未来发展
直播互动助力职业教育机构破局
探寻技术驱动力,坚守在线教育初心
职业教育如何在存量市场中生存
行业转型升级下,职业教育的终局在哪?
数字化转型已成为大势所趋,借助应用大数据、人工智能、物联网、RTE等新一代数字技术,帮助企业加速业务优化升级和创新转型。本场论坛,声网将携手金融、医疗、工业、企业协作等领域的大咖一起探讨数字化转型还有哪些新趋势与机遇,RTE在数字化转型中又将扮演怎样的关键作用?
数字化转型的核心:连接、开放、共生
金山会议助力企业数字化办公转型
从数据到价值 众安数智化路径实践与思考
AR构建工业元宇宙
数字孪生开启产业元宇宙应用新时代
随着5G、云计算、RTE等技术的高速发展,国内物联网从概念萌芽,到场景化互联,已不是虚无缥缈的概念,尤其是RTE + IOT的 结合,为家居、穿戴、机器人等场景带来更高效率、更高质量的互动。本场论坛,声网将同IoT内的行业大咖一起深度探讨 IoT + RTE 的进化与浸化。
实时互动 万物互联-实时互动助力产业数字化发展
无远弗届,音视频物联网的进与浸
实时音视频赋能智能家居情感连接
未来生活虚实交互新体验
无人机领域的物联网应用和趋势
清洁机器人的智能化发展
伴随着资本和科技的浪潮,元宇宙社交已然成为互联网巨头角逐的新战场,也为逐渐内卷的泛娱乐社交“出海圈”提供了切入市场的新机会。那么,“元宇宙+社交”,这种模式到底有多大的可行性和想象空间?我们应该如何认识、看待及追逐这个潮流? 在泛娱乐社交出海的下半场,元宇宙社交究竟能为企业出海带来怎样的机遇及价值?
次世代实时互动社交
音视频社交:找到复制密码,打造超级产品
Audio Social APPs are Evolving
虚拟内容时代-元宇宙从UGC到AIGC
圆桌:要“花样”,又要“增长”,社交出海下半场怎么玩?
8家RTE赛道创业者将在这里角逐三强,展示RTE最创新的场景应用和最前沿的技术。
开场致辞及评审规则介绍
第二届 RTE 场景创新大赛决赛国内团队路演
声网及五源资本联合发起的超音速计划2022年度八强
第二届 RTE 场景创新大赛决赛海外团队路演
北美及亚太赛区startup battlefield 优胜项目
炉边对话:同舟仍共济,再探新蓝海
第二届 RTE 场景创新大赛三强揭晓及颁奖
敬请期待
声网致力于构建开放供应的生态系统,与合作伙伴共同带给客户最佳选择,打造实时互动“超级共创加速器“。生态论坛将围绕孵化生态、伙伴生态以及产品生态,探讨RTE行业的生态化发展、RTE与伙伴能力共同赋能客户的最佳实践等内容。
打造RTE超级共创加速器:连接、共创、赋能
主题圆桌-超级共创,生态连接
Panel:实时互动新物种
聚合新“声”量 打造实时互动技术新生态
声网云市场,构建RTE生态
Panel:内容互动融合助力实时互动场景价值创新
业务共鸣 探索实时互动业务新生态
Panel:新场景、新需求,面向实时互动新方向
聚享万象
Dissecting The Metaverse
感知实时互联网
Promoting Youth Well-being through Technological Innovation
数字化领航:如何打造高效能、创新力的企业?
AI和传统信号技术在实时音频通话中的应用
元宇宙场景下空间音频的工程落地
李嵩,声网音频算法工程师。德国汉诺威大学博士,主要从事空间音频,心理声学和耳机主动降噪的算法研究。参与过 HRTF 快速测量、虚拟声外化感提升、基于 VR 的空间音频、耳机主动降噪等项目。共发表了20余篇学术论文,拥有6项专利。2021 年加入声网,主要负责空间音频算法研究,包括双耳声实时渲染、增强立体感和沉浸感等。
基于深度学习的语音降噪和去混响
基于深度学习的语音增强技术新进展
NaturalSpeech: 构建人类水平的语音合成系统
流媒体音质全链路分析
音频信号的盲源分离
多媒体智能硬件中的声学系统基础研究
圆桌:实时互动音频的下一个五年
Software or Hardware encoding for RTE video experiences?
RTE场景下高清能力迭代升级的若干关键问题
HDR视频处理与质量评价
RTC 场景UHD视频应用和探索
单目2D 摄像头面捕技术的应用
OPPO实时视频传输全链路的关键技术与思考
基于人工智能的拥塞控制算法
基于单目的三维人体重建方法
从页面录制到Web云原生应用
基于开源 YoMo 框架构建“全球同服”的 Realtime Metaverse Application
和社区共建一个好看、好用、好改的开源教室
FreeSWITCH开源与商业应用
RTE场景下的serverless架构挑战与实践
SD-RTN™ 架构演进:解锁同频道超千人实时互动新场景
声网自研传输层协议AUT演进之路
元宇宙实时互动架构——分布式实时数据服务
如何在元宇宙里举行一场派对
小红书直播业务端到端体验优化的工程实践
虚拟角色的创作闭环与业务迭代
协同空间在AR领域的全新探索
天准低延时平行驾驶系统的落地应用
用声网 SDK 构建元宇宙应用 Metalife
一个月快速落地一款看房应用
基于 Flat 白板项目快速开发在线互动小游戏的实践
次世代实时互动社交
声网 RTC Next Gen SDK 为下一代场景而生
RTM2.0因元宇宙而生
声网灵隼专注音视频硬件「一站式」开发
声网融合协作赋能数字化转型
直播体验进化
环信超级社区2.0
中国职业教育趋势及未来发展
直播互动助力职业教育机构破局
探寻技术驱动力,坚守在线教育初心
职业教育如何在存量市场中生存
行业转型升级下,职业教育的终局在哪?
数字化转型的核心:连接、开放、共生
金山会议助力企业数字化办公转型
从数据到价值 众安数智化路径实践与思考
AR构建工业元宇宙
数字孪生开启产业元宇宙应用新时代
实时互动 万物互联-实时互动助力产业数字化发展
无远弗届,音视频物联网的进与浸
实时音视频赋能智能家居情感连接
未来生活虚实交互新体验
无人机领域的物联网应用和趋势
清洁机器人的智能化发展
次世代实时互动社交
音视频社交:找到复制密码,打造超级产品
Audio Social APPs are Evolving
虚拟内容时代-元宇宙从UGC到AIGC
圆桌:要“花样”,又要“增长”,社交出海下半场怎么玩?
开场致辞及评审规则介绍
第二届 RTE 场景创新大赛决赛国内团队路演
第二届 RTE 场景创新大赛决赛海外团队路演
炉边对话:同舟仍共济,再探新蓝海
第二届 RTE 场景创新大赛三强揭晓及颁奖
打造RTE超级共创加速器:连接、共创、赋能
主题圆桌-超级共创,生态连接
Panel:实时互动新物种
聚合新“声”量 打造实时互动技术新生态
声网云市场,构建RTE生态
Panel:内容互动融合助力实时互动场景价值创新
业务共鸣 探索实时互动业务新生态
Panel:新场景、新需求,面向实时互动新方向
声网直播产品负责人
声网 RTM 产品经理
曾创办码尚叮咚网络科技有限公司,为职教客户提供SCRM服务 多年在线教育从业经验,历任长投学堂技术中台负责人,海风教育学生端负责人。
李嵩,声网音频算法工程师。德国汉诺威大学博士,主要从事空间音频,心理声学和耳机主动降噪的算法研究。参与过 HRTF 快速测量、虚拟声外化感提升、基于 VR 的空间音频、耳机主动降噪等项目。共发表了20余篇学术论文,拥有6项专利。2021 年加入声网,主要负责空间音频算法研究,包括双耳声实时渲染、增强立体感和沉浸感等。
吴毅敏,Unity中国平台合作业务总监,曾任职于AWS, IBM, EMC等公司,超过15年IT咨询顾问、架构师、项目经理及销售的融合角色工作经验,在实时3D引擎、云计算、数字孪生及元宇宙等领域有着丰富的经验和深刻的见解,目前在Unity中国负责平台合作业务,致力于拓展Unity实时3D平台在中国的合作伙伴生态。