LiveVideoStackCon 2021北京站

免费报名中

42646 人关注

时间 2021-10-29 09:00 ~ 10-30 18:00

地址北京海淀区知春路25号北京丽亭华苑酒店三层

活动由 LiveVideoStack 主办

免费报名中

42646 人关注

微信分享

使用微信扫一扫分享到朋友圈

活动分享

使用微信扫一扫进入小程序分享活动

活动详情

LiveVideoStackCon音视频技术大会是多媒体技术领域的盛会，大会聚焦在音频、视频、图像等技术的最新探索与应用实践，覆盖教育、娱乐、医疗、安防、交通、制造、旅游、电商、金融、社交、游戏、智能设备、IC等行业领域，嘉宾将面向3年以上工作经验的音视频工程师、多媒体工程师、图像算法工程师、技术负责人以及高端行业用户、产品与项目负责人等分享技术创新与最佳实践。

大会专题

专题6.png

专题5.png

专题4.1.png

樊平下1.png

樊平下2.png

樊平下3.png

李庆丰.png

参会者分析

行业分析1.jpg

部门分析2.jpg

职位分析3.jpg

领域分析4.jpg

工作年限分析5.jpg

地域分析6.jpg

铂金赞助.png

赞助2.png

白银赞助.png

合作伙伴1.png 合作伙伴2.png

志愿者支持.png

活动日程

2021-10-29

2021-10-30

2021-10-29

08:30-09:15

签到

2021-10-29

09:15-09:30

致辞：包研——LiveVideoStack 创始人

嘉宾

包研

LiveVideoStack , 创始人，主编

2021-10-29

09:30-09:45

联席主席致辞: 从微信看视频图像技术——谷沉沉

嘉宾

谷沉沉

腾讯专家研究员 , 微信视频技术负责人

2021-10-29

09:45 -12:00

主题演讲

在过去的一年中，我们可以看到多媒体特别是音视频技术的能力在严峻的挑战下，为各行各业带来了巨大的变化。疫情过后，又会有哪些多媒体新技术、新实践呈现在大众的视野当中？为行业的发展与应用带来哪些新的趋势与机会？

2021-10-29

09:45-10:30

视频大时代下基础架构的演进趋势

过去十年，随着端上算力和通讯能力的提升，我们见证了一个业务玩法日趋复杂、用户覆盖遍及全球的视频大时代的诞生。随着多个市值千亿以上的泛视频行业公司得到更多的关注，其背后支撑业务高速迭代、承载核心技术的视频基础架构也慢慢浮出水面。视频基础架构包含哪些核心能力，在过去和现在经历着什么样的演进，对于未来我们又该如何期许？在本次主题演讲中，我们将结合快手自身实践与行业观察，和大家一起探讨。

嘉宾

黄琦

快手 , 短视频架构负责人

2021-10-29

10:30-11:15

编解码再进化：Ali266与下一代视频技术

过去的一年见证了人类百年不遇的大事记，也见证了多种视频应用的厚积薄发。而因此所带来的视频数据量的爆发式增长更加加剧了对高效编解码这样的底层硬核技术的急迫需求。正是在这样的大环境下，在ITU-T VCEG和ISO/IEC MPEG两大标准组织再次联手推出的最新视频编解码标准VVC定稿不久之后，阿里巴巴的视频团队开始全力投入开展VVC软件编解码的开发工作。经过一年的努力，我们最近推出的Ali266不但在业界第一次实现了高清实时VVC编码能力，也同时充分印证了VVC强大的压缩效率。本次主题演讲将带给大家Ali266 的开发过程以及我们对Ali266在云端协同、5G网和云计算等环境下的落地展望。最后我们以“后VVC时代“视频业界所面临的技术和业务挑战为结尾，期许带给大家有意义的“思想盛宴”（food for thought）。

嘉宾

叶琰

阿里巴巴研究员 , 阿里云智能视频云视频标准与实现负责人

2021-10-29

11:15-12:00

视频产业新挑战与新机遇

4G的诞生推动了视频行业的蓬勃发展，也催生了新的视频应用和业务形态，视频内容越来越多，视频能力正在成为一种基本能力。5G时代已经到来，视频行业将会出现什么样的挑战和机遇？在行业，技术，商业，产品等方面会出现什么趋势，对于从业者又有什么建议？本次分享将和您一起探讨。

嘉宾

朱照远

镕铭微电子 , CEO

2021-10-29

12:00-14:00

午餐&休息

2021-10-29

13:00-14:45

讲师问诊

地点：金辉5厅

2021-10-29

14:45-15:00

换场

2021-10-29

14:00 -17:45

全真互联网下音视频技术创新应用

随着云计算的普及与高速发展，5G网络、VR技术的日益成熟，我们正向着全真互联网时代大步迈进。伴随着新时代的到来，“元宇宙”、“沉浸式”等概念横空出世，挑战与机遇同在，我们不得不思考，哪些行业、产品和商业模式将最早受到全真互联网的影响？腾讯云音视频基于在音视频领域21年的积累，构建了RT-ONE™“三合一”音视频通信基础网络，本次专场将为大家带来全新all in one终端引擎、跨平台能力、海外直播技术、云渲染技术、多媒体处理等技术的最新动向。

2021-10-29

14:00-14:45

新一代音视频终端引擎框架设计和技术实现

经过五年的努力，腾讯云终端团队不断完善和积累出了一套完整的终端 SDK 方案体系，包含即时通信，主播推流，直播播放、点播播放、RTC实时互动、短视频录制，特效编辑等一系列音视频和实时通信相关的功能特性。在这些功能背后，团队是如何完成了框架设计、组件的打磨、数据的流转、性能的优化的呢？本次分享会从产品能力、架构设计、以及技术原理等多个角度进行剖析，期待您的关注。

嘉宾

常青

腾讯云专家工程师 , 腾讯云音视频终端研发总经理

2021-10-29

15:00-15:45

音视频前端跨平台技术应用

随着跨平台技术的不断发展，从最早的跨平台技术Hybrid App，再到ReactNative、Weex等框架，上面两个阶段性能上都跟App端有或多或少的差距。为了解决性能瓶颈，google开源的Flutter出现了，它自带渲染引擎，可直接编译成原生代码，性能优异。除了支持移动端、它还支持了桌面端和web端，目前star数已经远远超过了ReactNative，带给我们更多的想象空间。Flutter是近两年大火的跨终端框架，实时音视频因为疫情的缘故也越来越融入到人们的日常工作生活中，如线上会议、在线教育等。两者结合起来可以碰撞起什么样的火花呢？利用Flutter实时音视频sdk，我们可以快速开发一个跨平台的会议、娱乐、教育等APP。本次分享主要讲述了利用Flutter如何进行实时音视频渲染，并深入底层，优化视频渲染的性能。

嘉宾

牛赞

腾讯云高级工程师 , 腾讯云音视频Web前端核心开发

2021-10-29

15:00-15:45

腾讯云海外音视频技术架构

腾讯云海外直播系统建设起始于2016年，致力于打造全球先进的高质量流媒体处理和分发平台。在近5年的建设时间里，系统从单一中心化的架构发展为全球共11个直播中心的分布式架构系统，直播中心之间通过专线互连，边缘加速点覆盖全球共61个国家或地区，真正意义上具备了就近接入就近分发的能力。海外直播平台不仅具备优质的物理资源，在软实力上得到了很大提升。在传输层上，除了传统的TCP协议，同时支持基于UDP的加速协议QUIC。在流媒体协议上，支持传统的RTMP、HTTP-FLV、HLS等协议，同时支持多码率自适应HLS和DASH，在此基础上，升级实现了低延时的CMAF协议。近年来，基于WebRTC协议，海外直播系统实现了秒级延时的WebRTC低延时直播能力，在播放Qos优化上迈出了更大的一步。

嘉宾

胡仁成

腾讯云高级工程师 , 腾讯云直播海外技术负责人

2021-10-29

16:00-16:45

云渲染技术框架及互动新玩法

随着游戏及软件云端化运行能力的支持，大型游戏和软件可以在浏览器、轻客户端以及小程序中运行，在扩展了使用场景边界的同时，也为游戏和软件探索云原生实现提供了基础。腾讯云云渲染 PaaS 提供了基于 WebRTC 的万人级互动交互的云原生能力，包括操作权限转移管理、多人语音会话等，本次分享会介绍互动新玩法上的技术实现。

嘉宾

王超

腾讯云专家工程师 , 云渲染技术负责人

2021-10-29

17:00-17:45

全真时代与智能时代的多媒体技术

视觉体验在全真时代显得越发重要，如何提高用户的视觉体验？更好的编码标准带来的低码率高画质、超分等视频处理手段带来的画质提升、三维视频带来深度感知、任意视点视频或者VR360视频带来的用户交互、扩展现实与虚拟现实带来的超现实感……另一方面，智能时代革新了音视频技术，通过音视频分析更好的理解数据与链接用户、通过辅助创作让音视频内容极大丰富……让我们一起发掘在全真时代与智能时代里多媒体技术的无限可能。

嘉宾

李松南

腾讯专家研究员 , 多媒体实验室融合媒体总监

2021-10-29

14:00 -17:45

多媒体内容与体验创新

多媒体技术日新月异，可以预见的是网络承载内容向更高质量以及更多新的展现形态的改变。超高清、HDR，全景视频，AR/VR，带来的不仅是更清晰的视觉感官冲击，还有更多全新的沉浸、交互式体验。

2021-10-29

14:00-14:45

美摄科技素材创作平台构建

基于跨平台的SDK能力和统一的素材格式，美摄建立了统一的素材创作平台，围绕美摄的素材生产工具（ARScene工具、特效制作工具、模板生产工具），解决产品中的素材生产和购买等难题。ARScene工具使用fbx模型，基于美摄SDK的3D storyboard渲染实现了实时ARScene效果的预览，特效制作工具使用QPainter和QGraphics，实现了时间线实时预览级别的特效制作体验。

嘉宾

黄裔

北京美摄网络科技有限公司研发总监

2021-10-29

15:00-15:45

智能视频生产中专业视频预设和视频模板数据导出规范的探索

随着5G的到来，视频内容成为了信息传播的主要媒介，普通用户和企业迫切需要的是能够低成本、批量的制作专业视频的技术能力。然而目前国内视频智能自动化生产技术中的视频预设（滤镜、贴纸、视频动画、视频转场、视频特效、文字动画、视频模板）大部分还是利用开源的BodyMovin工具导出预设，达不到专业作品的预设要求。本次分享将重点介绍VE视频引擎方案中自研的设计师预设导出工具VE Exporter以及对应视频解决方案相关的研发经验。

嘉宾

李志强（节子）

杭州视杏科技有限公司 , CEO

2021-10-29

16:00-16:45

半监督、自监督算法在数字内容风控业务上的落地

深度学习领域中，半监督、自监督算法通过借助无标签数据与无监督训练任务，可有效改善传统有监督算法中“泛化性能不足”、“模型过拟合”、“严重依赖数据标注质量”等问题。本次演讲将总结半监督学习领域的发展脉络，并展示半监督、自监督算法在网易易盾数字内容风控业务上的创新应用，希望为听众在“降低数据标注成本”、“提升深度学习模型效果”方面带来一些启发。

内容大纲：

1. 半监督领域发展脉络介绍

a) P-label分支介绍

b) 一致性正则分支介绍

2. 自监督领域发展介绍

3. 半监督、自监督方法在易盾音视频业务

嘉宾

崔若璇

网易易盾 , 资深AI算法工程师

2021-10-29

17:00-17:45

待定

嘉宾

刘歧

快手 , 音视频资深架构师

2021-10-29

15:45-16:00

换场

2021-10-29

14:00 -17:45

字节跳动背后的音视频技术揭秘

音视频技术在近几年呈现突飞猛进的发展，一方面满足了企业对于业务高速增长的需求，另一方面也为业务的发展创造了更多的可能性。在本专题中，将展示字节跳动背后的音视频技术，以及如何利用这些技术支撑业务发展并满足合作伙伴的需求。本专场将从音视频编解码开始，回顾音视频编码技术并进行展望，介绍编码的优化与评估；随后，将介绍音视频在直播方面的应用和如何通过音视频支持业务的增长；最后，将以抖音为例，介绍RTC技术是如何追求极致的体验。

2021-10-29

14:00-14:45

视频编码标准、优化和画质评估

演讲内容涉及视频编解码方向的两个话题：

首先，将介绍视频编码技术现状与展望。对于下一代编解码技术H.266/VVC标准，相比前一代H.265/HEVC标准，可以在主观质量不变的情况下节省约50%的码率。H.266/VVC标准之后是否还会有新的标准，如果有，可能涌现出哪些新技术？本次分享将为大家介绍H.266/VVC标准中的新技术，以及对下一代标准的探索。

之后，会分享视频自适应编码优化和画质评估。考虑到目前视频占据了超过80%的网络流量，在有限的码率下，设计高效的视频编码压缩方案，为用户提供最佳的视频画质体验，是整个业界都高度关注的问题。本次分享主要介绍字节跳动在视频的自适应编码优化和画质评估方面的工作，一方面探讨如何高效地优化不同内容视频的编码，在保证画质的前提下，尽可能节约视频码率，另一方面介绍了字节跳动的画质评价体系和工具，如何对视频画质进行有效准确的评估检测。

内容大纲：

– H.266/VVC标准

– 标准简介：与H.265/HEVC标准相比压缩性能大幅提升

– 字节跳动相关技术

– HMVP (History-based Motion Vector Prediction)

– CCLM (Cross-Component Linear Model)

– Affine AMVR (Adaptive Motion Vector Resolution)

– IBC (Intra Block Copy)

– HLS (High-Level Syntax)

– 基于深度学习的环内滤波器设计：在H.266/VVC标准基础上的探索

– 整体介绍字节基于感知优化的视频处理编码系统

– 具体介绍字节自适应编码优化技术

– 整体介绍字节视频画质评估体系

– 具体介绍字节自研的画质评估工具

嘉宾

刘明

字节跳动 , 资深研究员

罗亚

字节跳动 , 资深研究员

2021-10-29

15:00-15:45

抖音背后的RTC是如何追求极致的

自从RTC相关技术崛起后，实时音视频为直播、社交、在线教育等行业带来了巨大增长。随着RTC的应用越来越普及，业务对用户音视频体验的要求也越来越高，包括更流畅、更清晰、更快的首帧速度等。面对不断拔高的挑战，RTC需要在各个技术领域不断突破。在服务抖音、西瓜、头条等国民App的过程中，我们以提升用户体验为使命，不断追求更高的目标。本演讲将分享我们在追求极致用户体验这一路路上的沉淀和积累。

内容大纲：

1. 自研音频编码，对抗极端弱网
2. 动静态机型适配，实现个体最佳体验
3. 场景化最佳实践，极致体验的最后一公里

嘉宾

朱利安

字节跳动 , 实时音视频（RTC）产品负责人

2021-10-29

16:00-16:45

从体验出发，构建以增长为目标的视频服务体系

增长一直是业务的诉求，和增长相关的因素很多，内容、人群、创意玩法、性能体验等等，本次分享聚焦在字节跳动视频通过性能体验优化促进业务增长的实践。包括在分析方法上的探讨，如何衡量和预估体验优化对业务增长的贡献，以及具体的体验优化实践分享。

内容大纲：

1. 介绍字节衡量视频技术对体验贡献的方法,视频中台如何更好的关注业务结果

3. 视频体验优化能力介绍

3. 如何分析和预估收益空间,为自己的业务选择合适的优化手段探讨

嘉宾

浩铭

字节跳动 , 点播技术研发负责人

2021-10-29

17:00-17:45

直播新玩法背后的音视频技术演进

直播越来越深刻地改变了整个互联网行业，直播的形态也在不断地丰富。在多场景的KTV歌房、直播答题、互动游戏、连麦、电商、拍卖、企业直播等的快速演进中，我们积累了大量架构和质量优化相关的经验，这次分享主要介绍我们的相关积累和可以快速迁移的高质量的音视频能力。

内容大纲：

1. 直播的新场景新玩法

2. 音视频引擎如何灵活、快速、保证质量地支持直播业务的多场景下的演进

3. 直播服务可以快速迁移到新业务的音视频能力

嘉宾

徐鸿

字节跳动 , 直播客户端SDK研发负责人

2021-10-29

14:00 -17:45

视频编解码的新挑战与新机会

随着以VVC、EVC、AVS3和AV1为代表的新一代视频编解码标准制定完成，面向多样化业务的既有编解码标准的软、硬件实现优化逐渐成为工业热点。另一方面，使用AI技术来提升传统视频编码压缩效率正沿面向人眼观看与面向机器任务的两条技术路径蓬勃发展，国内外标准组织已制定相关工作计划。本专题将介绍这些新变化并进行深入探讨。

2021-10-29

15:00-15:45

拍乐云基于AV1的实时视频系统技术实践

实时视频系统对于时延的要求极高，所以视频编码器必须满足实时性的要求。AV1相比H.264在 Rate-distortation 性能的提升上是以复杂度的上升为代价的，当前应用设备的碎片化非常严重、设备的运算能力差异巨大，这些都是新技术落地实时音视频系统将面临的挑战。拍乐云最近发布了PanoVenus视频引擎，采用AV1编码标准，为用户提供编码性能和编码速度更好的实时低码高清体验。相比2003年推出的主流编码标准H.264，Venus可实现带宽40%-70%的节约，支持在主流PC和移动终端上实时运行。本次分享将介绍拍乐云在设计PanoVenus实时AV1通信系统时的一些技术实践和未来工作。

嘉宾

章琦

拍乐云Pano , 合伙人&首席科学家

2021-10-29

16:00-16:45

欢聚集团AV1技术实战

随着业务的发展和用户数的增加，带宽成本问题也越来越突出。通过对最新编解码标准AV1的落地研发，欢聚集团成功的将其在小视频业务中上线应用。本次分享主要分为三个部分，第一部分针对业务和技术背景介绍技术方案的选型及其准备工作；第二部分介绍AV1编码器优化的一些思路，主要集中在模式决策，运动估计和滤波三个模块；第三部分和大家分享最终上线收益以及在研发过程中所踩过的一些坑。

嘉宾

刘安民

欢聚集团 , RTC技术部视频算法团队负责人

2021-10-29

17:00-17:45

迈向更智能的视频压缩：信号，感知和语义

随着计算能力，数据形态和应用场景等多方面演进，视频相关领域正在发生深刻变革。信号层面的压缩效率提升难以适配通用化、智能化的视频压缩需求，报告从智能视频编码入手，将与视频技术专家和研究人员一起讨论深度学习时代视频编码技术研究的发展情况，介绍标准化进程以及面临的技术挑战，同时还将报告在感知编码和语义编码领域的部分研究进展。此外还将分享对智能视频压缩领域重点研究方向以及未来发展趋势的展望。

内容大纲:

1. 介绍智能编码的历史和发展历程，重点介绍深度学习编码工具研究的技术细节和技术路径，包括混合框架编码的深度网络模型以及端到端编码结构，

2. 介绍深度学习编码标准化情况，以IEEE DCSC(AVS3)，MPEG，JPEG以及MPAI标准研究小组为例进行重点分析。

3. 智能编码正在突破基于信号层面的压缩，因而报告还将介绍面向感知编码和语义编码最近进展，讨论神经网络编码的率失真特性以及对机器视觉有更好支持的压缩方法。

4. 未来技术展望

嘉宾

贾川民

北京大学计算机科学技术系 , 博士后研究员

2021-10-29

16:45-17:00

换场

2021-10-29

14:00 -17:45

海外网络传输及体验优化

音视频技术服务、产品出海趋势依旧强劲，如东南亚、南美等市场，面对纷繁且复杂的基础设施与网络环境，有针对性的，合理的架构选择与优化策略尤为重要。

2021-10-29

14:00-14:45

ZEGO即构如何构建全球实时音视频通信云

全球不同国家和地区的网络基建水平参差不齐，如何利用有限的网络资源提供更高质量的音视频通话体验是音视频服务商必须面对的挑战。本次议题将从面临的全球实时音视频通信挑战出发，解读自研海量有序数据网络（MSDN）的优势、以及如何进行音视频传输优化等。

嘉宾

肖潇

即构科技 , RTC后台技术总监

2021-10-29

15:00-15:45

影视媒体和直播娱乐的海外公有云出海战略

嘉宾

崔海涛

IBM , 大中华区云计算平台产品总监

2021-10-29

16:00-16:45

探探直播在海外市场的落地调优实践

随着国内直播行业的高速发展，越来越多的厂商向海外市场扩张。而面对海外复杂的基础设施与网络环境，国内模式的直接套用难免水土不服，如何快速适应落地并保证良好的用户体验成为了重点挑战。本议题将主要从服务体验量化、分发架构、推荐算法策略等多方面介绍调优过程，以及各项调优方案上线后的收益成果进行分享。

嘉宾

刘岩

陌陌 , 直播媒体中台运维负责人

2021-10-29

17:00-17:45

Opera视频出海非洲面临的技术挑战及应对

本议题主要面向视频出海听众，尤其是非洲出海视频类产品。议题主要分享Opera出海非洲所遇到的挑战及应对策略，主要包括非洲网络状况下视频播放问题及优化、用户网络流量问题及应对、不同国家视频播放策略等问题和其他（非洲安全问题、网络基建等）问题;通过本次分享听众能够对非洲互联网状况有进一步的了解，对后续出海非洲有一定的借鉴参考。

嘉宾

张建磊

Opera , 技术副总监

2021-10-29

14:00 -17:45

声入人心：音频新体验

从K歌、游戏、电影到音乐教学，更好的声音表现力将给用户体验带来质的提升。本专题将讨论最新的音频方案，涉及全景声、语音合成、语音识别、回声消除等。

2021-10-29

14:00-14:45

微信亿级通话的音频技术优化之路

微信通话系统的语音质量提升历程分享。从信源和信道质量保障上，介绍打造高品质语音通话的关键路径，为亿级用户提供优质通话服务。讲解端到端各节点可能遇到的问题，以及相应解决方案。

嘉宾

乔宁博

腾讯专家研究员 , 微信通话音频技术负责人

2021-10-29

15:00-15:45

荔枝语音直播中的高音质技术实践

荔枝在语音直播中，用到了多种音频处理技术，譬如结合场景检测的智能降噪技术，能大大提升音乐等场景音质；自研的回声抑制技术，双讲性能得到很大提升。智能语音加减速技术，让延时较低的情况下保持声音自然清晰；在线机型匹配等技术，让机型适配更高效。

嘉宾

沈俊聪

荔枝 , 音频技术负责人

2021-10-29

16:00-16:45

K歌中的歌唱评价与嗓音分析

音乐专家在评价歌唱行为时，可通过生理机能与演唱完成度两个层面对演唱者进行分析。传统的歌唱评价算法只对音准进行打分，维度较为片面。作为国内首创的综合评分功能，音街的综合评分系统可对用户的音准、节奏、气息、颤音、滑音、情感等维度进行综合评价，这些多维度评分在增加演唱趣味性的同时，也可为作品分发提供可用的标签。同时，对用户嗓音、演唱行为进行综合分析，可建立歌手能力图谱，依据用户嗓音条件，为他推荐适合演唱的歌曲。本次分享将围绕歌唱与嗓音分析，介绍相关的体系与算法实现。

嘉宾

高月洁

网易云音乐 , 高级音频算法工程师

2021-10-29

17:00-17:45

音频场景分类及下游应用

音频场景分类（Audio Sence Classification）是机器学习领域的重要研究方向，其应用场景非常广泛，近年来得到了越来越多的学者的关注。本次报告将分享我们在该领域做的一些工作。此外，我们将音频场景分类技术应用于声源分离（Audio Source Separation）和声音活动检测（Voice Activity Detection）等领域上，取代了传统方法。实验表明新方法在和传统方法的对比中具有显著优势。本次报告中也将展示若干Demo和已上线的应用。

嘉宾

张俊博

小米 , 语音技术专家

2021-10-29

17:45-18:00

Q&A

2021-10-29

18:00-18:00

结束

2021-10-29

18:30-21:00

VIP社交晚宴

2021-10-30

08:30-09:00

签到

2021-10-30

09:00 -17:45

多媒体内容与体验创新

2021-10-30

09:00-09:45

低延时技术在节目生产中的应用

嘉宾

韩嫕

央视频融媒体发展有限公司技术总监

2021-10-30

10:00-10:45

短视频内容理解与生成技术在美团的创新实践

美团围绕丰富的本地生活服务场景，积累了海量视频数据。如何通过计算机视觉技术用相关数据，为用户和商家提供更好的服务，是一项重要的研发课题。本次分享将主要介绍，短视频内容理解与生成技术，在美团业务场景的落地实践。

嘉宾

马彬

美团 , 高级算法专家

2021-10-30

11:00-11:45

云音乐在视频内容创作上的探索

随着短视频行业的火爆，视频内容传播和影响越来越大。视频内容创作重要性就毋庸置疑了，本演讲将重点介绍网易云音乐在视频内容创作上的探索及实践。

嘉宾

尤才乾

网易云音乐 , 资深音视频工程师

2021-10-30

09:00 -17:45

七牛云实时音视频质量保障与提升

我们所理解的音画质量，不仅包括最基础的服务质量，还包括用户的观感体验。本专场将围绕实时音视频场景下，七牛云如何从多个维度实现保障和提升音画质量，分享针对保障和提升音视频质量从编解码到网络传输，从服务端到客户端等多领域的相关实践经验。此外，本次专场还会发布七牛云音视频质量分析系统，实现更客观、更专业的音画质量评测和优化。

2021-10-30

09:00-09:45

H265在七牛QRTC场景的落地运用

近年来，伴随着采集渲染设备终端发展，人们对视频质量的需求也在日益“膨胀”，更高的分辨率:4k/8k，更宽泛的亮度，色度动态范围HDR/Dolby视界，更沉浸式感受：VR /AR 360全景体验等；这也给网络带宽/设备计算能力等带来了新的挑战，怎么在有限的容量下传输最有价值的视频信息始终是我们需要解决的核心问题；面向未来，七牛云作为领先的云服务厂商，全线产品支持更好的视频编解码成为必然选择；本次演讲会重点分享七牛云将H265落地运用到QRTC场景的一些创新经验和教训。

内容大纲：

1. 为什么在RTC场支持H265？

2. H265在RTC场景落地有哪些挑战？

3. QRTC视频编解码方面接下来的的演进规划

嘉宾

朱玲

七牛云 , 视频编解码负责人

2021-10-30

10:00-10:45

七牛云音视频质量分析系统发布

内容大纲：

1. 七牛云音视频质量分析系统决了什么样的问题？

2. 系统的核心亮点和七牛云产品的关系？

3. 如何获取内测资格？

嘉宾

陈辉

七牛云 , 技术总监

2021-10-30

10:00-10:45

QRTC 客户端音视频质量优化实践

内容大纲：

1. 当前现状和痛点：对于 RTC 服务而言，音视频的质量仍是用户体验的最重要的因素

2. 列举音视频质量相关的优化实践（可能会说数据驱动相关，丢包，延迟，抖动等弱网相关，移动端性能和兼容性相关的一些经验）

3. 总结或者展望

嘉宾

霍锴

七牛云 , 架构师

2021-10-30

11:00-11:45

七牛云实时音视频网络质量优化

云时代，视频直播、实时音视频通信等在线音视频服务面临各种复杂的网络环境和流量爆发式的增长，对音视频网络质量提出新的严峻挑战。本次分享将详细介绍如何在内网传输以及最后一公里的网络下优化网络协议，保证网络抖动不影响数据完整性、以及能及时切换线路，最终保证质量。

内容大纲：

1. 数据同步协议的实现

2. 边缘动态路由协议的实现

3. 最后一公里 rs fec 优化

嘉宾

谢然

七牛云 , 实时互动架构师

2021-10-30

09:45-10:00

Q&A换场

2021-10-30

09:00 -17:45

音视频架构演进：边缘计算与云原生

随着多媒体业务的发展以及在各个行业场景下的进一步应用，业务与场景的差异性如对低延迟、体验质量等不同的要求，为了实现成本上的节省，存储、计算等资源正逐渐走向边缘，边缘计算、云原生的架构模式将会带来一大波技术、产品和商业的更新。

2021-10-30

09:00-09:45

如何用好共享经济模式下的边缘计算资源

本演讲将详细介绍边缘计算的节点资源发展关键 — 共享经济模式，以及基于这种模式下的服务有什么特点，有什么场景适合，以及一些实践的案例。

嘉宾

王闻宇

PPIO边缘云 , CEO&联合创始人

2021-10-30

10:00-10:45

云、网、边融合释放云平台设施潜力-金山云边缘云实践

据 IDC 2021 预测，中国云计算市场将实现云网边的融合，到 2024 年，有 25% 的组织将通过边缘数据与云平台上的应用集成来提高业务灵活性。本次分享将为大家介绍金山云如何通过云计算、网络、边缘计算相互配合将边缘节点之间互联做到极致，实现让“云”无处不在。

嘉宾

斯文

金山云 , CDN及视频云产品中心副总经理

2021-10-30

11:00-11:45

探讨视频云与边缘云平台的竞争力 — 基于Serverless的端边云一体化媒体网络

视频云与边缘云如何实现开源？视频在边缘的创新方向在哪？下一代视频云平台什么样？本次分享将从以Serverless为承载平台，以开放、专业的媒体处理能力为价值核心的方向，与大家一起探讨视频云与边缘云平台的下一代竞争力。

嘉宾

卢志航

华为云 , 媒体服务RTC产品总监

2021-10-30

14:00-14:45

冲刺最后一公里 — 音视频场景下的边缘计算实践

近年来，边缘计算逐渐从未来风口变成了进行时，而内容分发这个天生与“下沉”密不可分的领域，在边缘计算实践中可谓一马当先。网心从14年开始探索边缘传输网络的商业可行性，实作了传统CDN到边缘CDN的技术演进，也见证了边缘CDN从超前概念到行业标配的发展历程。当数据下沉到最后一公里时，在如此复杂的节点和网络环境下构建百万量级的边缘节点网络，同时服务好需求不断深化的音视频业务，是一个不小的挑战。在这里与大家分享一些个中的实践历程和关键问题，以供参考。

嘉宾

曾伟纪

网心科技 , 首席架构师

2021-10-30

15:00-15:45

视频边缘智能服务

边缘计算是云计算的演进发展。视频处理，特别是视频智能处理又是边缘计算的主要应用场景。本次演讲将介绍视频边缘智能的业务需求和发展趋势，提出制约视频边缘智能落地应用的主要问题。同时分享在视频边缘智能服务方面的解决方案和一些探索，为视频边缘应用开发者提供参考。

嘉宾

郭勐

中国移动研究院 , 多媒体基础研究员

2021-10-30

16:00-16:45

微博视频处理系统的云原生之路

随着容器技术的快速发展和广泛应用，云原生技术逐渐成为未来的发展趋势。微博视频处理平台针对面临的大规模、多业务、资源复杂、业务快速迭代等挑战进行架构升级，开启了云原生以及serverless的探索。从最初的调度器、执行器架构发展到最新的FAAS平台，为开发人员提供了开箱即用、可伸缩、基于事件驱动的函数编排服务。不仅提高了研发交付速度，而且基于标准化的资源分配和可复用的机器扩缩容策略，降低成本，达到更高的ROI。本次演讲将介绍微博视频处理系统的架构演进与云原生之路上的探索，我们为什么选择自建，以及如何实现基于原有基础服务的FAAS平台。为尝试云原生架构模式的开发者提供参考。

嘉宾

黄阳全

微博 , 微博视频平台架构师

2021-10-30

17:00-17:45

虎牙直播的云原生网络发展实践

随着业务的快速发展，业务架构的复杂度和基础设施规模也在指数级提升，同时直播类的在线业务以及数据分析类的离线任务对于稳定性、性能、吞吐都有不同的要求，这些都推动着虎牙在云原生方向的转型，特别是计算下沉边缘后，基础设施环境复杂、标准不统一等等，更是对虎牙的融合云提出更多的挑战。本次分享将分为三个部分，第一部分介绍虎牙融合云的云原生网络解决方案，以及从网络上怎么处理有状态业务和无状态业务，第二部分介绍在线业务和离线业务对网络的挑战，如何平衡离在线业务对网络资源的需求矛盾，第三部分介绍虎牙边缘基础网络的建设与管理，怎么解决边边、边中通信。通过以上三个部分将为大家系统的介绍虎牙在云原生架构下对于中心、边缘机房的基础网络设施建设经验。

主要内容：

1. 两年实现90%业务容器化-虎牙容器网络建设之路

2. 离在线混部-音视频与数据分析业务对网络的挑战

3. “无限网络”初探-复杂边缘环境下基础网络的建设

嘉宾

李国超

虎牙 , 技术经理

2021-10-30

10:45-11:00

Q&A 换场

2021-10-30

09:00 -17:45

技术商业策略（圆桌）

疫情的风暴席卷全球，改变着人们的生产和生活方式。许多公司在艰难中寻求发展，也有许多公司在蓬勃中站上浪尖。视频的大时代在加速到来，多媒体新技术、新产品、新应用不断迸发。浪淘风簸，如何在激烈的挑战中寻找机会？吹尽狂沙，如何将技术转换为商业价值？技术商业策略圆桌与您一同探讨。

2021-10-30

09:00-09:45

圆桌论坛：海外音视频生态发展，机遇与挑战

除了短视频、直播流媒体服务等，在过去的一段时间内，越来越多的音视频相关服务及应用逐步走向海外，面对海外与国内差异化的生产及市场环境，如何做出正确的判断与选择，在业务需求、成本及用户体验平衡的挑战当中发闸门最恰当的业务产品、技术路线，寻求更长远的可持续发展。

嘉宾

赵加雨

拍乐云 , 创始人&CEO

吉奇

网易云信 , 服务端首席架构师

曾凡平

快手 , 音视频中台技术负责人

牛继宾

首都在线 , CPO兼创新产品事业部总经理

2021-10-30

10:00-10:45

圆桌论坛：开源技术与商业的融合之路

开源技术迎来了新的高潮，尤其是在多媒体领域，大量围绕“开源”的代码、软件及系统开发，推动整个行业及市场带来更加快速的创新发展与技术变革。本场圆桌邀请开源技术、项目领域资深专家，共同探讨开源技术的发展变化以及如何将开源与商业融合，取得更长足的发展。

嘉宾

刘歧

快手 , 音视频资深架构师

杜金房

烟台小樱桃网络科技有限公司 , CTO

段维伟

RTC/VOIP独立开发者 , flutter-webrtc/ion开源社区维护者

熊子良

百度 , 资深研发工程师

2021-10-30

11:00-11:45

圆桌论坛：视频会议的下半场

疫情导致我们日常办公使用远程会议的需求刚性骤升，而随着视频会议系统的不断普及，很多企业都会关心未来视频会议的技术发展趋势，在技术急速迭代的当下，视频会议是否能够在真正意义上脱离会议室的束缚，在用户体验、互联互通、开放协作和安全性等方面也面临着决定性的挑战。外部市场的竞争与饱和以及内部技术的生产力等等，都成为了视频会议将进一步赋能与渗透更多行业的过程中需要考虑的问题。

嘉宾

张军

科天云 , 研发中心总经理

李志涛

北京二六三企业通信有限公司 , 技术总监

商世东

腾讯会议天籁实验室 , 总经理

曹俊

华为云 , 云会议领域总经理

2021-10-30

09:00 -17:45

硬件加速与定制化

海量高质量视频内容理解，云+边缘+端大量数据计算的需求，对硬件处理提出了更高的要求，在考虑到成本、实时处理、性能等多方面要求的条件下，硬件芯片的设计和开发成为关注的热点。

2021-10-30

09:00-09:45

基于GPU, FPGA，ASIC等平台对快手的多媒体业务的异构方案探索

内容大纲：

1. 快手异构部门介绍

2. 快手直播以及海量短视频处理的需求

3. 异构计算方案的探索

3.1. ASIC转码方案的评估及收益

3.2. GPU 在超分，去噪等算法加速取得的成果

嘉宾

颜伟成

快手 , 异构计算部门架构师

2021-10-30

10:00-10:45

AI辅助编解码的ASIC解决方案

本次演讲将详细列举目前常用的AI辅助编解码的方法，论述如何在硬件和软件层面将AI结合编解码的实践，探索新的标准和新一代编码器结合AI应该如何设计。受众群体为想要了解目前商业化的AI辅助编解码方案，已经有过实践但是想要了解在ASIC中实现AI+编解码优势。

内容大纲：

1. 目前商业化的AI结合编解码的方法介绍

2. 基于FFMPEG的AI+编解码的软件实现

3. ASIC内部AI结合编解码的硬件实现

4. 高密度低延迟的ASIC方案的优势

嘉宾

刘迅思

镕铭半导体 , 工程副总

2021-10-30

11:00-11:45

AI在视频处理领域的应用

内容大纲:

1. AI在视频处理领域的应用场景

2. AI视频处理对硬件性能的挑战——CPU和GPU的局限性

3. DSA架构加速AI视频处理的价值——高性能、超低延时、通用性

4. 瀚博半导体的芯片解决方案助力AI视频处理

嘉宾

张磊

瀚博半导体 , 创始人、CTO和总架构师

2021-10-30

11:45-12:30

Q&A 换场

2021-10-30

09:00 -11:45

低延迟服务与网络传输

实时视频通信、云游戏、VR/AR等强互动类媒体服务成为继流媒体之后媒体服务的新热点，这些场景要求极低的端到端延迟，极高的体验质量，对于网络传输中架构设计、传输协议选择、算法优化等多方面维度提出了更多的挑战。

2021-10-30

10:00-10:45

网易云信自研大规模传输网核心系统架构剖析

随着边缘计算及RTC技术的兴起，业务服务器的边缘化可以带来大量收益：一方面就近接入可以优化客户端上下行质量，另一方面边缘节点可以大幅降低带宽成本。但如何保证相隔千山万水的边缘服务器之间的网络传输质量成了一个难题，本次分享将通过分析网易云信自研大规模分布式传输网（WE-CAN）核心系统的架构来探讨这些问题。

嘉宾

吉奇

网易云信 , 服务端首席架构师

2021-10-30

11:00-11:45

透过HESP实现媲美广播的超低延迟播放体验

嘉宾

卢彦林

Synamedia , 流媒体分发技术发展经理

2021-10-30

12:30-14:00

午餐&休息

2021-10-30

13:00-14:45

讲师问诊

地点：金辉5厅

2021-10-30

14:00 -17:45

媒体服务质量监控与QoE

近年来随着媒体内容处理、传输能力的提升以及内容呈现形式、形态等的不断变化，用户对于多媒体服务、内容质量的期待也越来越高，面对不同业务场景下的需求特性，通过丰富的数据监控与收集，进行更加针对有效的优化，才能提供更贴近用户需求的完美体验。

2021-10-30

14:00-14:45

解密华为云媒体质量管理最新实践成果 — “视镜”

对全球不可靠的互联网络和大容量分布式系统的挑战，如何以用户为中心，从可用变得更好用，追求更流畅、更清晰、更快、更省的极致用户音视频体验？本次演讲将分享华为云媒体服务在追求极致用户体验质量道路上的沉淀成果 —— “视镜”。

嘉宾

康永红

华为云 , 媒体服务资深研发专家

2021-10-30

15:00-15:45

图像质量评价模型的构建方法和应用

随着多媒体处理技术的快速发展，视频图像质量评价研究越来越受到大家的关注，它能广泛运用于多媒体处理技术/系统性能评价和优化中。本报告将首先介绍图像质量评价概念、分类及基本理论方法，然后回顾过去十年来的相关进展，进一步，通过介绍我们小组在该领域的一些相关工作，尤其是移动成像质量评价和VR质量体验方面的工作，来说明图像质量评价模型的构建方法和应用。

嘉宾

方玉明

江西财经大学 , 信息管理学院院长

2021-10-30

16:00-16:45

大众点评APP视频播放体验优化实践

作为大众点评APP内容生态的重要一环，视频播放体验非常关键。本次演讲会结合全链路监控、视频预热、码率自适应等实际优化措施来介绍我们是如何保障服务质量和提升用户体验的，并尝试探讨QoS与QoE的关系。期望对致力于提升客户端用户视频播放体验的读者提供帮助。

嘉宾

夏明钰

美团 , 大众点评客户端音视频研发负责人

2021-10-30

17:00-17:45

京东直播技术的演进之路

近年来直播飞速发展，尤其直播带货更是引领行业，除头部薇娅，李佳琪等越来越多的明显,大V 加入了直播带货行列，也使得电商中的直播成为一个常态，而直播过程中能否极大的提升GMV ，除了靠运营推广等明星效应，背后强大的直播技术支撑也是非常重要因素之一。本次分享将详细介绍京东由最初的开源推流工具加第三方CDN 的直播模式如何一步步实现所有模块自研，承载每年京东巨大体量的618，双11 直播大促活动，为京东零售带来可观的GMV 提升。同时在直播技术上不停的进行更新迭代，使京东直播技术逐步开始引领行业。

内容大纲：

1. 京东早期直播介绍

2. 自研直播核心能力

3. 直播连麦背后实现

4. 新技术的持续迭代

5. 未来直播技术探索

嘉宾

吴忠

京东 , 架构师

2021-10-30

14:45-15:00

Q&A 换场

2021-10-30

14:00 -17:45

流媒体系统优化

在过去的一年内，随着应用越来越广泛，短视频、直播、在线教育、游戏娱乐，音视频在不同场景的落地以及业务产品形态的变化，对新技术的要求也越来越高。除了要考虑如何满足用户更多样化的内容及交互体验需求，满足各种设备性能要求。同时还需兼顾实时、高并发，可用性与稳定性等系统服务需求，支持业务快速迭代。本专题将探讨从客户端到服务端，流媒体系统架构设计、开发优化等相关技术探索及应用实践。

2021-10-30

14:00-14:45

大众点评客户端视频播放器研发探索与实践

视频播放器作为视频消费端重要的承载窗口，其在交互上及性能上的表现直接决定了用户在平台上视频观看体验的好坏，本议题主要分享我们在客户端播放器建设方面的一些探索及经验，对期望从技术优化手段提升用户视频体验的读者有一定的参考。

嘉宾

田维新

美团 , 大众点评客户端播放器研发负责人

2021-10-30

15:00-15:45

微博客户端HDR视频播放的落地实践

HDR格式视频具有更高规格的色彩表达能力，可以更准确的记录真实场景的内容。支持HDR视频拍摄能力几乎是这两年新发布手机的必备功能，HDR视频越来越流行。但是普通消费级的显示设备颜色展示能力千差万别，很难达到HDR视频标准的规格。如何充分利用显示设备的能力，结合手机微博产品的特点，正确的展示HDR的内容是我们尝试解决的问题。

嘉宾

刘文

微博 , 客户端播放器研发负责人

2021-10-30

16:00-16:45

面向在线教育业务的流媒体分发演进

随着在线教育业务形态的不断探索：从实时一对一，到小班课、大班课、分组大班课、互动小班课等形式，流媒体服务在与业务的相互影响中不断演进。本演讲将分享网易有道流媒体分发技术伴随业务的共同演进的过程，以及对一些关键问题的思考和实战经验：

1. 使用怎样的策略支撑业务的变化；

2. 大班与小班课对系统带来的不同挑战与应对策略；

3. 对自研系统与第三方流媒体服务关系的思考；

内容大纲：

1. 流媒体分发系统伴随业务的演进过程；

2. 演进过程中遇到的挑战、策略与经验；

3. 在业务技术团队视角对自研和第三方流媒体服务的思考；

嘉宾

周晓天

网易有道 , 音视频核心研发工程师

2021-10-30

17:00-17:45

实时音视频在教育场景的应用实践

本演讲架构详细介绍好未来实时音视频（TalRTC）的进阶演进过程，以及其在教育场景下的实战应用和特殊优化，如何使用技术手段最大限度保障老师和学生上课的音视频质量。

内容大纲：

1. 好未来直播中台全景介绍

2. TalRTC整体架构介绍

3. TalRTC高可用及弱网对抗策略介绍

4. 针对教育场景的特殊优化

嘉宾

冯权成

好未来 , 直播中台产品负责人

2021-10-30

15:45-16:00

Q&A 换场

2021-10-30

14:00 -17:45

从上云到创新，视频云的新技术与新场景

视频云驱动着下一代技术浪潮的到来，在视频形态泛在化的今天，诸多云上新场景被创造。阿里云着眼于数字经济基础设施的建设，极力推动各行业的视频化，促进行业的第二增长曲线。本专场演讲，阿里云视频云依托阿里云服务数百万开发者的卓越服务能力与实践，从云计算服务、网络调度到端侧呈现等视频生产与消费的全流程角度出发，分享下一代技术趋势和判断，并从实践角度分享算法、架构、AI等多个具有实践指导意义的话题。

2021-10-30

14:00-14:45

“三位一体” — 云原生视角下的视频生产全流程技术实践

视频生产有着天然的云服务属性，是5G+云原生时代最大的确定性和领域，云原生实践也在极大地改造着视频生产的全流程。通过多年实践，阿里云视频云形成了云边端一体、软硬一体、网络与协议一体的视频生产流程，形成了丰富的技术落地经验，拥有了极具竞争力的场景实践。本演讲将以理论与实践、技术场景深度结合的角度，全面介绍阿里云在视频生产中的创新之路。

嘉宾

邹娟

阿里云智能视频云 , 高级技术专家

2021-10-30

15:00-15:45

拥抱智能，AI视频编码技术的新探索

随着视频与交互在日常生活中的作用日益突显，愈发多样的视频场景与不断提高的视觉追求对视频编码提出更高的挑战。相较于人们手工设计的多种视频编码技术，AI编码可以从大数据中自我学习到更广泛的信号内在编码规律。工业界与学术界发力推动AI视频编码标准并进行新框架的探索。阿里云视频云在JVET面向人眼的视频编码标准和MPEG面向机器视觉的视频编码标准上均做出重要贡献，对标准发展产生强有力的推动。结合产业需求强劲的视频会议、视频直播等场景，阿里云视频云还开发了AI生成式压缩系统，在同等质量下比VVC节省2-3倍码率，实现真正的超低码率视频通信。

嘉宾

王钊

阿里云智能视频云 , 算法专家

2021-10-30

16:00-16:45

基于微内核的阿里云下一代音视频引擎技术

基于微内核的一体化音视频引擎旨在通过一个SDK的接入，即可完美支持RTC、直播、会议、播放器、短视频制作等多项功能，按需出包以适配多种场景，在提升技术复用度的同时，将功耗、功能和体验提升了一个数量级，这套SDK目前已成为阿里云智能视频云的音视频底座，未来会全面支持客户的各类业务，本演讲中我们将围绕着业务背景、技术顶层设计、技术研发和业务接入等多方面展开，详细介绍一体化SDK的来龙去脉。

嘉宾

陈虓将

阿里云智能视频云 , 高级技术专家

2021-10-30

17:00-17:45

效能与未来：算法创新驱动的云端一体新视界

视频消费的新场景对视频技术的发展提出了新的需求，从当下的直播、短视频、RTC出发，到未来的XR，音视频技术对新场景的支撑越来越趋向于综合性，需要算法深度结合云边端软硬一体的能力进行创新和演进。本演讲将从阿里云视频云的最新场景探索出发，介绍阿里云视频云在智能视效、虚拟互动、极致高清等场景的最新创新实践。

嘉宾

杨凤海

阿里云智能视频云 , 高级算法专家

2021-10-30

16:45-17:00

Q&A 换场

2021-10-30

14:00 -17:45

多媒体新技术：拥抱开源

在广阔的多媒体技术生态中，有大量的开源技术工具、框架和库，如何甄选并有效组合使用这些开源技术就成为能否快速致胜的关键。

2021-10-30

14:00-14:45

高性能且灵活的 iOS 视频剪辑与特效开源框架 - VideoLab

随着移动互联网时代的到来，短视频成为了最流行的内容载体，而内容的产生离不开视频剪辑与特效创作工具。笔者借鉴 AE 视频剪辑的思路，开发了高性能且灵活的 iOS 视频剪辑与特效开源框架 – VideoLab。本次分享将重点介绍 AVFoundation 视频剪辑框架，以及 VideoLab 框架的设计与实现。

嘉宾

阮景雄

RingCentral Video , 移动端架构师

2021-10-30

15:00-15:45

鸿蒙媒体框架及音频跨设备播控技术

嘉宾

谭利文

华为终端 , 音视频技术专家

2021-10-30

16:00-16:45

SRS服务器RTC级联与QUIC传输协议

本次分享将详细介绍SRS WebRTC级联的选型过程，横向对比几个传输协议，并重点介绍QUIC协议传输的一些机制。适合对开源技术方案实现和流媒体传输协议感兴趣的开发人员，从中了解到开源技术方案选型的过程和侧重点，以及常见的WebRTC服务器级联传输实现方案。

嘉宾

肖志宏

腾讯 , 高级工程师

2021-10-30

17:00-17:45

使用现代前/后端技术(flutter+go)降低WebRTC开发门槛

用最炫酷的flutter前端技术，与最流行的后golang 结合，探索是否可以通过现代技术来解决WebRTC开发的痛点。

嘉宾

段维伟

RTC/VOIP独立开发者 , flutter-webrtc/ion开源社区维护者

2021-10-30

17:45-18:00

Q&A

2021-10-30

14:00 -17:45

智能汽车与自动驾驶

当音视频技术从传统互联网应用场景如短视频、直播等转向工业、智能制造，又将给人们带来怎样的惊喜？本专题将探讨音视频技术落地智能制造、汽车行业的技术发展路径及实践应用：从软件-硬件-解决方案-场景落地；从初级智能汽车辅助驾驶到真正完全实现智能化无人自动驾驶。

2021-10-30

14:00-14:45

城市末端道路场景下的无人驾驶技术与挑战

本演讲将详细介绍无人驾驶的主要技术模块，及其在末端道路场景下的应用和挑战。

嘉宾

申浩

美团 , 无人配送部技术总监

2021-10-30

15:00-15:45

智能驾驶3D目标检测所遇到的问题

当前智能驾驶受到广泛关注，其中行人和车辆的3D目标检测仍有待进一步提升。本报告将介绍一种新的GIoU和L2损失结合3D目标检测方法，同时引入神经网络架构搜索方法，提升3D目标检测精度和检测速度。受众人群：3D目标检测，计算机视觉，智能驾驶感知；受益：系统了解3D目标检测以及神经网络架构搜索的相关知识。

嘉宾

陈亚冉

中国科学院自动化研究所 , 副研究员

2021-10-30

17:00-17:45

软硬结合，加速高级别自动驾驶落地

内容大纲：

1. 自动驾驶感知困境（分析行业普遍的痛点、瓶颈，快速切入）

2. 当前技术路线比较（比较特斯拉纯视觉和国内技术厂商的差异性，不比优劣）

3. 基于征程 5 的FSD研发与感知效果展示（地平线对感知的认识、解决思路、研发进度、效果）

4. 如何实现自动驾驶更高效落地（地平线的规划、量产实践）

嘉宾

任伟强

地平线

2021-10-30

18:00-18:00

结束

签到

致辞：包研——LiveVideoStack 创始人

包研

LiveVideoStack , 创始人，主编

70后，5年的开发者社区运营经验，10年科技媒体记者编辑经验。在创立LiveVideoStack之前，曾在迅达云供职并担任市场总监。此前，在InfoQ（极客邦科技）担任策划总监等职位，负责技术大会策划、商务项目支持、技术内容输出等；再之前，在CSDN担任云计算频道编辑，承担技术大会策划及云计算生态技术内容输出等工作。包研曾在北京工商大学计算机及应用专业求学四年。

联席主席致辞: 从微信看视频图像技术——谷沉沉

谷沉沉

腾讯专家研究员 , 微信视频技术负责人

谷沉沉，腾讯专家研究员，微信视频技术负责人。2007年毕业于哈尔滨工业大学，在校期间参与过AVS、H.264SVC等视频编解码标准技术研究，加入腾讯后的十余年时间里一直专注于视频图像实用技术研发，先后主导过QQ、微信、腾讯视频等产品的视频技术，目前主要负责微信视频通话，朋友圈、视频号、消息、公众平台等各类图片和短视频业务相关的视频图像技术研发和团队管理。拥有丰富的视频技术研究与互联网产品业务实践经验，在国际视频领域知名学术会议刊物上发表多篇论文，百余项视频技术领域的发明专利在国内外获得授权，其中两件独立发明的专利荣获中国专利奖。

视频大时代下基础架构的演进趋势

黄琦

快手 , 短视频架构负责人

2021年加入快手担任短视频架构负责人，致力于通过视频基础架构的研究与设计为用户提供极致视频体验。2012-2021年间，曾在Facebook先后参与了Haystack存储系统、CDN缓存、Gorilla时序数据库、TAO图谱存储、XDC跨数据中心系统、以及SVE流媒体引擎的设计与开发，并作为第一工程师协助创建了视频基础架构团队，负责Facebook全系产品媒体处理架构的演进与升级。在此之前，先后与华中科技大学与康奈尔大学获得学士与博士学位。

编解码再进化：Ali266与下一代视频技术

叶琰

阿里巴巴研究员 , 阿里云智能视频云视频标准与实现负责人

叶琰是阿里巴巴研究员，阿里云智能视频云视频标准与实现负责人。她负责视频云在 ITU-T VCEG 、 ISO/IEC MPEG 、AVS等国际和国家视频标准组织的技术开发，涉及视频编解码、AI视频质量评估、VR/AR等先进技术的研发工作。在加入阿里巴巴之前，她曾在 InterDigital、杜比和高通等公司就职。叶琰多年从事视频编解码标准制定，她参与了多项视频编解码与流媒体的国际标准制定工作，包括 H.266/VVC，H.265/HEVC ，SHVC，MV-HEVC，SCC，H.264 SVC，MPEG DASH和MPEG CMAF 等标准。她曾担任VVC 测试模型文档、 360Lib 算法描述文档、HEVC 可扩展和HEVC SCC 扩展标准的编辑。她目前担任INCITS L3.1（MPEG development activity）主席以及MPEG visual quality assessment顾问组360全景视频主席。她是50多篇学术论文的作者，130多篇美国授权专利以及230多篇美国专利申请的发明人。她是IEEE高级会员。她在中国科技大学获得本科及硕士学位，在加州大学圣地亚哥分校获得博士学位。

视频产业新挑战与新机遇

朱照远

镕铭微电子 , CEO

朱照远，镕铭微电子公司CEO。镕铭微电子是一家研发视频处理芯片（VPU）和可计算储存芯片（Computational Storage）的创新型芯片公司。在加入镕铭之前，朱照远就职于阿里云，担任视频云总经理，负责阿里云视频云、CDN、边缘计算等产品的业务和技术研发。在其就职期间，阿里云视频云和CDN被IDC等国际权威咨询机构多次评为中国市场第一。朱照远对视频产业和应用有深刻的理解，对于云计算技术和视频技术等领域有较深的研究。另外，他也是开源Web服务器项目Tengine的发起人。

午餐&休息

讲师问诊

换场

新一代音视频终端引擎框架设计和技术实现

常青

腾讯云专家工程师 , 腾讯云音视频终端研发总经理

2008年加入腾讯，在客户端技术研发领域有着深厚的积累，先后参与过 PC版QQ、手机 QQ和智能硬件等项目，目前在腾讯云负责音视频相关产品的终端技术的研发和团队管理工作。

音视频前端跨平台技术应用

牛赞

腾讯云高级工程师 , 腾讯云音视频Web前端核心开发

2015年加入腾讯，先后负责过王者荣耀、英雄联盟竞猜、QQ会员等业务，目前负责腾讯云实时音视频TRTC前端技术研发工作。

腾讯云海外音视频技术架构

胡仁成

腾讯云高级工程师 , 腾讯云直播海外技术负责人

2017年加入腾讯云，负责海外直播产品以及媒体服务产品的研发和优化相关工作，致力于打造分布式、高可用、高质量的直播流媒体处理分发平台。

云渲染技术框架及互动新玩法

王超

腾讯云专家工程师 , 云渲染技术负责人

2011 年加入腾讯，曾负责过 QQ 音视频后台开发，2015年开始参与腾讯视频云相关技术的研发，目前负责云游戏、云桌面、云渲染的技术研发工作。

全真时代与智能时代的多媒体技术

李松南

腾讯专家研究员 , 多媒体实验室融合媒体总监

毕业于哈尔滨工业大学计算机科学与工程系，获得计算机科学与技术专业学士与硕士学位。2012 年在香港中文大学电子工程系获得博士学位。2014 年至 2016 年期间，在香港中文大学电子工程系担任研究助理教授。在图像处理与计算机视觉领域有 15 年的研发和产业化经历。研究方向包括图像降噪、人脸重建、三维跟踪、图像质量评估、视频编解码等。相关成果在 TPAMI、TMM、TCSVT、TIP、CVPR 等计算机视觉、图像处理领域顶级期刊和会议上发表。2019年加入腾讯以来担任腾讯多媒体实验室视频技术总监，带领团队研发了基于信号处理和深度学习的多媒体内容处理、分析、理解等多项技术与产品。

美摄科技素材创作平台构建

黄裔

北京美摄网络科技有限公司研发总监

黄裔，北京美摄网络科技有限公司研发总监，10年图形图像处理技术研发经验。拥有10余项专利技术，参与发表软件著作3项，2015年“影视内容超高清后期特效包装系统”获中国电影电视技术学会科学技术奖一等奖，2014年“新一代影视内容高端特效包装系统的开发及应用”获中国电子学会技术发明二等奖。目前负责美摄SDK、OPPO、VIVO、人民网、网易、小程序、云非编等多个大型项目的研发工作。

智能视频生产中专业视频预设和视频模板数据导出规范的探索

李志强（节子）

杭州视杏科技有限公司 , CEO

杭州视杏科技有限公司CEO。8年视频底层渲染合成技术研究经验。独立研发了跨平台的视频处理方案-VE视频引擎的底层研发。2017年成立了杭州视杏科技，为细分行业提供视频技术解决方案。

半监督、自监督算法在数字内容风控业务上的落地

崔若璇

网易易盾 , 资深AI算法工程师

早期专注于研究AI算法对医学图像的自动分析，现主要从事数字内容风控领域的计算机视觉算法研发与落地，重点参与了网易易盾AI智能内容分析算法的研发与优化。在半监督、自监督学习，图像篡改检测等方向有着丰富创新实践经验，并拥有多项相关领域专利。

待定

刘歧

快手 , 音视频资深架构师

刘歧，快手音视频资深架构师，FFmpeg 开发者，FFmpeg GSoC Mentor曾效力于蓝汛、高升控股、金山云等公司任职音视频流媒体架构师、技术专家、技术总监等职位，主持研发音视频流媒体系统、音视频流媒体CDN系统。

换场

视频编码标准、优化和画质评估

刘明

字节跳动 , 资深研究员

博士，毕业于哈尔滨工业大学，现在字节跳动多媒体实验室工作。曾参加3D-HEVC标准制定，并担任Software Coordinator，多次担任CE-Coordinator；共同提出H.265/HEVC下一代标准的第一个探索平台，在其中贡献多项技术；参加H.266/VVC标准制定，担任CE-Coordinator。有数十项提案被H.266/VVC标准及3D-HEVC标准采纳。同时，也是字节跳动编码器的核心开发人员之一，参与开发的两个编码器在MSU多项比赛中获得第一。

罗亚

字节跳动 , 资深研究员

罗亚，目前在字节跳动负责视频自适应编码和质量评估的创新技术和应用。加州大学圣芭芭拉分校博士，清华大学学士和硕士，IEEE高级会员，曾在Intel研究院担任资深科学家。研究领域包括视频自适应编码、视频质量评估、多媒体通信等方面，发表20余篇论文和20余项专利。

抖音背后的RTC是如何追求极致的

朱利安

字节跳动 , 实时音视频（RTC）产品负责人

朱利安，字节跳动实时音视频（RTC）产品负责人，专注音视频领域研发和产品工作13年。主要负责火山引擎多媒体中台实时音视频产品化工作，支撑抖音、火山、西瓜视频、清北网校、仙境传说等app中的音视频通信的实现方案、体验优化和成本优化，并打造RTC的行业标准化。，字节跳动实时音视频（RTC）产品负责人，专注音视频领域研发和产品工作13年。主要负责火山引擎多媒体中台实时音视频产品化工作，支撑抖音、火山、西瓜视频、清北网校、仙境传说等app中的音视频通信的实现方案、体验优化和成本优化，并打造RTC的行业标准化。

从体验出发，构建以增长为目标的视频服务体系

浩铭

字节跳动 , 点播技术研发负责人

浩铭，字节跳动点播技术研发负责人，有十多年视频云产品研发工作经验，在字节跳动负责过视频中台基础技术开发、视频云产品化、火山引擎开放平台建设等工作，在流媒体传输、视频处理、体验优化、公有云开放平台建设方面有比较丰富的经验积累。

直播新玩法背后的音视频技术演进

徐鸿

字节跳动 , 直播客户端SDK研发负责人

拍乐云基于AV1的实时视频系统技术实践

章琦

拍乐云Pano , 合伙人&首席科学家

章琦，拍乐云首席科学家&合伙人。浙大数学系硕士毕业，20年视频开发经验，8年WebEx音视频引擎架构师工作经验，OpenH264作者，历任虹软、WebEx、网易等公司，精通视频算法，也精通音视频工程，主导了多家公司的音视频引擎架构设计，深入理解人工智能技术以及其在实时通信领域的应用，有年服务千亿级分钟音视频通话的经验。

欢聚集团AV1技术实战

刘安民

欢聚集团 , RTC技术部视频算法团队负责人

刘安民，2007年毕业于浙江大学信电系(学士)，2012年毕业于新加坡南洋理工大学(博士)。在视频压缩与视觉信号处理领域有十余年的研发和产业化经历。相关成果在TIP/TCSVT等顶级期刊上发表，引用数过千；也广泛应用于公司各类产品当中。2017年加入欢聚集团(JOYY Inc.)，现任职于RTC技术部，负责视频算法团队，职责包括编解码内核优化、编码方案设计、画质提升等。

迈向更智能的视频压缩：信号，感知和语义

贾川民

北京大学计算机科学技术系 , 博士后研究员

贾川民，北京大学计算机科学技术系博士后研究员，主要研究内容包括多媒体信号处理、视频编码与机器学习。在视频编码领域知名学术会议期刊发表论文30余篇，申请十余项发明专利，担任ICIP、ICME会议TPC Member，曾获PCM 2017最佳论文奖、IEEE Multimedia Magazine 2018年度最佳论文奖、IEEE MIPR 2019最佳学生论文奖。入选北京大学博雅博士后计划，人力资源与社会保障部博士后创新人才支持计划。

换场

ZEGO即构如何构建全球实时音视频通信云

肖潇

即构科技 , RTC后台技术总监

肖潇，10年后台架构设计和开发运营经验，现任即构RTC后台技术总监，对于低延迟接入、海量有序数据网络、流媒体调度有深入的研究理解。原乐信集团业务中台技术副总监，历经金融开发、交易系统开发、音视频开发等多个技术领域，工程经验丰富。

影视媒体和直播娱乐的海外公有云出海战略

崔海涛

IBM , 大中华区云计算平台产品总监

探探直播在海外市场的落地调优实践

刘岩

陌陌 , 直播媒体中台运维负责人

刘岩，陌陌，直播媒体中台运维负责人。参与RTC、CDN相关业务架构技术方案设计和落地，目前主要负责监控平台建设、服务质量保障、用户体验优化等相关工作。

Opera视频出海非洲面临的技术挑战及应对

张建磊

Opera , 技术副总监

张建磊，Opera技术副总监，2012年毕业于中科院计算所，先后在腾讯、学霸君、Opera等公司任职，目前主要负责Opera视频推荐工程架构及视频处理平台等相关工作。

微信亿级通话的音频技术优化之路

乔宁博

腾讯专家研究员 , 微信通话音频技术负责人

2011年毕业于四川大学，从事音频实用技术研发十余年。加入腾讯后主导了微信等产品的音频技术研发，目前主要负责微信音频通话、语音消息、短视频等各类音频相关业务的技术研发和团队管理，拥有丰富的音频技术研究与互联网产品业务实践经验。团队研发的音频技术，除应用于微信通话外，在游戏语音通话中也有广泛应用。

荔枝语音直播中的高音质技术实践

沈俊聪

荔枝 , 音频技术负责人

2010年7月到2013年3月，在华为担任音频算法工程师，负责华为手机的语音增强等模块。2013年4月到现在，在荔枝担任音频技术负责人，先后带领团队完成了几个重要项目：手机端音频节目录制工具，让用户低门槛录制高音质音频节目；高音质音频直播引擎，让用户很容易就能在手机上进行高清语音直播；AI声音理解后台，能对不同声音事件进行快速分类。

K歌中的歌唱评价与嗓音分析

高月洁

网易云音乐 , 高级音频算法工程师

高月洁，网易云音乐高级音频算法工程师。主要研究领域为歌唱评价与嗓音分析。负责音街（网易云旗下K歌app）的综合评分系统设计与算法研发，参与音街歌手能力图谱项目，参与Look直播、云音乐嗓音相关算法研发。

音频场景分类及下游应用

张俊博

小米 , 语音技术专家

小米语音技术专家。博士毕业于中国科学院声学研究所，多年从事智能语音技术的研究和应用，在语音识别、发音评测、语音合成等领域都做过深入的工作，在顶级会议和期刊发表论文10余篇。目前在小米负责若干项语音新技术的研发。

Q&A

结束

VIP社交晚宴

签到

低延时技术在节目生产中的应用

韩嫕

央视频融媒体发展有限公司技术总监

央视频融媒体发展有限公司技术总监。在媒体行业工作十年，专注与视频技术以及高并发应用技术，带领团队完成多个国家重要项目。

短视频内容理解与生成技术在美团的创新实践

马彬

美团 , 高级算法专家

马彬，美团高级算法专家。2014年博士毕业于北航计算机学院，2017年加入美团，目前主要负责线上短视频方向的技术研发工作，包括：内容理解，编辑处理与创作生成。此前曾就职于佳能研究院，研究方向为图像视频中的场景文字识别。

云音乐在视频内容创作上的探索

尤才乾

网易云音乐 , 资深音视频工程师

尤才乾，网易云音乐资深音视频工程师。多年的视频编辑特效开发经验。负责云音乐动效引擎底层渲染功能的开发，以动效引擎为基础支持了云音乐相机拍摄，K歌作品歌词模版化输出，视频编辑等等功能。

H265在七牛QRTC场景的落地运用

朱玲

七牛云 , 视频编解码负责人

朱玲，七牛云视频编解码负责人。中科大硕士毕业，先后就职于webex，网易，阿里巴巴，有10多年视频编解码研发及直播,rtc等应用场景音视频质量优化实践经验。

七牛云音视频质量分析系统发布

陈辉

七牛云 , 技术总监

七牛云，技术总监。主要带领七牛云的直播、QRTC、SDK等团队升级产品能力和攻克技术难关。曾主导过大型服务化体系建设和业务中台建设，有着丰富的性能调优和架构设计经验。

QRTC 客户端音视频质量优化实践

霍锴

七牛云 , 架构师

拥有丰富的音视频领域开发和实战经验，曾主导开发过短视频，播放器，推流等多个音视频相关的 SDK，醉心于设计简单、优雅、极致人性化的 SDK。负责七牛 RTC 客户端的设计与实现，并主导完成了互动直播解决方案。

七牛云实时音视频网络质量优化

谢然

七牛云 , 实时互动架构师

七牛云直播与实时互动架构师，长期从事音视频服务端和流媒体领域开发，在多媒体服务架构设计、网络性能优化和流媒体协议优化上有比较多的积累。JOY4 & JOY5开源项目作者。

Q&A换场

如何用好共享经济模式下的边缘计算资源

王闻宇

PPIO边缘云 , CEO&联合创始人

连续创业者，原PPTV首席架构师兼联合创始人。2004年，作为大学生在宿舍开始了PPTV的创业，独自完成大部分核心代码，主导P2P、CDN、流媒体等核心技术；2018年创办PPIO，开发了分布式计算、存储、网络服务的边缘云平台，实现了低延迟、大带宽、高性价比。

云、网、边融合释放云平台设施潜力-金山云边缘云实践

斯文

金山云 , CDN及视频云产品中心副总经理

CDN行业资深专家。先后就职于蓝汛、盛大、百度等公司。2019年起，负责金山云边缘计算业务，主导边缘计算平台的研发与运营工作，带领团队从0搭建了金山云边缘容器系统、边缘云游戏系统，主导设计AIoT边缘计算架构。

探讨视频云与边缘云平台的竞争力 — 基于Serverless的端边云一体化媒体网络

卢志航

华为云 , 媒体服务RTC产品总监

华为云RTC产品总监，毕业于中国科学技术大学，长期负责视频领域工作，曾负责德国电信IPTV业务、华为云CDN体验优化，现负责华为云CloudRTC产品规划与项目研发工作，在媒体网络演进、竞争力落地和解决网络拥塞导致卡顿等问题有丰富的经验。会议演讲

冲刺最后一公里 — 音视频场景下的边缘计算实践

曾伟纪

网心科技 , 首席架构师

2015年加入网心科技，从零开始参与打造星域CDN、星域云边缘计算平台等多个产品，构建了百万量级的边缘节点网络以及在此基础之上的计算、存储、传输应用，目前负责星域云多个产品线的研发管理。在加入网心前任职于腾讯云，主导腾讯云移动推送服务（TPNS）的研发工作。

视频边缘智能服务

郭勐

中国移动研究院 , 多媒体基础研究员

郭勐，博士，中国移动研究院多媒体基础研究员。长期从事多媒体信息处理、边缘计算、深度学习等技术研究。主要承担和完成视频边缘智能平台、视频云平台、多媒体评测、重大专项等项目。牵头建成移动音视频质量评测专业实验室，开展VoLTE、移动视频等业务测试及优化。申请专利二十余项，曾获集团科技进步一等奖等多项奖励。

微博视频处理系统的云原生之路

黄阳全

微博 , 微博视频平台架构师

17年加入新浪微博，微博视频平台架构师，参与了微博视频多次架构升级，曾主导微博视频中台的建设。近几年专注于云生态领域，目前正在建设基于云原生架构的微博转码系统。

虎牙直播的云原生网络发展实践

李国超

虎牙 , 技术经理

李国超，虎牙技术经理，2019年初加入虎牙，8年基础设施研发经验，专注于机房级网络能力建设及云原生的相关研发落地实践，参与并主导了虎牙容器网络、边缘SDWan及相关网络中间件的研发工作，目前是虎牙基础网络与容器网络的负责人。

Q&A 换场

圆桌论坛：海外音视频生态发展，机遇与挑战

赵加雨

拍乐云 , 创始人&CEO

赵加雨，拍乐云创始人 & CEO，音视频技术专家，资深程序员，足球爱好者，崇尚极简主义，简单就是生产力。东南大学计算机系毕业，从事实时音视频领域技术18年，精通音视频整体架构和技术。曾任Cisco Webex 美国架构师、网易云信 CTO等职，在整整14年外企氛围的熏陶后，2017年寻求改变，离开美国回国加入互联网云服务浪潮。2019年创立了国内第一家视频会议背景的实时音视频 PaaS 云服务公司拍乐云，深耕技术创新、场景研究和行业洞察，致力于为企业和开发者提供更好的实时音视频、互动白板、互动直播等产品，构建云上的每一次美好互动。

吉奇

网易云信 , 服务端首席架构师

毕业于中国科学技术大学和Clemson University。曾在硅谷工作生活，就职于Verizon，负责视频广告业务API平台及服务端设计实现。2017年回国后接触到RTC和通信行业，曾作为传输大网团队核心成员完成了很多关键项目，也从0-1搭建过信令和IM系统。加入网易云信后负责自研大规模传输网WE-CAN的设计实现。在大型分布式系统后台、高并发、网络传输等领域有深厚的理论积累和实践经验。

曾凡平

快手 , 音视频中台技术负责人

曾凡平，快手音视频中台技术负责人，主要负责快手音视频中台建设和海外业务的音视频体验优化工作，对短视频、直播的全链路优化有丰富经验，对出海业务如何提升音视频体验有深入的认识。加入快手前曾在金山云、百度等公司主导音视频系统开发和优化工作，有近10年的音视频行业经验。

牛继宾

首都在线 , CPO兼创新产品事业部总经理

现任首都在线CPO，负责首都在线公有云、边缘云等产品规划与落地，擅长云计算与大数据相关技术，以及云管理平台架构设计，除了底层平台技术，对云计算解决应用系统的实际问题、应用的云化、分布式改造、上云业务支撑等也有丰富的经验。有着众多的私有云、公有云落地的实践与经验，涉及云计算的层次包括IaaS、PaaS、SaaS。

圆桌论坛：开源技术与商业的融合之路

刘歧

快手 , 音视频资深架构师

杜金房

烟台小樱桃网络科技有限公司 , CTO

杜金房，烟台小樱桃网络科技有限公司CTO。FreeSWITCH开源项目核心Committer，FreeSWITCH中文社区创始人，《FreeSWITCH权威指南》作者，FreeSWITCH培训讲师，开源信徒和布道者。

段维伟

RTC/VOIP独立开发者 , flutter-webrtc/ion开源社区维护者

Voip/WebRTC 资深从业者, 擅长跨平台SIP/RTC 客户端开发，熟悉音视频，采集渲染编解码流程，擅长视频会议SFU/MCU 等服务端开发, Flutter-WebRTC开源社区发起/维护者,Pion/ION 分布式RTC 开源项目发起之一/维护者, 曾为日企提供voip 客户端/服务器端技术支撑，为国内多家公司提供SIP视频对讲及WebRTC视频会议解决方案。

熊子良

百度 , 资深研发工程师

百度资深研发工程师，近10年流媒体研发经验，zlmeidakit开源项目发起者，目前主要关注视频监控、直播、WebRTC技术的融合与落地。

圆桌论坛：视频会议的下半场

张军

科天云 , 研发中心总经理

张军，科天云研发中心总经理，曾任思科Webex中国区协作云平台技术负责人。27年协作通信及云服务产品开发经历，丰富的实时通信与视频会议研发经验，音视频技术专家。他带领研发团队自主开发了科天云音视频aPaas平台、视频会议、智能客服等产品，并持续专注于音视频技术与其他新兴技术的融合创新。

李志涛

北京二六三企业通信有限公司 , 技术总监

先后负责研发二六三自主运营邮件系统、即时通信系统、音视频系统等。

商世东

腾讯会议天籁实验室 , 总经理

2019年年初回国加入腾讯天籁实验室，担任腾讯会议天籁实验室总经理。率领团队负责腾讯会议端到端实时音频技术研发和体验，拥有近20年音视频领域相关经验，先后工作过摩托罗拉和杜比实验室，负责创建杜比北京的工程研发团队。加入腾讯前，担任杜比中国和澳大利亚高级研发总监。

曹俊

华为云 , 云会议领域总经理

2006年加入华为，曾任VIDEO CLOUD产业负责人，华为云产品运营总监，现任华为云会议领域总经理。对于软件产业、云计算产业、以及视频会议产业有丰富的行业经验。致力于利用云、AI、5G等技术，打造全联接的云会议产品。面向市场推出全场景会议和行业远程协作两大类解决方案，满足广大客户远程沟通和行业协作需求。

基于GPU, FPGA，ASIC等平台对快手的多媒体业务的异构方案探索

颜伟成

快手 , 异构计算部门架构师

快手异构计算部门架构师，2019年快手 -- 负责快手音视频异构计算方案探索和部署；2014年紫光展锐 -- 手机芯片研发；2007年 C2Micro -- 多标准硬件编解码器开发。

AI辅助编解码的ASIC解决方案

刘迅思

镕铭半导体 , 工程副总

镕铭半导体(NETINT)工程副总。负责硬件编解码卡软件和固件的开发和产品化。目前负责的硬件编码卡产品在大型数据中心和头部视频公司都有规模部署。之前在codec IP公司和存储公司的从业经历，帮助实现了可计算存储架构在视频编解码领域的产品化。

AI在视频处理领域的应用

张磊

瀚博半导体 , 创始人、CTO和总架构师

张磊，瀚博半导体创始人、CTO和总架构师，负责全部产品路线图，架构，技术和解决方案。瀚博半导体研发高性能通用加速芯片，致力于成为驱动云边计算的算力源泉。张磊有二十多年视频IP、芯片和系统经验，曾任AMD Fellow负责AI、深度学习，视频编解码和视频处理领域。曾全面负责AMD所有关于视频的全球一线客户，技术、构架、产品路线图，产品广泛应用于视频转码、视频会议、视频直播、游戏直播和云游戏等领域，同时也曾任AMD AI领域的院士级别架构师。他持有视频和AI领域50多项全球专利和专利申请。

Q&A 换场

网易云信自研大规模传输网核心系统架构剖析

吉奇

网易云信 , 服务端首席架构师

透过HESP实现媲美广播的超低延迟播放体验

卢彦林

Synamedia , 流媒体分发技术发展经理

卢彦林， Synamedia 流媒体分发技术发展经理，主要负责OTT业务。拥有超过十年的视频处理行业经验，曾在不同的国内外知名企业担任技术管理工作，包括腾讯、Ateme和Harmonic等。对视频编码及流媒体分发技术有着深入的了解，目前致力于视音频及流媒体新技术的推广和销售工作。

午餐&休息

讲师问诊

解密华为云媒体质量管理最新实践成果 — “视镜”

康永红

华为云 , 媒体服务资深研发专家

图像质量评价模型的构建方法和应用

方玉明

江西财经大学 , 信息管理学院院长

方玉明，江西财经大学信息管理学院院长，教授、博导，国家优青。主持基金委优青和面上项目、科技部重大项目课题等20余项；发表IEEE汇刊和CCF A类论文60余篇，谷歌学术引用4600余次；担任多个国内外期刊编委，兼任中国计算机学会南昌分部主席、中国图象图形学学会理事、江西省电子学会副理事长等。获2019年江西省自然科学奖一等奖。

大众点评APP视频播放体验优化实践

夏明钰

美团 , 大众点评客户端音视频研发负责人

2015年加入美团，现任大众点评客户端音视频研发负责人，致力于为大众点评各业务提供优质高效的视频播放服务，并结合高性能播放器与视频预热等手段提升用户体验，具体工作包括质量监控、性能调优、体验优化等。

京东直播技术的演进之路

吴忠

京东 , 架构师

北京邮电大学硕士毕业，深耕音视频行业十多年，主要擅长直播，实时音视频技术方向，曾任全时云视频会议音视频技术负责人，17年加入京东，担任架构师，负责直播，RTC,电话相关技术工作。带领团队从零搭建京东RTC音视频平台1.0，支撑京东各个相关业务产品线，同时对线上直播技术进行深入优化，并且做为京东618 /双11 直播总指挥，成功的保障每次直播大促。

Q&A 换场

大众点评客户端视频播放器研发探索与实践

田维新

美团 , 大众点评客户端播放器研发负责人

大众点评客户端播放器研发负责人。八年移动开发经验，负责大众点评视频播放器架构设计和内核研发，致力于打造高性能播放器，并通过技术优化提升流畅度和清晰度等用户视频播放体验。主导视频监控平台建设、画质增强、性能调优等项目。

微博客户端HDR视频播放的落地实践

刘文

微博 , 客户端播放器研发负责人

微博客户端播放器研发负责人。负责微博客户端短视频播放和直播播放内核的研发。围绕画质提升、卡顿优化等方面不断提升用户的观看体验。通过调优视频消费链路的各个环节节约视频带宽的成本。

面向在线教育业务的流媒体分发演进

周晓天

网易有道 , 音视频核心研发工程师

网易有道音视频核心研发工程师。毕业于中科院计算技术研究所，负责自研音视频系统设计与研发。

实时音视频在教育场景的应用实践

冯权成

好未来 , 直播中台产品负责人

毕业于四川大学通信工程专业，作为一名有技术背景的产品经理，在音视频行业从事产品工作多年；早前，曾先后在阿里云、金山云做视频云相关产品工作，对CDN、视频云、直播云、RTC等产品和解决方案有深刻理解和丰富实战经验。现今，在好未来直播中台，打造自研RTC+CDN直播云+点播云全场景音视频产品矩阵，支持集团前台业务的音视频需求。

Q&A 换场

“三位一体” — 云原生视角下的视频生产全流程技术实践

邹娟

阿里云智能视频云 , 高级技术专家

邹娟，阿里云智能视频云高级技术专家、阿里巴巴集团内容架构组成员、阿里云视频云媒体生产平台研发负责人，从0到1主导了阿里云AI视频和云剪辑等重点产品的研发工作。具有多年传媒媒资管理与音视频内容生产平台的研发经验，曾作为核心成员主导了《新一代电视台网络化制播系统及重大应用》等重大项目，荣获2013年国家科技进步一等奖等多个国家级奖项。会议演讲

拥抱智能，AI视频编码技术的新探索

王钊

阿里云智能视频云 , 算法专家

阿里云智能视频云算法专家，从事视频编码标准、软件编码器、AI编码、图像视频处理等领域。博士论文获评《北京大学优秀博士学位论文》，一作顶级期刊TIP/会议CVPR、DCC等近10篇，获得2016 VCIP Best 10% Paper Award, 2018 ICIP Best Student Paper Award。

基于微内核的阿里云下一代音视频引擎技术

陈虓将

阿里云智能视频云 , 高级技术专家

陈虓将，阿里云智能视频云高级技术专家，LiveVideoStackCon大会优秀讲师。2017~2020年负责淘宝直播音视频技术，将传输协议从RTMP升级到WEBRTC，并在行业首推超低时延直播。2020年作为发起人和架构师，联合CDN、视频云、淘宝直播和企业智能等多个团队共建GRTN项目，旨在推进音视频底层技术的大融合。陈虓将现负责阿里云视频云架构升级业务，推进客户端一体化和服务端能力大升级。

效能与未来：算法创新驱动的云端一体新视界

杨凤海

阿里云智能视频云 , 高级算法专家

阿里云智能视频云高级算法专家、视频云实时异构AI算法团队负责人，具有多年音视频通信、流媒体服务、计算机视觉算法等研发经验，主导完成了阿里云视频云场景化应用算法、视频画质增强算法在异构平台的研发和落地。

Q&A 换场

高性能且灵活的 iOS 视频剪辑与特效开源框架 - VideoLab

阮景雄

RingCentral Video , 移动端架构师

负责 RingCentral Video 移动端架构，RingCentral APP iOS 模块化演进。曾在美图公司担任美拍 iOS 负责人，在 iOS 视频处理、视频播放、直播以及社区等领域有着丰富的经验。iOS 视频剪辑与特效开源库 VideoLab 作者。

鸿蒙媒体框架及音频跨设备播控技术

谭利文

华为终端 , 音视频技术专家

15年以上终端多媒体领域研发与设计工作经验，覆盖多媒体从下到上全栈技术；2014年加入华为后，主要负责主导终端多媒体框架相关技术的建设与演进，以及关键媒体竞争力特性的构建与产品落地；并担任鸿蒙媒体框架核心架构师，主导鸿蒙媒体关键分布式技术的需求分析、架构方案的设计与评审。

SRS服务器RTC级联与QUIC传输协议

肖志宏

腾讯 , 高级工程师

肖志宏，腾讯高级工程师，开源爱好者，SRS主要开发者、技术委员会成员之一，目前主要专注于流媒体传输领域。

使用现代前/后端技术(flutter+go)降低WebRTC开发门槛

段维伟

RTC/VOIP独立开发者 , flutter-webrtc/ion开源社区维护者

Q&A

城市末端道路场景下的无人驾驶技术与挑战

申浩

美团 , 无人配送部技术总监

申浩，博士毕业于中科院自动化所，先后在联想、Intel和阿里从事智能机器人的研究，17年加入美团无人配送部，研发了小袋无人配送机器人，目前为无人车高精地图和定位方向负责人，研发城市公开道路下的末端配送技术。在CVPR、ICRA等发表论文十余篇，授权专利50余项。

智能驾驶3D目标检测所遇到的问题

陈亚冉

中国科学院自动化研究所 , 副研究员

陈亚冉，中国科学院自动化研究所，副研究员，针对智能驾驶环境感知问题主持和参与多项国家自然基金，北京市重点研发计划和华为公司合作的项目，发表论文26多篇，其中SCI源论文10篇，取得多项国际国内比赛第一名，获得包括IEEE汇刊2020年度唯一优秀论文在内的多项论文奖励。

软硬结合，加速高级别自动驾驶落地

任伟强

地平线

任伟强，博士毕业于中科院自动化所，曾就职于百度深度学习实验室，从事计算机视觉方面的研究工作。任伟强于2015年9月加入地平线，从事视觉算法在自动驾驶领域的应用与产品落地工作。他参与和带领感知算法团队参与了基于征程2、Matrix自动驾驶计算平台等自动驾驶产品的感知算法方案设计和产品算法研发工作，构建和完善了驾驶感知算法的研发流程和平台工具，目前他主导的前视ADASA解决方案已经实现大规模量产落地。

结束

活动门票