LiveVideoStackCon 2018音视频技术大会

免费报名中

139723 人关注

时间 2018-10-19 09:00 ~ 10-20 18:00

地址北京海淀区北京丽亭华苑酒店

活动由 LiveVideoStack 和 CSDN 主办

免费报名中

139723 人关注

微信分享

使用微信扫一扫分享到朋友圈

活动分享

使用微信扫一扫进入小程序分享活动

活动日程

2018-10-19

2018-10-20

2018-10-19

09:00 -12:00

主题演讲

纵览音视频新技术与应用新趋势。

2018-10-19

08:50-08:55

主办方致辞

嘉宾

包研

LiveVideoStack , 创始人，主编

2018-10-19

08:55-09:05

联席主席致辞：Visionular Co-Founder & Chief Scientist

嘉宾

Zoe Liu

Zoe Liu Visionular Inc Co-Founder, President & Chief Scientist

2018-10-19

09:05-09:50

From VP9 to AV1 and beyond

Google embarked on the WebM Project in 2010 to develop open source, royalty-free video codecs designed specifically for media on the Web. The second generation codec released by the WebM project, VP9, is currently served by YouTube, and enjoys billions of views per day. Realizing the need for even greater compression efficiency and to cope with the ever-increasing demand for video on the web, Google joined a consortium of major tech companies called the Alliance for Open Media in 2016, and started an ambitious project to develop a next generation royalty-free codec AV1. AV1 was finalized in June 2018, and achieves about an one-third reduction in bandwidth over current generation codecs VP9 and HEVC at a practical hardware and software complexity. This makes AV1 the most advanced video codec available today that is also royalty-free. In this talk, I will provide a technical overview of the most innovative coding tools in AV1, followed by coding results on standard test sets compared against VP9 and HEVC.

嘉宾

Debargha Mukherjee

Google Member of Technical Staff , Video Codec Specialist

2018-10-19

09:50-10:35

新一代视频编码标准

本次分享主要介绍最新一代VVC和AVS3视频编码标准进展，包括关键技术特色及未来应用展望。

嘉宾

马思伟

北京大学信息科学技术学院教授

2018-10-19

10:35-11:20

AI技术开启视频娱乐新时代

“给我一个支点,我可以撬起地球。”AI就是视频行业中那个支点，人工智能赋予了视频更多新玩法，AI技术的运用使爱奇艺更懂内容，体现在生产，内容，分发，变现等方面，为广大用户带来新体验。在本次分享中，和大家一起讨论，AI在视频娱乐中的新技术应用及未来发展。

嘉宾

刘文峰

爱奇艺首席技术官

2018-10-19

11:20-12:05

用户导向的音视频体验优化

工程师、科学家们往往喜欢从技术角度出发来思考问题，设计产品，比如无人机、VR眼镜、3D电视等，有可能会产生颠覆性的创新，也有可能曲高和寡。快手是一个面向用户的内容平台，倾向于采用用户导向的方法。本次我们将分享快手是如何以用户体验为导向，结合工程、算法、大数据方面的实践，构建面向未来的音视频技术体系的。

嘉宾

于冰

快手音视频技术负责人

2018-10-19

14:00 -18:00

前端与客户端

业务落地离不开端。端是云计算能力的出口，又是用户流量的入口。端的体验决定了用户的留存，对业务的成败起着关键作用。端上能做什么？怎样才能做好端？让我们一起走进端上世界。

2018-10-19

14:00-14:45

The company that invented streaming media continues to innovate new video technologies

Reza Rassool will report on their latest advances in CODEC, streaming technology, and consumer experience as well as the ground-breaker achievements in video computer vision.

嘉宾

Reza Rassool

RealNetworks CTO

2018-10-19

15:00-15:45

高效移动端视频处理架构关键技术

随着短视频成为人们竞相追逐的新风口，移动端视频处理需求与日俱增。如何高效地在移动设备上处理视频成为至关重要的问题。本次分享以美摄SDK的视频处理框架为依据，介绍在移动端高效处理视频的架构设计要点，涉及视频处理任务的调度，GPU的使用以及同步，硬件编解码器的利用，代理级别渲染等技术点。可供有移动端处理视频需求的相关人员进行参考。

嘉宾

郑鹏程

北京美摄网络科技有限公司CEO

2018-10-19

16:00-16:45

微博客户端播放器的演进之路

微博客户端短视频业务的发展迅速，最近几年的播放量翻了几十倍。为了承载如此大的播放量，客户端视频播放器为了更好的支持视频业务的发展，围绕着快速上线、快速启播、成本节约、稳定性等问题进行了持续的优化。未来我们希望播放器具有用户环境的感知能力，根据用户的环境提供更好的播放体验。

嘉宾

刘文

微博 , 客户端播放器研发负责人

2018-10-19

17:00-17:45

基于WebRTC的互动直播实践

互动直播已经成为直播的主要形式，本次分享将介绍INKE自研连麦整体设计思路；介绍如何基于WebRTC搭建互动直播SDK、介绍对回声消除问题的处理、对实时传输的优化；介绍为保障互动直播QOS而开发的优选、埋点、问题分析等系统；介绍对互动直播相关前言技术的探索等。上述互动直播系统，已经上线运营并达到了很好的效果，供实时音视频相关同行参考。

嘉宾

叶峰峰

映客资深音视频工程师

2018-10-19

14:00 -17:00

以我所能，为你而加 —— 腾讯云新一代音视频融合通信平台全接触

从社交到视频会议，从金融到医疗，云端通信能力正在与传统的电话/IM、呼叫中心、企业通信融合，打通各个端与渠道的数据，实现实时互联与掌控。

2018-10-19

14:00-14:20

以我所能，为你而加——腾讯云新一代融合通信平台全接触

嘉宾

李郁韬

腾讯云 , 副总裁

2018-10-19

14:20-14:50

腾讯云实时音视频解决方案的技术实现

本次分享将围绕腾讯云实时音视频（TRTC）和小程序音视频解决方案，介绍一些内部的技术细节和方案原理。

嘉宾

常青

腾讯云专家工程师 , 腾讯云音视频终端研发总经理

2018-10-19

14:50-15:20

企业通信中的音视频技术应用与前瞻

本次分享将以容联视频会议实践为案例详细解析音视频技术在企业通信领域的发展与主要应用，并展望了即将到来的5G时代中音视频、尤其是视频将迎来的更广阔的应用空间。

嘉宾

许志强

容联云通讯CTO

2018-10-19

14:00 -18:00

画质评定

图像画质是衡量视频服务，特别是视频编码优化和解码后处理的主要依据。人的眼睛是图像画质好坏的最终裁判，设计出能正确反映视觉主观感受的客观图像质量测度是工业届落地应用的关键所在。此外，视频画质评定技术需要与时俱进，不断应对新的服务需求和挑战。本专题将聚焦视频画质的评价技术的最新进展，包括反映视觉感知特性的图像失真测度，无参考图像质量测度，支持跨分辨率、多屏应用的画质测度，以及在超高清、HDR、VR等新型场景中的研究状况。

2018-10-19

14:00-14:45

视频画质提升-在腾讯视频中的应用

嘉宾

汪亮

腾讯视频视频编码团队负责人

2018-10-19

15:00-15:45

视频质量评价——从裁判到教练

视频质量评价(VQA)是视频服务系统中的重要技术要素，贯穿成像、编辑、处理、编/转/解码、渲染、显示等整个视频技术链条。理想的VQA模型接受一个输入视频/图像，能够定量地计算出一个质量分数，真实地反映出观看者的体验。本报告给听众带来如下三方面的内容：1、介绍VQA的技术图谱和工业标准；2、VQA在视频服务流程中的管理技术，包括VQA建模、工具部署、业务应用；3、VQ驱动的视觉感知编码技术、视频增强处理技术。

嘉宾

宋利

上海交通大学教授

2018-10-19

16:00-16:45

无参考图像视频质量评价

无参考图像质量评价中面临的一个重要挑战来自图像内容的多样性。当前的无参考质量评价方法在跨内容图像对的相对质量预测中与人类主观视觉感知不一致。考虑到预训练好的图像分类模型中包含有区分度的图像内容信息，为了解决上述问题，我们提出了一种基于语义特征聚合的无参考图像质量评价方法。具体地，首先我们将图像划分为多个重合的图像块，以包含图像的全部信息以及避免引入额外的几何失真；其次，使用一个自适应程序选择最合适的深度特征来表征图像的内容失真信息；然后，使用统计方法对所有图像块对应的局部特征进行聚合得到代表整个图像的全局特征；最后，一个线性模型将图像全局特征映射到图像质量分数。所提出的新方法与13种代表性的方法在7个常见的数据集中进行了广泛的比较。实验结果验证了我们的方法的优越性能和良好泛化能力。与此同时，这也表明了深度语义特征在无参考质量评价中起到了重要作用。

嘉宾

蒋婷婷

北京大学信息科学技术学院数字媒体所副教授

2018-10-19

17:00-17:45

视频编码器对比与选择

视频编码器是各类视频服务的核心组件，很大程度上决定了视频编码的效率甚至整个视频服务的质量。当今业界各类视频编解码标准、视频编码器层出，如何选择编码器成为了一个非常重要的话题。然而在实践中，视频编码器的对比中有大量的误区，经常导致不准确甚至错误的结论。本次分享会以Hulu的业界实践为基础，分享对视频编码器进行客观准确对比中的经验。

嘉宾

傅德良

Hulu 全球高级研发经理，视频编解码与传输领域资深专家

2018-10-19

14:00 -18:00

音频新体验

回声消除、减少卡顿、360度声场，耳朵对音频的要求越来越高，本专题将讨论提升音频体验的技术革新与应用创新。

2018-10-19

14:00-14:45

AI硬件中的声学问题剖析

人工智能产业领域的技术着眼点会更关注神经网络和深度学习算法以及数据，但是随着技术的落地，不可避免的要涉及到硬件产品的基础体验问题。而由于使用场景、使用方式的差异，以及人际通讯和人机对话的技术要求差异，使得人工智能硬件和传统具有音频功能的硬件又有所不同。本次分享拟从声学硬件系统的角度来剖析声学信号处理算法、声学硬件指标及相关技术对于语音交互体验的影响。

嘉宾

邓滨

广州迷听科技有限公司创始人、董事长兼CEO

2018-10-19

15:00-15:45

音频编码技术特点

针对超高清、3D等新一代试听系统，对多层级、高质量的音频编解码技术需求。国标委颁布了音频编码新国标，简称AVS2音频。本报告将从编码框架、核心技术、性能指标等方面，详细分析新国标的特点和应用前景，并展望下一代智能音频编码技术特点。

嘉宾

窦维蓓

清华大学电子工程系教授、博导

2018-10-19

16:00-16:45

娱乐遇见科学

消费者通过各种不同设备，在各种不同环境中，为了各种不同的目的而享受到的多媒体娱乐内容越来越多样化。这就要求有能够大幅度适应各种回放场景、各种使用案例和各种内容类型的信号处理和内容交付技术作为支持。在本次演讲中，我们将分享杜比如何使用多学科的科学手段开发新一代娱乐技术，我们将阐述如何构建一个生态系统，使其既能够助力内容创作人士，又能为所有最终用户提供沉浸式的一致体验。

嘉宾

Claus Bauer

杜比研究高级总监

2018-10-19

17:00-17:45

手机K歌的人声伴奏对齐优化实践

人类大脑对声音的响应速度和敏感程度非常高。K歌时对人声音轨和伴奏音轨的时间对齐有很强的要求。本次分享将主要介绍手机K歌在混音时间对齐方面存在的问题，常规的工程解决方案以及值得探索的方向。

嘉宾

王国腾

唱吧资深研发总监

2018-10-19

14:00 -18:00

服务端架构设计

架构设计永远没有最好的，只有最适合当前业务发展的，并且架构设计是需要后期的具体实现来作为最终实践的。而本专题是基于音视频领域畅谈服务端与客户端的架构设计以及实践，以及在不同阶段架构是如何不断进行演变以及进化的。无论你是一个开发工程师还是一个资深架构师，亦或是产品经理或者相关行业的从业者，都可以在本专题中学习到不同场景下音视频领域架构设计的心路历程，也可以帮助自己以后遇到同类问题的时候，心中有一个适合的架构蓝图。

2018-10-19

14:00-14:45

微博视频平台架构演进

微博作为国内最大的社交媒体平台，一直致力于向用户提供高质量的内容。从13年微博逐渐加大对于视频内容的投入开始，微博视频后端系统经历了多次迭代，由最初的每日千级简单视频处理，到如今面对百万级视频上传、数十个垂直业务方的复杂平台，本次分享将会和大家讨论微博视频后端架构的发展历程以及过程中我们经历的那些“坑”。

嘉宾

刘志勇

新浪微博视频平台资深架构师

2018-10-19

15:00-15:45

利用WebRTC给应用赋能——从一个工程师的角度

这次分享从工程师的角度来讲述如何利用WebRTC打造出具备实时互动能力的应用，包括了从信令的交互到媒体的传输需要完成的工作。这次分享旨在让大家了解从拿到开源代码到给应用赋予可靠的音视频通讯能力的实践过程。

嘉宾

郭奕

全民快乐资深音视频工程师

2018-10-19

16:00-16:45

基于HLS格式的互动直播技术实现超越RTMP的低延时

主播和观众之间的实时交流是互联网互动直播有别于传统电视的新功能。为实现双方对话的顺畅，端到端（即主播端发出画面到播放端显示画面）的延时目标一般应小于5秒。同时，在不牺牲服务质量（例如卡顿率、画面清晰度）的前提下，越低的延时能带来越好的互动性用户体验。为保证上述小于5秒的低延时，Twitch在2011年成立之初曾采用RTMP格式来推流。然而随着同时在线观众达到一定规模，有状态的推流技术逐渐暴露出它高CPU占用率、低可扩展性的缺点，从而成为平台继续发展的最大技术瓶颈。在这种情况下，Twitch于2013年开始从RTMP切换到HLS。HLS的无状态拉流和ABR特性使得网站在用户规模和体验两方面都取得大幅度提升，但另一方面也把端到端的延时扩大到10秒。为达成可扩展性、服务质量、互动性的三赢，Twitch团队研发了仍然基于HLS格式的低延时直播技术。新技术利用了HTTP 1.1的Chunked Transfer Encoding机制，并在直播分发路径从转码到播放的每一个环节都做了架构和软件的升级。Twitch的低延时功能自2018年5月初正式向所有主播开放以来，实现了3.7秒的中位数延时。对于很多网络状况良好的用户，延时甚至能小于2秒。Twitch的用户社区对这种超越RTMP的低延时表现给予了巨大的正面反馈，与此同时，根据我们的实际数据，低延时并不对容量、卡顿率等其他方面带来负面影响。

嘉宾

沈悦时

Twitch Principal Research Engineer

2018-10-19

17:00-17:45

用WebRTC打造支持复杂交互的实时互动云课堂

嘉宾

董海冰

iTutorGroup研发总监

2018-10-19

14:00 -18:00

教育专场

低延迟、高并发、高可用、互动白板，教育场景下对多媒体技术提出了更高要求。本专题将讨论教育场景下的多媒体技术的探索与应用实践。

2018-10-19

14:00-14:45

互动白板在在线教育上的应用

教育的本质是内容，在线教育也属于此范畴。而在线教育不同于线下教育，需要经过电子白板展现给用户，白板该怎么做，做成什么样是一个很有意思的话题，本次分享会通过多年实践的经验和技术，来介绍小学，初中，高中在线教育中互动白板的做法，如白板功能，白板渲染，内容合成和传输等实用经验。

嘉宾

赵文杰

学而思网校架构技术负责人

2018-10-19

15:00-15:45

51Talk音视频技术的思考及非典型挑战

本次演讲主要介绍51Talk在音视频及其相关技术上的实践、挑战和对策，包括音视频编码器的选择，客户端及服务器的设计和优化，抗丢包、延迟的一些技术以及其他一些51Talk的独特挑战。

嘉宾

陈靖

小红书 , 技术中台音视频架构部负责人

2018-10-19

16:00-16:45

基于Licode的WebRTC全球分布式架构

随着在线教育行业兴起，许多人把目光投向了国外市场，但是如何搭建一个全球化的音视频网络就成了一个大问题。本次分享主要介绍了如何利用Licode 开源服务器搭建全球分布式架构；介绍了在教育场景下为何选择以Licode为基础来架构全球和百家云在该架构优化和修改；介绍了如何利用Licode 实现WebRTC 服务器的级联；介绍如何了利用该架构解决常见的教育场景的问题。

嘉宾

陈聪

百家云研发工程师

2018-10-19

17:00-17:45

音乐场景下的实时音频解决方案

本次演讲内容主要分为以下几点：1. 一般 VoIP 框架的组成，各个模块的功能介绍，以及常见的坑有哪些； 2. 在高清音乐场景下面，普通 VoIP 框架面临的痛点；3. 云信高清音乐场景方案的大致介绍。

嘉宾

李备

网易资深音频算法工程师

2018-10-20

09:00 -18:00

监控与QoE

音视频的用户体验质量(QoE)，从媒体采集到播放，从后端处理到网络传输，取决于众多因素。如何有效地预警并解决潜在的问题，提供用户持续满意的观看和交互的体验？本专题聚焦影响音视频用户体验的重要因素，邀请相关领域的专家对此进行探讨。

2018-10-20

09:00-09:45

微信亿级视频通话的QoS优化之路

作为移动终端上的实时通讯应用，微信视频通话面临的最大的挑战在于网络的波动性和不确定性，丢包和延时的突变可能会带来通话质量的下降，影响通话体验。本次演讲将围绕QoS优化这个话题，简要地介绍我们在网络适配、质量调节、抗丢包策略方面的几个尝试以及相应的效果，通过持续的基础优化，支撑起亿级的高清视频通话体验。

嘉宾

时永方

腾讯多媒体内核中心高级研究员

2018-10-20

10:00-10:45

视频直播体验优化

本次分享将着重介绍全平台差异化直播能力的统一与完善设计方案，以及从视频画质、流畅度、音视频同步、弱网条件下开播以及连麦质量等几方面核心技术指标提升策略。

嘉宾

林绪虹

欢聚时代 , RTC技术部负责人

2018-10-20

11:00-11:45

如何打造音视频服务的用户极致体验

音视频服务追求的不仅是单纯QoS，而是用户最终的极致体验。本次分享将针对点播，直播，实时通讯几个不同的运用场景，结合讲师在Facebook和阿里巴巴的实际工作经验，着重讨论视频编码策略，同时结合音频编码，网络传输，服务器架构，用户界面设计，全链路监控等方面的实际经验，探讨如何从端到端整体提升用户的音视频极致体验。

嘉宾

何亚明

阿里巴巴信息平台资深技术专家

2018-10-20

14:00-14:45

大数据驱动下的短视频体验优化

快手作为国民短视频社区，日上传内容数量过千万，累计内容存量已超五十亿，日播放量过百亿。在海量的用户规模下，只有通过大数据处理和分析，才能准确有效的发现用户体验痛点。快手在短视频大数据处理和分析领域积累了丰富的经验。本次演讲主要介绍快手短视频实时多维数据处理&分析架构，短视频QoS&QoE指标的定义，并以具体案例展示如何通过实时多维数据监测，adhoc数据分析，AB测试等手段，指导用户体验优化。

嘉宾

罗喆

快手流媒体大数据平台架构师

2018-10-20

15:00-15:45

利用自动化测试和产品数据化监控保障媒体质量

在基于云的解决方案开发中，快速迭代以及持续集成和持续部署是产品成功和客户满意度的关键之一。这里的挑战是如何在保持良好质量的同时实现这一速度。这对媒体来说尤其具有挑战性，因为媒体质量通常需要大量时间人力来测试，质量的评判标准也要考虑人的音视觉体验。在网讯Webex，我们开发了各种技术来保护开发/部署周期不同阶段的媒体质量。在本次演讲中，我们将讨论我们在自动测试环境中开发的工具。我们还将介绍我们在产品数据化监控中设计的各种媒体指标，帮助我们持续监控生产质量，评估新技术和快速解决问题。

嘉宾

张睿

Cisco The Media Architect

2018-10-20

16:00-16:45

基于QoE的实时视频编码优化

之往我们优化Codec，只是优化Codec本身，其实只是一个局部最优解，而且在实时通信领域，用户的QoE才是最终目标，这和很多因素相关，只有你的Codec优化适应了当前的网络状况，设备平台，应用场景，用户才能得到最佳的体验，我们所要找的其实是全局最优解。

嘉宾

吴晓然

声网Agora视频工程师

2018-10-20

17:00-17:45

基于用户体验的视频QoE 优化

如何站在用户的角度,对视频业务的体验质量进行评价,是众多视频运营者面临的普遍问题。本次分享主要介绍我们在视频业务体验QoE建模、分析方面的工作和进展,包括:关键因素分析、评价模型构建以及模型建立后在实际项目中的应用。

嘉宾

唐欣

华为ICT解决方案架构部系统工程师

2018-10-20

09:00 -18:00

AI与多媒体

就像空气和水一样，AI终将渗透在各个技术领域。本专题将甄选图像理解，NLP，网络发包策略，Codec智能编码等技术与AI技术的结合。

2018-10-20

09:00-09:45

魔镜：使用无监督式学习来辨识Twitch用户社区中繁复多样的网络状况

作为一个国际性的互动直播平台，Twitch服务的观众分布在世界的很多国家，从而具有千差万别的网络状况。这种差异性给我们试图提高服务质量亦或是发布任何前、后端的新功能都带来巨大的挑战。所以说如能建立起一个用户社区典型网络状况的知识库，那将对我们优化观看体验以及缩短软件部署周期都具有非同一般的意义。根据平台收集到的海量播放质量指标，我们提出一个无监督学习的方法先对播放行为进行分组，因为每一个细分的播放行为集群都代表一类网络状况。下一步是用仿真和配对的方法来模拟出符合每种播放行为的网络模型。最后我们试图利用仿真出的结果来开发针对移动网络用户的ABR播放算法优化，同时加速它的灰度发布。

嘉宾

沈悦时

Twitch Principal Research Engineer

2018-10-20

10:00-10:45

基于英特尔架构的实时视频流分析系统的设计与优化

随着实时媒体流分发技术的发展，在医疗，监控，社交和教育等领域，对多媒体数据进行基于深度学习的实时视频流分析的应用场景日益丰富。端到端的实时视频流分析涵盖视频流接入，视频编解码，视频帧前后处理以及深度学习网络推导等一系列流程，流程的复杂性以及深度学习网络调优的需求极大提高了实时视频流分析应用的门槛。为解决这一问题，面向WebRTC的英特尔协同通信开发套件设计了一个端到端的全流程实时视频流分析系统，它具有分布式可扩展的特性，同时实现了基于英特尔平台全加速，并提供了用户对深度学习网络的自由定制，帮助开发者使用极简的代码快速实现符合自身需求的高效实时视频流分析应用。本议题会对该系统的设计原理和优化方法以及所涉及的组件进行详细介绍，同时也会简要介绍其应用开发方法。

嘉宾

翟磊

英特尔开源技术中心研发经理

2018-10-20

11:00-11:45

百度媒体云智能编码技术实践

短视频、小视频行业蓬勃发展，各个平台之间的竞争更加激烈，提升视频质量、降低带宽成本，成为每个平台提升竞争力的重要手段。在本次分享中，将对百度云智能编码技术进行深入介绍。结合该技术在百度APP视频FEED、好看视频、全民小视频中的应用实践，进一步介绍AI技术在云转码中的应用探索。

嘉宾

邢怀飞

百度云资深工程师

2018-10-20

14:00-14:45

Boosting Multimeda UX in the AI Era

In this talk, we will introduce our recent work, from computational visual perception to image coding, processing, and understanding.

嘉宾

陈震中

武汉大学教授

2018-10-20

15:00-15:45

智能高清赋能金山视频云

“枯藤老树昏鸦，空调wifi西瓜。”感谢新媒体时代，让我们在炎炎夏日只要有了空调和wifi就有了全世界。随着高清视频的普及，金山云致力于为视频厂商提供一站式的视频、图像处理服务，通过智能高清技术针对不同场景智能化、定制化的提升用户体验、降低带宽。本次分享主要介绍金山云智能高清这一黑科技到底是什么，以及智能高清引领视频云行业所产生的技术变革。

嘉宾

武爱敏

金山云高级总监

2018-10-20

16:00-16:45

互联网时代的智能视频技术探索及实践

互联网时代，视频流越来越庞大，场景也越来越复杂，传统的人工处理手段不仅成本高昂且已无法满足需求。本次主要分享华为云AI团队在视频内容审核、视频内容标签等场景的探索及实践。

嘉宾

吴波

华为云EI产品部解决方案资深专家

2018-10-20

17:00-17:45

AI在视频增强中的技术以及应用

随着全民直播时代的到来，主播对视频质量和创意需求增多，由此产生了视频增强技术的巨大需求。基于360在视频领域的开发经验和技术积累，本次分享为大家介绍人工智能在视频增强中的技术以及相关应用。在算法层面，主要向大家介绍在移动平台中，应用人工智能技术解决人脸，手势，肢体识别等问题，以及相应的技术挑战；其次在应用层面和落地场景中，应用face 贴图，手势特效，人脸美颜，背景抠图等对视频进行渲染和增强，让我们的视频更加生动和有趣。

嘉宾

刘洛麒

360资深技术专家

2018-10-20

09:00 -18:00

视频编解码

编码效率和编码复杂度之间是难以调和的矛盾。新的Codec在不断优化算法来降低编码复杂度，成熟的Codec也在通过Pre-Title等技术来降低比特率。本专题将讨论新的编码策略、算法以及相关应用实践。

2018-10-20

09:00-09:45

TBD

嘉宾

Debargha Mukherjee

Google Member of Technical Staff , Video Codec Specialist

2018-10-20

10:00-10:45

KSC265全链路解决方案及应用

2018年，短视频行业日益火爆，移动直播行业走向成熟，众多视频公司在美国或香港敲钟上市。如何进一步提高用户播放体验和降低运营成本，成为视频从业公司急需解决的两个核心问题。通过提供全链路、全终端支持H.265编解码的解决方案,帮助用户成本节省50%，内容覆盖超过30%，金山云和业界同仁一起不断推动视频行业迭代更新和发展壮大。

嘉宾

李青源

金山云资深产品专家

2018-10-20

11:00-11:45

面向QoE的感知视频编码

近年来，随着智能终端的发展以及在线视频等新型业务的普及，无线网络中所传输的图像视频数据量呈爆炸式增长的趋势，网络带宽供求矛盾日益尖锐。视频编码理论是突破无线网络带宽瓶颈的重要途径之一。传统编码理论一直沿着数字信号处理的思路演进，难以突破“边际效应”。事实上，当前终端计算能力飞速发展，为解决带宽供求矛盾提供了契机。因此，另一种新的研究思路是从人类视觉感知模型出发，利用机器学习的计算工具，在视频大数据驱动下构建人类视觉感知模型，面向人类用户体验（QoE），研究基于视觉感知模型的视频编码关键技术，以智能媒体协同计算换取无线视频通信带宽。本报告将介绍徐迈课题组在面向QoE的感知视频编码方面的工作，主要包括：（1）基于关注点大数据的视频显著性感知模型；（2）基于感知模型的视频压缩方法；（3）基于深度学习的HEVC视频编码优化；（4）数据驱动下的全景视频质量评价与编码优化。

嘉宾

徐迈

北京航空航天大学副教授

2018-10-20

14:00-14:45

Accelerated Growth of the Visual Cloud Through Open Sourcing SVT-HEVC and SVT-AV1

The world is today witnessing a revolutionary transformation in the areas of media delivery, processing and consumption. Not only the internet traffic is already dominated by the exchange of visual information but also the visual cloud has become of the center of such traffic. Towards a fast-growing visual cloud, with underlying mostly-Xeon-populated homogeneous data centers, Intel Corporation is now leading the way with an Open Source SW-centric strategy. Intel is already open sourcing its SVT-HEVC encoder in Q3’2018, and it also plans to open source the SVT-AV1 encoder in Q2’2019. Such will increase adoption and decrease the cost of HEVC and AV1 by our visual cloud customers, helping them to accelerate the growth of their visual cloud applications. We will discuss briefly Intel’s current visual cloud SW strategy as well as provide detailed deions of the being-open-sourced SVT-HEVC encoder and the soon-to-be-open-sourced SVT-AV1 encoder. We will also present results that will illustrate the performance-quality tradeoffs of each of the SVT-HEVC and SVT-AV1 encoders. Finally, we will invite our visual cloud customers to participate in the development and growth of the new SVT-HEVC and SVT-AV1 Open Source communities.

嘉宾

Faouzi Kossentini

Intel Media SW Engineering Manager

2018-10-20

15:00-15:45

Point Cloud Compression, Processing and Understanding

Point cloud data has been emerging and popular for various applications including virtual reality (VR), augmented reality (AR), plus many other computer vision problems. Comparing to conventional image/video data, several fundamental challenges need to be addressed, e.g., its large data rate, irregular sampling structure, varying geometric as well as associated attributes. In this talk, we first review recent progress in point cloud compression and an ongoing MPEG standardization attempt. A framework to conduct fast point cloud resampling is then presented based graph signal processing, which could be utilized to scale down the complexity of many point cloud processing tasks. Last, deep neural networks (DNNs) are generalized for native supporting on point clouds as a new type of signal. For one example, a folding-based autoencoder (AE) architecture FoldingNet is introduced with great potentials for point cloud classification tasks. In short, fundamental techniques are highlighted how point clouds could be successful with more efficient compression, processing and understanding.

嘉宾

田栋

InterDigital Senior Principal Research Scientist

2018-10-20

16:00-16:45

HEVC标准在客户端上的快速实现方法的研究

从13年HEVC正式成为国际标准以来，业界人士都在为HEVC的普及做着不懈的努力。H265为提升压缩的效率，计算复杂度相对于H264而言增加了不少。因此在一些计算资源受限的设备上（如手机端）实现HEVC的实时编解码能力面临着很大的挑战。本次演进的主旨是向大家分享下手淘在客户端侧实现HEVC实时编解码能力的探索之路。

嘉宾

篱悠

阿里巴巴高级算法专家

2018-10-20

17:00-17:45

以质量三维论持续推进腾讯视频播放体验提升

作为承载日播放量几十亿的流媒体移动端平台，腾讯视频持续通过技术体系建设及细节的匠心打磨为每天亿万用户提供优质服务。充当高品质内容资源和高质量用户体验之间的连接器，我们以移动端播放框架的系统梳理为先导，打通前后台的整体升级与提升，逐步建立了「三维论」思想来持续推动我们的工作。此次分享就给大家带来我们在这方面的方法论沉淀与总结，全景式展示腾讯视频的播放体验优化工作。

嘉宾

李大龙

腾讯视频移动端播放内核技术负责人

2018-10-20

09:00 -18:00

解决方案

通过完整的技术服务方案，为企业解决业务中的难点和痛点。

2018-10-20

09:00-09:45

低延时实时视频通信

实时音视频技术的应用场景已经随处可见，如游戏语音、直播连麦等，而对于开发者而言，实现从信息采集、编码到网络传输的高品质实时视频应用依旧存在相当大的挑战。本次分享将从编码算法，实时传输等方面介绍三体云在实时音视频技术领域的难点问题与技术探索。

嘉宾

李幸原

三体云实时视频高级工程师

2018-10-20

10:00-10:45

Why the Live Streaming industry is seeing a rebirth of hardware acceleration and why FPGAs are leading this trend

Live video traffic is growing faster than any other video traffic type and China’s video operators are witnessing this first hand. The volume of traffic shows no signs of slowing down and this is putting pressure on existing infrastructure and associated financial models that providers have relied on since live streaming’s inception. The industry is desperate for a new approach that will enable lower bandwidth requirements, reduced infrastructure costs while simultaneously maintaining the agility that software has provided. Field Programmable Gate Arrays or FPGAs can address these needs and have most recently gained popularity in leading Live Streaming applications. Hardware acceleration for live streaming is very attractive but companies has existing implementations and software that they cannot disrupt or change easily. During this talk Xilinx will highlight will outline how FPGAs can be used in existing applications and future requirements like Video + Machine Learning. We Xilinx has integrated with FFmpeg and engineers can utilize FPGAs in their existing networks without having to make significant changes to their software infrastructure. We will also demonstrate how Machine Learning can be integrated In to FFmpeg enabling acceleration all through command line interface.

嘉宾

Sean Gardner

Xilinx 高级市场经理（视频与图像处理方向）

Johan Janssen

Xilinx Chief Architect

2018-10-20

11:00-11:45

基于 WebRTC 架构的直播课堂实践

互联网流媒体的演变经历了3个不同的时代，如今在低延时流媒体充斥互联网的时代，在线教育如火如荼的发展。七牛云在线教育行业总监为你诠释基于WebRTC的直播3.0时代，为所有人带来低延时技术的革新与突破。实际案例分析结合大数据AI，横向打磨教育产品。讲解底层WebRTC的优势，打造共赢共创的行业优势。

嘉宾

徐晶

七牛云教育行业解决方案高级专家

2018-10-20

14:00-14:45

极致压缩在腾讯海量视频业务中的技术探索及实践

腾讯作为中国最大的视频服务平台，80%的流量都来自视频，为用户提供越来越高清化内容的同时，带宽的消耗也越来越大。视频压缩处理是视频业务的核心基础，直接影响了用户的观看体验和带宽消耗，本次分享主要围绕我们团队在服务端视频压缩处理上的技术探索进行展开，包括：自主研发的极致压缩内核T265、基于场景的动态内容编码等方面的研发心得、性能水平和实践经验，通过持续的基础优化，支持腾讯海量高清视频业务的发展。

嘉宾

李雅卿

腾讯技术工程事业群架构平台部媒体算法团队负责人

2018-10-20

15:00-15:45

教育行业的WebRTC场景创新

本次分享内容主要分为以下几点：1、WebRTC技术对教育行业带来的场景创新；2、WebRTC技术在教育行业的应用现状；3、如何应用WebRTC技术改变行业；4、对WebRTC技术的未来畅想。

嘉宾

陈勇冀

拓课云技术总监

2018-10-20

16:00-16:45

基于混合CDN的低延时直播P2P技术实践

虎牙直播作为中国领先的弹幕式互动直播平台，在业内率先推出了蓝光直播模式。在为用户提供更高画质直播体验的同时，带宽成本压力也越来越大。结合现有的CDN技术，我们团队研发了一套适用于多终端的P2P技术，对原有的在线直播系统进行改造。新系统能够覆盖从标清到蓝光20M的所有码率档位，同时支持H.264/H.265等多种Codec。不仅可以传输音视频数据，也可以传输非音视频实时数据。在保持超低传输时延的同时，大幅降低了带宽成本，具有较强技术创新性。

嘉宾

冯修杰

虎牙直播音视频技术专家

2018-10-20

17:00-17:45

基于FFmpeg的运动视频分析

嘉宾

李忠

英特尔资深软件工程师

张华

英特尔资深软件工程师

2018-10-20

09:00 -18:00

多媒体传输网络

随着互联网进入视频时代，用户规模更大、内容质量更高、内容形式丰富、终端更加多样，而网络环境复杂多样，在直播、点播、互动直播、实时音视频等各个场景中，对多媒体传输各个维度也提出了不同维度的要求，如何构建更好的CDN架构体系与调度系统、如何更好的将P2P等技术应用到直播与互动等各个场景，如何使用Quic等技术对传统的使用场景进行体验的改善，如何将网络抗纠错能力与音视频编解码技术有很好的结合，如何将强化学习应用到流控技术中都为多媒体传输技术提出了更多的挑战与方向。本专题将邀请业界知名多媒体传输架构师，结合一线实践案例与大家分享当下最为优秀的实战经验，共同探讨未来之路。

2018-10-20

09:00-09:45

基于爱奇艺HCDN视频分发网络的开放缓存

为通过Internet向海量用户传输高清晰度、高码率的视频节目，爱奇艺融合CDN和P2P技术，开发出一套广泛适应多终端并融合P2P和CDN的混合分发网络——HCDN (即Hybrid P2P & CDN)；综合利用常规商业CDN、PC、OTT盒子、家庭NAS、路由器、以及机房闲置X86服务器等设备的多源化带宽，满足着数亿爱奇艺视频用户观看和下载视频需求；其中加入到爱奇艺开放缓存合作（IOCP）的各类伙伴通过大量的家庭NAS、路由器和闲置X86设备无缝融入爱奇艺HCDN网络开放缓存生态，在宽带中国的时代大背景下，实践了大规模的共享计算带宽和可观的经济效益。

嘉宾

庹虎

爱奇艺高级技术总监

2018-10-20

10:00-10:45

视频服务体验提升

本次演讲将以“视频服务体验提升”为主题，从视频服务、源站存储、CDN网络分发、客户端等角度来分享我们在视频服务体验方面的一些工作；结合大会主题，重点偏向于视频技术、网络技术。

嘉宾

魏伟

京东云视频云产品研发负责人

2018-10-20

11:00-11:45

通过跨层和组件的全局优化提高视频会议中的实时质量

视频会议中最常见的挑战是不断变化的网络条件。低延迟要求使得在没有缓存的情况下在非常短的时间内做出反应更加困难。多方会议用例中的另一个重要因素是接收设备的硬件/软件功能和网络连接容量的多样性。对于一个好的会议解决方案，设计不仅应该考虑一个组件，而应该考虑在这种具有挑战性的条件下实现良好视频质量和稳健性的整体流水线。在本次演讲中，我们将介绍我们多年来开发的一些技术，以优化会议中的视频质量。它们涵盖了编解码器算法设计和语法指示，具有被动和主动保护的传输以及客户端/服务器跨层和组件的端到端设计。

嘉宾

张睿

Cisco The Media Architect

2018-10-20

14:00-14:45

Using chunked-encoded chunked-transferred CMAF to bring low latency live to large scale audiences

In the jungle of solutions for low latency live there are many current options ranging from WebRTC to proprietary UDP protocols to standard segmented media with ever-shortening segments. This session highlights one of these - chunked-encoded chunked-transferred CMAF - as an optimal and practical confluence of both reach and performance. On the technical side we'll investigate the underlying technology, the latency regimes possible, compatibility with legacy players, cachability on delivery networks and player behavior.

嘉宾

William Robert Law

Akamai 首席架构师

2018-10-20

15:00-15:45

跨国应用场景和即构实时网络的调度系统架构设计

随着技术和模式的成熟，中国互联网出海正有趋势变成常态。有两种出海的模式比较有代表性：其一、在线教育，把海外优质的外教资源通过实时音视频课堂的方式来服务国内的学生；其二、视频社交/直播，把在中国经过验证的技术和玩法copy到东南亚、中东和北美等地。这两种模式带来跨国的应用场景，跨国网络的复杂性、不稳定和高丢包率对即构实时网络的实时性和流畅性提出更高的挑战。在跨国实时网络中，调度系统的作用十分关键，它不但负责第一公里，节点间传输和最后一公里的调度，还负责就近接入、负载均衡、智能选路和动态路由等重要任务。在调度系统的全局控盘之下，跨国实时网络保障了连通率、稳定性、实时性和流畅性，为跨国在线教育、海外视频社交/直播等业务的快速落地提供了无形而强大的云计算平台。本次演讲将会从两种模式的应用场景切入，探讨实时网络调度系统的部署、架构设计、挑战和应对策略。

嘉宾

冼牛

即构科技技术副总裁

2018-10-20

16:00-16:45

视频编码质量评价及如何寻找质量甜点的方法初探

本次演讲主要内容分为以下几个方面：1.研究实时视频时间维度质量，并提供了评测时间质量的算法；2.研究实时视频空间维度质量，提出了特定编码器的分辨率、码率和质量之间的规律；3.寻找视频质量甜点，通过数学建模计算特定资源条件下的最佳质量配置（甜点）。

嘉宾

钱晓炯

Juphoon CTO/VP

2018-10-20

17:00-17:45

下一代低延时的直播CDN

直播行业快速发展，出现了斗鱼、虎牙等游戏直播，也出现了映客、陌陌等移动直播，对于直播场景，交互需求越来越强，基于RTMP的直播延时在5秒左右，基于WebRTC直播可以做到1秒以内。本讲座主要介绍了下一代低延时直播CDN的关键技术和架构，如何通过技术优化来满足千万级别用户并发访问的架构，让听众能够了解下一代直播系统架构和CDN与RTC产品的交互方式。

嘉宾

李刚（阙寒）

阿里云CDN高级技术专家

2018-10-20

09:00 -12:00

行业应用案例

医疗、金融、物流、制造业等正在通过多媒体技术并为业务创新带来驱动力。

2018-10-20

09:00-09:45

High scale events – Akamai and 22Tbps streams for the World Cup 2018

The Football World Cup in summer 2018 was the largest sporting event streamed on the internet. This session examines the event through the experience of Akamai, a gobal CDN who supported 55 broadcasters worldwide and delivered record traffic for the event. We shall look the architecture of the service, the technologies used as well as interesting facts and figures on traffic and viewership over the course of the tournament.

嘉宾

William Robert Law

Akamai 首席架构师

2018-10-20

10:00-10:45

三体云视频抗抖动演进之路

从引起视频抖动的根源入手，为开发者们普及视频抗抖动的相关内容以及三体云视频抗抖动解决方案。

嘉宾

张光

三体云技术副总裁

2018-10-20

11:00-11:45

AI Powered FPGA-based Video Transcoding for Real Time Applications

Real time streaming and video-based services require high quality and high speed video transcoding capability. Recently, AI powered applications are booming both in academia and industry to further enhance user experience. Integrating the software-based AI applications within the hardware-based framework of video encoders is a nontrivial task and developing an optimized and efficient solution makes it more challenging. Aupera offers a solution to address this need by building an integrated FPGA-based hardware and development video stack for AI-powered real-time applications.

嘉宾

Narges Afsham

Aupera AI Engineer

2018-10-20

09:00 -12:00

技术与商业策略

在多媒体行业中，技术只是关键因素之一。专利风险、上下游生态链、技术遗产等都要考虑，如何根据公司业务需求和团队技术水平的采取最佳的技术方案？

2018-10-20

09:00-09:45

Evaluating your Codec Options

Many content distributors use H.264 as their primary, if not exclusive, codec, but the bandwidth savings promised by newer codecs are alluring. Those considering adding a codec must consider at least five options: HEVC, VP9, and AV1, along with RealMedia HD and V-Nova PERSEUS. In this session, codec specialist Jan Ozer evaluates the quality of these codecs, as well as other characteristics like encoding cost, playback support, and ease of implementation.

嘉宾

Jan Ozer

Streaming Media Magazine Contributing Editor

2018-10-20

10:00-10:45

圆桌：成本与QoE

2018-10-20

11:00-11:45

圆桌：新技术，新产品，新机会

2018-10-20

14:00 -18:00

IC设计与多媒体优化

AI、高码率和高复杂度视频处理，给新的ASIC、FPGA等硬件带来了新的挑战。本专题将讨论如何针对多媒体处理做IC设计，以及针对已有硬件的多媒体应用优化。

2018-10-20

14:00-14:45

Trends and Challenges with Multimedia Chip Design for Blu-ray, Digital-TV and Smart-phone SoC

The advance in VLSI technology allows the integration of all the multimedia functionality on a single chip. In the past few years, Mediatek had delivered a high quality single-chip multimedia solutions, and the related products range from Blu-ray player, digital TV to smart-phone. There are many challenges for designing high performance camera, video, graphic and display processing. In this talk, we will present some breakthroughs and therefore achieve better power, bandwidth and cost efficiency. Moreover, we will make some conclusions and draw chip architecture trends for future VLSI design.

嘉宾

Tsu-Ming Liu

MediaTek Lead of Advanced Innovation Research Department

2018-10-20

15:00-15:45

FFmpeg 硬件加速的现状与将来

FFmpeg作为最为流行的多媒体基础库之一，最近这两年来，FFmpeg社区在硬件加速方面做出了大量的努力，使得FFmpeg正逐步演化成一个支持跨平台，跨OS，跨硬件厂商的通用硬件加速方案，本报告将综述FFmpeg在主流硬件平台/OS上的硬件加速方案的当前进展，详细讲解FFmpeg基于Intel全开源的硬件加速方案上的种种努力，以及展望FFmpeg在硬件加速的一些其它的可能性。

嘉宾

赵军

腾讯云 FFmpeg决策委员会委员，专家工程师

2018-10-20

16:00-16:45

解密GPU：视频转码与分析加速

本分享作为一份GPU视频处理技术调研报告，探讨了GPU对视频编解码、图像处理和视频分析的支持，提供了详实的性能评测数据，为技术选型用户采纳与部署GPU提供技术依据与路线，并为有GPU编程经验的用户提供前沿、全面的进阶信息。

嘉宾

季光

英伟达高级工程师

2018-10-20

14:00 -18:00

安全与版权保护

海量多媒体应用内容安全等方面也提出了更高的要求，同时对于视频的版权的保护也迫在眉睫。

2018-10-20

14:00-14:45

视频媒资保护主要手段解析与实现

本次演讲主要介绍防盗链基本策略及实现原理，HLS / DASH 的加密解密原理及实现，视频媒资泄露路径追寻方法等相关技术，使得前来交流的同仁能够全面的了解从浅入深的媒资保护手段。

嘉宾

刘歧

OnVideo视频云创作平台联合创始人

2018-10-20

15:00-15:45

视频加密和DRM的实施实践

掀开视频加密和DRM的神秘面纱。介绍视频加密的原理，以及在视频处理全链路中各环节的保护机制。介绍DRM实施中遇到问题和解决方案：如何在谷歌的Widevine、苹果的FairPlay、微软的PlayReady等DRM方案中进行选择。如何兼容各种类型终端的播放。如何优化云端服务的计算和存储等。目标受众：期望保护有版权、有价值视频内容的研发和产品人员。

嘉宾

周源

阿里云视频云媒体处理服务负责人

2018-10-20

16:00-16:45

爱奇艺版权保护技术与维权实践

本演讲分「发布之前」、「分发播放」、「盗版追踪」、「维权处理」四个环节介绍爱奇艺的各相关技术系统以及具体应用情况，分享相关思考以及可能的挑战。包括爱奇艺DRM、爱奇艺视频指纹、视频水印、网盘联动以及若干实际案例分享，本演讲也会包括一些爱奇艺相关数据的分享，借以分析版权保护技术及其应用对爱奇艺商业模式的影响。

嘉宾

陈赫

爱奇艺技术产品中心高级经理

2018-10-20

17:00-17:45

多媒体数字版权保护生态

面向4K/HDR、终端智能化等的持续推进，多媒体数字版权保护越来越成为产业链各方关心的话题。数字版权保护需要依靠技术、管理、法律有机协同才能实现多媒体产业生态的健康发展。ChinaDRM多年来致力于中国数字版权保护生态体系建设，希望通过分享ChinaDRM在多媒体数字版权保护技术体系、标准体系、安全认证体系、版权维权体系方面的工作进展，共同探讨构建开放、合作、共赢的多媒体版权保护生态。

嘉宾

郭沛宇

国家广播电视总局广播科学研究院信息技术研究所所长

主办方致辞

包研

LiveVideoStack , 创始人，主编

70后，5年的开发者社区运营经验，10年科技媒体记者编辑经验。在创立LiveVideoStack之前，曾在迅达云供职并担任市场总监。此前，在InfoQ（极客邦科技）担任策划总监等职位，负责技术大会策划、商务项目支持、技术内容输出等；再之前，在CSDN担任云计算频道编辑，承担技术大会策划及云计算生态技术内容输出等工作。包研曾在北京工商大学计算机及应用专业求学四年。

联席主席致辞：Visionular Co-Founder & Chief Scientist

Zoe Liu

Zoe Liu Visionular Inc Co-Founder, President & Chief Scientist

Zoe Liu is Co-Founder, President, and Chief Scientist of Visionular, a startup that has just been incorporated aiming for the smoothest delivery of videos at the highest quality. Zoe was previously a software engineer with the Google Chrome Media team for five years, and has been a key contributor to the development and finalization of the open source video codec standard AOM/AV1. Zoe received her PhD/ME/BE from Tsinghua University and her second PhD from Purdue University. Either as a principal contributor or as a Technical Lead, Zoe had once devoted her effort to the design and development of several renowned video call products, including Apple's FaceTime, Tango Video Call, and Google Glass Video Call. Zoe has accumulated years of innovative research experiences at prestigious research labs, including Bell Labs, Nokia Research Center, Sun Labs, and HP Labs, and in particular excels in cross-field effort. Zoe has published 40 international conference and journal papers, and filed over 50 patents worldwide. She has been selected as a 2018 Google I/O speaker to introduce AV1 to the worldwide developers. She has delivered keynote speeches in both LiveVideoStackCon 2017 and WebRTCon 2018.

From VP9 to AV1 and beyond

Debargha Mukherjee

Google Member of Technical Staff , Video Codec Specialist

Debargha Mukherjee received his M.S./Ph.D. degrees in ECE from University of California Santa Barbara in 1999. Thereafter, through 2009 he was with Hewlett Packard Laboratories, conducting research on video/image coding and processing. Since 2010 he has been with Google Inc., where he is currently involved with open-source video codec development. Prior to that he was responsible for video quality control and 2D-3D conversion on YouTube. Debargha has authored/co-authored more than 100 papers on various signal processing topics, and holds more than 40 US patents, with several more pending. He has delivered many workshops and talks on Google's VPx line of codecs since 2012. He currently serves as an Associate Editor of the IEEE Trans. on Circuits and Systems for Video Technology and has previously served as Associate Editor of the IEEE Trans. on Image Processing; he is also a member of the IEEE Image, Video, and Multidimensional Signal Processing Technical Committee (IVMSP TC).

新一代视频编码标准

马思伟

北京大学信息科学技术学院教授

马思伟，2005年博士毕业于中国科学院计算技术研究所。2005年8月至2007年8月在美国南加州大学进行博士后研究，之后到北大工作至今。2013年获国家自然科学基金委优青项目资助，2015年入选中组部第二批青年拔尖人才计划。主要研究方向为视频编码及处理，已发表SCI论文60余篇，已获授权发明专利40多项。担任IEEE Transactions on Circuits and System for Video Technolgoy(TCSVT)、Journal of Visual Communication and Representation(JVCIR)期刊编委(AE)、AVS视频组组长、中国图象图形学学会理事等。曾获国家技术发明奖二等奖、国家科学技术进步奖二等奖等奖励。

AI技术开启视频娱乐新时代

刘文峰

爱奇艺首席技术官

刘文峰，爱奇艺首席技术官。2003年硕士毕业于浙江大学计算机系，毕业后加入英特尔（中国）有限公司，负责过嵌入式系统开发，消费电子系统开发，以及企业级Linux的操作系统开发等工作；2011年加入威睿信息技术（中国）有限公司，负责开发和维护VMware的重要云计算操作系统VMware vSphere。2012年加入爱奇艺，全面负责爱奇艺的基础架构开发和建设工作，让爱奇艺的基础架构达到能够服务超过五亿用户和设备的能力，将爱奇艺的视频播放和观看体验做到行业第一。自从2018年担任爱奇艺首席技术官，全面领导爱奇艺的产品和技术工作。在操作系统、云计算、人工智能、大数据等方面均有研究，拥有8项专利申请（其中3项美国专利）；他是国内最早研究Linux操作系统和嵌入式系统的专家，2002年出版《Linux 2.4内核源代码分析》，2003年出版《嵌入式Linux操作系统》书籍。

用户导向的音视频体验优化

于冰

快手音视频技术负责人

于冰，快手音视频技术负责人，毕业于清华大学，多年视频和流媒体行业从业经验，擅长利用先进的互联网技术、数据驱动理念，对系统进行端到端的优化，从而为用户提供最佳视频体验。16年加入快手，从头组建起跨越北京、深圳、圣地亚哥、硅谷四地的世界级视频技术团队，希望利用最先进的视频技术和算法，让快手的视频更清晰、更流畅、更好看。加入快手之前，他曾在Hulu、FreeWheel等跨国公司领导视频技术和基础架构团队，也曾作为合伙人 / CTO参与组建视频技术公司。

The company that invented streaming media continues to innovate new video technologies

Reza Rassool

RealNetworks CTO

Reza Rassool，CTO of RealNetworks。His pioneering achievements include: Lightworks NLE, technical OSCAR/EMMY, sold to Tektronix；bringing the world’s first VOD server to market while at Micropolis/StreamLogic；developing software DRM at Widevine Technologies, sold to Google 2010；bionic eye development at Second Sight, IPO 2014；music creation technology at Zya, raised $48M；Reza gained a B.Sc. in Physics from King's College, has 24 patents granted and numerous papers published.

高效移动端视频处理架构关键技术

郑鹏程

北京美摄网络科技有限公司CEO

郑鹏程，北京美摄网络科技有限公司CEO，新奥特（北京）视频技术有限公司技术决策委员会委员，20年一线研发经验，图形图像处理技术、视音频编解码技术资深专家。拥有30余项专利。曾获国家科技进步一等奖；担任国家科技支撑计划“面向影视内容的高端特效包装系统研发及应用”课题负责人；2015年荣获北京市有突出贡献的科学、技术、管理人才；2014年海淀区创新领军人才；2014年中国电影电视青年科技奖；主持开发的影视高端特效包装系统荣获电子学会科学技术奖二等奖。

微博客户端播放器的演进之路

刘文

微博 , 客户端播放器研发负责人

微博客户端播放器研发负责人。负责微博客户端短视频播放和直播播放内核的研发。围绕画质提升、卡顿优化等方面不断提升用户的观看体验。通过调优视频消费链路的各个环节节约视频带宽的成本。

基于WebRTC的互动直播实践

叶峰峰

映客资深音视频工程师

以我所能，为你而加——腾讯云新一代融合通信平台全接触

李郁韬

腾讯云 , 副总裁

李郁韬，资深互联网专家，现任腾讯云副总裁，2006年加入腾讯，曾任QQ通信与音视频技术负责人，具备深厚的行业洞察与技术积累。目前负责腾讯云音视频、5G通信、加速产品、云监控产品等相关业务及团队管理工作。

腾讯云实时音视频解决方案的技术实现

常青

腾讯云专家工程师 , 腾讯云音视频终端研发总经理

2008年加入腾讯，在客户端技术研发领域有着深厚的积累，先后参与过 PC版QQ、手机 QQ和智能硬件等项目，目前在腾讯云负责音视频相关产品的终端技术的研发和团队管理工作。

企业通信中的音视频技术应用与前瞻

许志强

容联云通讯CTO

许志强，17年技术研发与11年管理经验，主管云通讯平台设计与开发，互联网与通讯、人工智能前沿技术跟进。先后就职于广州新太科技任开发中心副总经理、高阳圣思园任云通讯项目技术负责人

视频画质提升-在腾讯视频中的应用

汪亮

腾讯视频视频编码团队负责人

汪亮，腾讯视频，视频编码组组长。2006年从华中科技大学研究生毕业后，加入华为预研部，2011年加入腾讯视频，现任腾讯视频——视频编码组组长，一直从事视频编解码优化、画质增强等相关工作。

视频质量评价——从裁判到教练

宋利

上海交通大学教授

宋利，研究员，博士生导师，IEEE高级会员，上海交通大学图像通信与网络工程研究所副所长。研究方向是视频编码、图像处理及计算视觉。主持国家级科研项目10余项，发表学术论文150余篇，获授权发明专利35项，软件著作权5项。获国家科技进步二等奖(2015)、上海市科技进步一等奖(2011)、上海市技术发明一等奖(2011)、日本大川基金研究奖(2013)、IEEE ICME-Twitch竞赛奖(2017)、国际会议优秀论文奖(IEEE VCIP2016及WCSP2010)。任IEEE Transaction on Broadcasting特邀编委、Springer Multidimensional Systems and Signal Processing(MSSP)编委，IEEE电路与系统协会视觉信号处理与通信(VSPC)技术委员、视频体验联盟技术组组长、中国智慧家庭产业联盟4K极客工作组技术委员等。

无参考图像视频质量评价

蒋婷婷

北京大学信息科学技术学院数字媒体所副教授

蒋婷婷，北京大学信息科学技术学院数字媒体所副教授。2001年毕业于中国科学技术大学，获计算机专业学士学位。2007年毕业于美国杜克大学计算机系，获博士学位。2007年至2009年，在法国INRIA研究所从事博士后研究。2010年1月开始任教北京大学。目前主要从事两方面的研究工作：（1）计算机视觉，包括物体跟踪、识别、检测、形状分析、动作识别、视觉注意等；（2）图像视频的质量评价。近几年在主要国际学术期刊和会议上共发表论文40多篇。并且受邀参加计算机视觉主要会议CVPR、ICCV和ECCV以及IEEE Pattern Analysis and Machine Intelligence (TPAMI) 、IEEE Transactions on Image Processing(TIP) 、IEEE Transactions on Circuits and Systems for Video Technology (TCSVT) 、IEEE Transactions on Multimedia (TMM)等期刊的审稿。目前参与了多项国家自然科学基金委员会研究项目和科技部的一项973课题。

视频编码器对比与选择

傅德良

Hulu 全球高级研发经理，视频编解码与传输领域资深专家

在视频编码优化、大规模视频编解码平台研发和视频领域标准化工作等领域有多年经验，主导的视频编码器优化和转码平台体系设计服务于hulu数千万用户与数百万高质量优选视频内容。对视频流媒体服务质量评价和改进、DASH在VoD和Live服务中的应用和优化有深入见解，推动了DASH在hulu跨平台的广泛运用并指导攻关解决了多项相关技术难题。主导的流媒体服务质量评价与研究达到并领先于业界先进水平。

AI硬件中的声学问题剖析

邓滨

广州迷听科技有限公司创始人、董事长兼CEO

邓滨先生毕业于清华大学，获计算机硕士学位。拥有通信行业、移动互联网行业、智能硬件行业二十年从业经验，曾供职华为、UTStarcom、Nortel、百度等大型科技公司，曾率队打通全球第一个TD-LTE video streaming call，是20余项国际及中国发明专利发明人。邓滨先生曾任百度小度首席音频科学家及运营商业务负责人，由零到壹，实现运营商市场累计销售小度智能屏产品达千万台，达到同品类产品销量世界第一。邓滨先生作为连续创业者，近年来重点关注领域为产业互联网方向，关注人工智能等前沿技术对传统产业/行业的升级和变革性机会，传统产业上下游全链条的网络生态场景，对行业互联网的音视频技术应用、数据服务等领域，关注数据驱动产品迭代以及商业运营的长期价值。邓滨先生现为广州迷听科技有限公司创始人、董事长兼CEO。

音频编码技术特点

窦维蓓

清华大学电子工程系教授、博导

窦维蓓，Ph.D、清华大学电子工程系教授、博导。现任中国“数字音视频编解码技术标准工作组”( AVS)工作组音频专题组组长，IEEE SA AVS (1857) 标准工作组IEEE 1857.8 Subgroup chair。主持完成了AVS2音频标准GB/T 33475.3《信息技术高效多媒体编码第3部分：音频》的编制工作。主持编写了IEEE Std. 1857.2TM-2013 “IEEE Standard for Advanced Audio Coding”。研究多模态数据处理和信息融合系统，应用在人脑生理信息挖掘和音频信号处理等领域。负责或参加多项国家自然基金面上/重点项目和科技部项目，负责完成了十余项企业合作和国际合作项目。发表学术论文百余篇，获授权发明专利19项，登记软件著作权1项。正在研究基于多模态神经影像信息融合的神经康复评估问题。

娱乐遇见科学

Claus Bauer

杜比研究高级总监

Claus Bauer，德国弗莱堡大学数学博士，山东大学访问学者。毕业之后在西门子和Tellabs研究3G和4G技术。2002加入杜比美国研究音频信号处理，多媒体搜索，实时多媒体流等相关技术。2010年负责组建杜比北京研发中心。目前领导杜比中国和西班牙研究部门，负责研究针对手机，电脑，广播，OTT市场的多媒体技术。在理论数学，多媒体信号处理，网络技术领域发表60余篇论文，拥有20余项国际专利。

手机K歌的人声伴奏对齐优化实践

王国腾

唱吧资深研发总监

王国腾，唱吧音视频算法部资深研究员、资深研发总监。在唱吧负责音视频技术研发和音频新技术的科研工作。互联网从业十余年，音乐音频算法从业五年。曾带领团队攻破智能修音、自动说唱等创新产品。

微博视频平台架构演进

刘志勇

新浪微博视频平台资深架构师

刘志勇新浪微博视频业务资深架构师，负责微博视频，微博故事，微博直播答题相关服务的研发工作。主导及推进了视频平台微服务化，服务治理，SLA保障体系等架构的优化及升级。整体架构支撑了微博视频每天百万级上传，几十亿级播放，数十个垂直业务。

利用WebRTC给应用赋能——从一个工程师的角度

郭奕

全民快乐资深音视频工程师

郭奕，从事音视频行业8年。先后就职于方位通讯、平治东方、鹏博士鹏云事业部和全民快乐，主导VoIP智能终端、视频会议系统和家庭视频通话系统终端、以及连麦互动系统的开发，对实时通讯终端的开发和应用方面有多年的研发经验和积累。

基于HLS格式的互动直播技术实现超越RTMP的低延时

沈悦时

Twitch Principal Research Engineer

沈悦时，博士，在亚马逊的全资子公司Twitch担任Principal Research Engineer。带领的研发团队负责Twitch核心视频技术的研发，职责涵盖直播视频转码、ABR播放算法、多平台播放兼容性、画面质量、时延等。同时是AOM（Alliance of Open media）视频编码协议AV1中SWITCH_FRAME的发明者，发表、申请超过15项技术专利。在加入Twitch之前，沈博士分别就职、服务于多个数字电视设备公司（GD Mediware，Ambarella，Harmonic， Ericsson TV）以及开创云游戏产业的初创企业OnLive。在这些公司，他主导、参与开发多个广泛应用的H.264编码、转码、非线性编辑和实时广告插播产品，以及在公共互联网上超低时延视频传输的云游戏核心技术。

用WebRTC打造支持复杂交互的实时互动云课堂

董海冰

iTutorGroup研发总监

董海冰，现任TutorABC研发总监，主要负责“TutorMeet+”音视频互动直播云平台的研发。毕业于吉林大学，曾先后就职于途牛、沪江等互联网公司，负责架构研发，基础平台建设和技术管理等工作。对大型互联网系统的架构设计、分布式、容器与微服务等都有较深入的理解，擅长系统优化和解决系统进化过程中的各种疑难杂症。近几年专注于音视频互动直播方向（WebRTC）的技术发展，工作中使用比较多的语言主要有Java、C#、Golang等。

互动白板在在线教育上的应用

赵文杰

学而思网校架构技术负责人

赵文杰，现就职于学而思网校，项目经理，客户端架构负责人，开发教师推流客户端，7年直播相关技术经历，参与开发开源流媒体服务器simple rtmp server，开源编码器Bull-Live-Encoder，曾任职于海尔研发中心，北京蓝汛通信，搜狐畅游集团。

51Talk音视频技术的思考及非典型挑战

陈靖

小红书 , 技术中台音视频架构部负责人

曾任职：51Talk首席音视频科学家，在51Talk期间，从0到1搭建音视频算法团队，全面负责51Talk在线教室平台的技术；Google Chrome Media 视频组工程师，在Google期间，参与VP9/WebRTC开源项目的研发；Mindspeed视频部高级DSP工程师；华为中央研发部视频组工程师。出版《深入理解视频编解码技术》及翻译《计算机视觉算法:基于OpenCV的计算机应用开发》。

基于Licode的WebRTC全球分布式架构

陈聪

百家云研发工程师

陈聪，现任百家云研发工程师，目前主要负责百家云的 WebRTC 架构搭建。曾担任实时猫WebRTC后端架构师，实施并搭建了国内第一个WebRTC云端服务。

音乐场景下的实时音频解决方案

李备

网易资深音频算法工程师

李备，网易云信音频专家。负责网易云信音频框架设计和算法实现，包括移动端及 PC 端 3A 算法优化，大屏远场解决方案，高清音乐教学解决方案，穿戴式及其他特殊设备适配等工作。对于音频算法，实时音频系统框架，移动端设备适配，音频质量测试评价等领域有多年的工作与项目经验。

微信亿级视频通话的QoS优化之路

时永方

腾讯多媒体内核中心高级研究员

时永方，硕士毕业于香港科技大学，目前在腾讯科技（深圳）有限公司就职，担任微信事业群技术架构部多媒体内核中心高级研究员，负责微信视频通话相关技术的研发和优化。入职五年，主导研发项目包括微信VOIP的“三高”（高帧率、高分辨率、高流畅度）优化、弱网优化、Qos流控、软硬件协同编码等，参与了微信多人视频通话、多平台视频通话开发等项目。

视频直播体验优化

林绪虹

欢聚时代 , RTC技术部负责人

林绪虹，欢聚时代RTC技术部负责人，负责音视频技术相关研发工作，为集团多媒体技术提供战略和产品创新方案，包括建立音视频技术体系、提升音视频体验、改进音视频质量等。华南理工大学硕士毕业，有着十余年音视频研发经验，在音视频编解码、图像处理、视频内容分析与理解等领域有丰富的实战经验，因在欢聚时代音视频技术体系方面工作业绩突出，多次获得公司级重要奖项。

如何打造音视频服务的用户极致体验

何亚明

阿里巴巴信息平台资深技术专家

南京大学计算机硕士，20年工作经验，其中14年在美国微软总部，3年半在Facebook，去年回国至今在阿里巴巴。一直从事的是音视频相关的工作，从Video Codec，Cloud Encoding Farm，点播，直播，实时通信。几个值得一提的项目包括，Microsoft VC1 Codec标准化，Microsoft Azure北京奥运直播，Facebook Messenger和Facebook Live。其中Facebook Messenger的视频通话和Facebook Live都是从头参与，在短短几年做到了从零到10亿级用户。目前在阿里巴巴信息平台负责音视频会议系统的开发。

大数据驱动下的短视频体验优化

罗喆

快手流媒体大数据平台架构师

曾在腾讯负责QQ语音通话业务的开发及实时音视频通讯SDK的开发工作。后加入快手，负责快手直播业务的质量调优&监控，数据分析，CDN调度等工作。在音视频实时通讯，直播，网络调优，大数据处理&分析等领域有较丰富的经验。

利用自动化测试和产品数据化监控保障媒体质量

张睿

Cisco The Media Architect

Rui Zhang is currently a Principle Engineer in Cisco Systems. She has over 20 years of research and industry experiences in digital signal processing and multimedia communication, with expertise in image/video compression, audio/video processing and video conferencing. In Cisco Systems, she is the media architect for the Webex Meeting system. Her team is also the owner of the Cisco openh264 project. She has been leading various projects within the overall conferencing solution, such as H.264-SVC codec for scalable video solution in large-scale video conference; media adaptation and resilience technology, which includes the RTP/RTCP-based packetization/transmission/feedback, bandwidth adaptation/congestion control and forward error correction; screen share solution in conferencing; multiemedia protocol design for video conferencing and inter-op solution etc. Before joining Cisco systems, she had also worked in SONY research lab and Play Station, and a star up company for H.264 codec chip design. She got her Ph.D. from Department of Electrical and Computer Engineering in University of California at Santa Barbara, and had her post doctoral fellowship in the Electrical Engineering Department of Stanford University, both in the area of signal processing and media communication. She has 20+ publications and patents in the area of video compression and communication.

基于QoE的实时视频编码优化

吴晓然

声网Agora视频工程师

吴晓然，现任声网 Agora.io 视频工程师。上海交通大学本科/硕士，曾任职于Intel , Marvell , Harman等知名外企，负责多媒体架构,，视频编解码。

基于用户体验的视频QoE 优化

唐欣

华为ICT解决方案架构部系统工程师

唐欣，华为ICT解决方案架构部，系统工程师。超过15年 ICT 研发工作经验，对电信类业务开发和网络维护有丰富经验；目前主要从事视频相关的设计、分析工作，包括视频体验评估、视频传输优化、承载网络等专题。

魔镜：使用无监督式学习来辨识Twitch用户社区中繁复多样的网络状况

沈悦时

Twitch Principal Research Engineer

基于英特尔架构的实时视频流分析系统的设计与优化

翟磊

英特尔开源技术中心研发经理

翟磊，英特尔开源技术中心研发经理，2013年至今带领团队致力于面向WebRTC的英特尔协同通信开发套件的研发，及其在英特尔架构上的优化，同时积极参与和贡献W3C WebRTC标准以及开源社区。翟磊2006年南京大学硕士毕业，先后就职于Intel，EMC，VMware，作为架构师或研发骨干参与公司多项重要产品研发，包括Intel XML Software Suite，Intel Expressway Cloud Access 360，VMware vFabric Data Director，VMware vCloud Hybrid Service等。他对软件系统设计及云服务构建具有深入的理解和丰富的经验。

百度媒体云智能编码技术实践

邢怀飞

百度云资深工程师

邢怀飞，百度云资深工程师，负责百度云视频点播、转码等产品研发工作。2008年博士毕业于中科院半导体研究所，在视频编解码、流媒体传输领域拥有十余年行业经验。目前致力于视频云转码、视频编码质量优化、内容感知编码及其视频AI应用方向的技术开发工作。

Boosting Multimeda UX in the AI Era

陈震中

武汉大学教授

ZHENZHONG CHEN is currently a Professor at Wuhan University. His current research interests include image video processing and understanding, multimedia communications, computer vision, multimedia data mining, etc. He has participated in JCT-VC H.265/HEVC, JVET VVC, and AVS1/2/3 standardizations, and has been a VQEG board member and Immersive Media Working Group Co-Chair, a Selection Committee Member of ITU Young Innovators Challenges. He is an editor of IEEE TCSVT, JASIST, JVCIR and IEEE IoT Newsletter. He has published more than 150 papers on peer-reviewed journals and conferences such as TCSVT/TIP/TMM/CVPR/IJCAI/MM etc. He has been selected for the Thousand Talents Plan for Young Professionals, as a recipient of CUHK Young Scholar Dissertation Award, CUHK Faculty of Engineering Outstanding Ph.D. Thesis, Microsoft Fellowship.

智能高清赋能金山视频云

武爱敏

金山云高级总监

武爱敏，金山云高级总监。华北电力大学计算机专业硕士，视频行业资深专家，拥有十多年视频领域研发经验，擅长视频编解码、流媒体传输分发等技术。目前负责视频云产品中心管理工作，历任视频云研发总监、项目管理中心负责人；带领团队保障了“九三”大阅兵、神州第十一次发射，两会直播等多场大型直播活动。在2014年加入金山云之前，先后在蓝汛和博汇科技担任研发技术总监，负责视频技术的研发管理工作。

互联网时代的智能视频技术探索及实践

吴波

华为云EI产品部解决方案资深专家

华为云EI产品部解决方案资深专家，多年AI领域从业经验，目前在互联网解决方案领域进行探索。

AI在视频增强中的技术以及应用

刘洛麒

360资深技术专家

刘洛麒，360资深技术专家，博士毕业于新加坡国立大学。目前主要负责计算机视觉和深度学习相关研究方向和产品支持。博士期间在国际顶级学术会议和期刊发表过多篇学术论文，并以一作获得过多媒体国际顶级会议ACM Multimedia Conference 最佳论文奖，PREMIA Singapore 协会最佳学生论文奖。在360期间，作为主要技术人员领导并参与了在花椒直播、花椒相机、360手机OS，360儿童手表，小水滴摄像头在内多个项目中人脸和人体分析核心AI算法的研发、性能优化和产品落地，并取得了不错的效果。

TBD

Debargha Mukherjee

Google Member of Technical Staff , Video Codec Specialist

KSC265全链路解决方案及应用

李青源

金山云资深产品专家

李青源，金山云资深产品专家。目前负责视频云创新产品线，从无到有推动“AI+视频”方向：智能高清、画质增强等新产品落地；并针对KSC265产品化重构，实现了头条、虎牙、熊猫等众多头部客户的快速应用。在加入金山云前，先后就职于百度和AI领域创业，擅长平台构建和新方向探索。

面向QoE的感知视频编码

徐迈

北京航空航天大学副教授

徐迈，北京航空航天大学副教授。2003年毕业于北京航空航天大学，获学士学位；2006年毕业清华大学，获硕士学位；2010年毕业伦敦帝国理工学院（导师：Maria Petrou，英国皇家工程院院士）；2010-2012年在清华大学大学无线多媒体实验室从事博士后研究工作（导师：陆建华，中国科学院院士）。2013年入选北京航空航天大学“卓越百人”青年人才引进计划，加入北京航空航天大学。2014年入选微软亚洲研究院青年教师铸星计划，2015年获ICCV（CCF A 类会议）青年学者奖，2016年获教育部霍英东青年基金资助，2017年获人工智能学会技术发明一等奖（第二完成人），2018年获中国电子学会优秀科技工作者。研究兴趣为视频通信与图像处理。学术方面：近五年，在IEEE Transactions等国际顶级期刊及CVPR、ICCV、DCC、ICME等顶级会议上发表论文70余篇（均为SCI/EI检索），其中SCI检索30+篇（JCR1区20+篇），Google学术他引600+次。

Accelerated Growth of the Visual Cloud Through Open Sourcing SVT-HEVC and SVT-AV1

Faouzi Kossentini

Intel Media SW Engineering Manager

Faouzi Kossentini received the B.S., M.S., and Ph.D. degrees from the Georgia Institute of Technology, Atlanta, Georgia, United States of America, in 1989, 1990, and 1994, respectively. Dr. Kossentini has since August 2017 been a Media SW Engineering Manager of the Visual Cloud Division of the Data Center Group at Intel Corporation. Dr. Kossentini has co-authored almost 300 journal papers, conference papers, book chapters, patents, standards contributions and popular technical white papers. He has also led in numerous international ISO and ITU-T activities involving the standardization of JBIG-2, JPEG-2000, H.263, H.264/AVC and H.265/HEVC.

Point Cloud Compression, Processing and Understanding

田栋

InterDigital Senior Principal Research Scientist

Dr. Dong Tian joined InterDigital recently as a Senior Principal Research Scientist after working with Computer Vision Group of Mitsubishi Electric Research Laboratories (MERL) at Cambridge, MA, U.S. between 2010-2018. Previously, he conducted researches with Thomson Corporate Research at Princeton, NJ from 2006 and Tampere University of Technology in Finland from 2002. He has been actively contributing to video related standards in MPEG within projects including H.264/MPEG AVC (2002-), MVC (2006-), H.265/HEVC extensions such as MV-HEVC, 3DV (2010-), and point cloud compression (2016-). His current research interests cover point cloud processing, graph signal processing, deep learning, and computer vision. Besides numerous publications on top-tier conferences and transactions, he holds over 30 US-granted patents. In addition, he serves as technical committee member in multiple IEEE societies. Dong received M.Eng. and B.Eng. degrees on automation from the University of Science and Technology of China (USTC) in 1998 and 1995, respectively; and he was granted Ph.D. at Beijing University of Technology in 2002. He is a senior member of IEEE.

HEVC标准在客户端上的快速实现方法的研究

篱悠

阿里巴巴高级算法专家

阿里巴巴高级算法专家，2009年硕士毕业于北京大学软件与微电子学院，毕业后加入阿里巴巴，先后在B2B,淘宝等多个BU任职。先后参与了B2B直通车、有好货、淘宝直播，短视频等项目的建设过程。团队目前侧重于多媒体算法领域的工作，主要研究的方向有：音视频编解码、人形分割、物体跟踪与检测和AR。先后在ICIP,TIP等会议和期刊方向发表关于h265优化编解领域的相关文章；获得国内专利权2项，美国专利1项。

以质量三维论持续推进腾讯视频播放体验提升

李大龙

腾讯视频移动端播放内核技术负责人

李大龙，腾讯视频移动端播放内核技术负责人。研究生毕业于武汉大学国家多媒体工程研究中心，加入腾讯大家庭后历经腾讯研究院、QQ影音、QQ视频聊天、腾讯视频等多个音视频产品技术团队。十余年的业界经验让我深感视听体验不仅是互联网泛娱乐的富媒体手段，更是全人类品质生活的连接器。站在人工智能时代的黎明，我们目送H.264/AVC、Flash等老朋友渐行渐远，与HEVC、VR/AR、HDR/WCG诸多新鲜元素相伴熟悉，一路高歌前行、永远灵感相随，让我们一起Change the World！

低延时实时视频通信

李幸原

三体云实时视频高级工程师

北京工业大学硕士，7年视频编解码，流媒体研发经历，曾经主导了无线桌面共享系统，移动远程医疗平台的架构设计和研发，参与过大型互联网直播项目，对视频编解码，流媒体，软硬件协同设计等有浓厚的兴趣。

Why the Live Streaming industry is seeing a rebirth of hardware acceleration and why FPGAs are leading this trend

Sean Gardner

Xilinx 高级市场经理（视频与图像处理方向）

20+ years of experience in video industry. Driving silicon video strategies for companies like Texas Instruments worldwide. Earlier in his career was responsible for TI’s DaVinci product line for video infrastructure. Now leading Xilinx in their cloud media strategy.

Johan Janssen

Xilinx Chief Architect

Johan started working at Xilinx almost 5 years ago, where he initially built the Video IP solution portfolio for all Xilinx video applications. This spans from video connectivity (HDMI, DP, SDI) to Video Processing (scalers, CSC, Deinterlacers, etc) and Video Over IP solutions. This portfolio which was built up from the ground is now mature and part of Xilinx IP catalogue. In the recent 1.5 years, Johan focused on enabling FPGAs for compute acceleration for video in Data centers/server, by architecting and developing the Video Acceleration solution from conception to production, with focus on Video Transcoding. As part of this, he drove the development of video transcoding in cloud/server & Data Center applications (HEVC, h.264, VP9) and associated compute acceleration. This portfolio is developed in a plug-play manner, where the FPGA is abstracted from the software developer and application. For example by enabling FFMPG plug-ins for codec acceleration. More recently, he is working on enhancing this portfolio with Machine Learning technologies Before Johan joined Xilinx, he worked as System/SoC/Video Architect Fellow for semiconductor companies like NXP and STmicro, and as VP of Architecture at Trident Microsystems where he was responsible for architecting the consumer SoCs for TV and Settopbox markets.

基于 WebRTC 架构的直播课堂实践

徐晶

七牛云教育行业解决方案高级专家

徐晶，七牛云教育行业解决方案高级专家。互联网视音频12年从事经验，优酷直播品牌创始人，原阿里巴巴高级产品专家曾在微软中国、阿里巴巴大文娱推进互联网流媒体技术的拓展。是互联网流媒体技术协议早期的核心研发者，在业内建立互联网视音频编解码的行业标杆，天猫双十一流媒体方案决策着和方案制定者。在线教育和实时视音频通讯领域的开拓者。目前拥有国内专利3项，美国专利1项。

极致压缩在腾讯海量视频业务中的技术探索及实践

李雅卿

腾讯技术工程事业群架构平台部媒体算法团队负责人

工作十年，毕业后有幸见证腾讯EB级分布式存储平台的成长，并参与其中研发和设计了诸如TFS、TSSD、COS、CBS等存储组件；近两年进入到多媒体视听领域，带领团队研发了腾讯自己的香农编码器T265，目前在视频编码、超高清视频体验、视频在传统行业赋能等方向进行探索。

教育行业的WebRTC场景创新

陈勇冀

拓课云技术总监

陈勇冀，拓课云技术总监。英国赫特福德大学软件工程硕士，曾任华为远程教育项目“eClass”研发负责人。

基于混合CDN的低延时直播P2P技术实践

冯修杰

虎牙直播音视频技术专家

冯修杰，虎牙直播音视频技术专家。2012年毕业于上海交通大学，获得通信与信息系统工学硕士学位。毕业后加入英特尔亚太研发中心，从事视频编解码的技术研发，参与过Intel Quick Sync Video VP9的研发。2016年加入虎牙直播，从事视频编解码和传输SDK的技术研发。和团队一起，搭建了一个融合CDN和P2P技术的大规模低延时直播系统，在业界具有领先水平。

基于FFmpeg的运动视频分析

李忠

英特尔资深软件工程师

李忠，英特尔资深软件工程师，FFmpeg Maintainer。多年视频编解码软件开发经验。从事过德州仪器/威盛电子/英特尔硬件加速编解码器开发。参与过多个开源项目开发，例如Mplayer, WebRTC, Libyami, FFmpeg.

张华

英特尔资深软件工程师

张华，英特尔资深软件工程师。15年视音频系统开发经验，从事过非线性编辑板卡，电视台节目播出系统，转码服务器等的开发；目前就职于英特尔 Visual Cloud 部门，曾负责 FFmpeg 中 QSV 编解码的优化及视频处理 Filter 的开发和优化并 Upstream ；目前从事基于 Intel 平台的媒体解决方案的研发工作。

基于爱奇艺HCDN视频分发网络的开放缓存

庹虎

爱奇艺高级技术总监

自2012年加入爱奇艺，目前任高级总监，负责IIG终端网络部。带领融合P2P和CDN技术的大型混合架构视频分发网络——HCDN的研发，实现海量的跨终端上传带宽；该项目荣获2017年的CCF技术发明二等奖。在机器学习、人工智能结合HCDN边缘存储分发和自适应码率等领域均有论文发表在IEEE INFOCOM、BIGCOM、ICME等国际顶级会议；推动了HCDN Inside模式的共享边缘存储业务大规模发展。早前也曾在阿里巴巴搜索及视频业务部门工作3年多。

视频服务体验提升

魏伟

京东云视频云产品研发负责人

魏伟，10多年视频行业研发经验，先后从事于AVS标准制定、广电音视频系统、互联网视频平台、视频云服务平台的架构设计和研发工作，具有丰富的广电、互联网视频、视频云等行业的研发和管理经验。2018年加入京东云。

通过跨层和组件的全局优化提高视频会议中的实时质量

张睿

Cisco The Media Architect

Using chunked-encoded chunked-transferred CMAF to bring low latency live to large scale audiences

William Robert Law

Akamai 首席架构师

Will Law是Akamai媒体业务群的首席架构师，是公司媒体分发技术的团队负责人。他在互联网流媒体领域拥有18年的工作经验，始终专注于客户端技术的开发，编写了许多至今仍在为Akamai使用的早期网络连接框架。他目前主要专注于MPEG DASH和HTTP流媒体、4K分发、VR交付，CMAF，WebRTC，云转码和多比特率切换等领域。 Will Law担任DASH产业论坛的副主席，CTA WAVE Project项目的副主席，拥有航空航天工程学的硕士学位和工商管理硕士学位，此前曾为Adobe、Internap和一些列媒体行业的初创公司服务过。

跨国应用场景和即构实时网络的调度系统架构设计

冼牛

即构科技技术副总裁

冼牛，北京邮电大学计算机硕士，香港大学工商管理硕士，多年从事实时语音视频云服务技术研究，专注互动直播和语音视频社交行业。

视频编码质量评价及如何寻找质量甜点的方法初探

钱晓炯

Juphoon CTO/VP

钱晓炯，投入通信协议（GSMA/ITU-T/IETF通信相关协议）实现和音视频算法实现及优化工作开发13年。开发并拥有音视频通信相关发明专利约15个。组织核心团队开发了JusTalk Cloud的音视频引擎，实时视频通讯平台服务于各类应用，累计用户超过8000万。

下一代低延时的直播CDN

李刚（阙寒）

阿里云CDN高级技术专家

李刚（阙寒），阿里云CDN高级技术专家。长期关注CDN缓存、音视频分发技术, 有10多年高性能服务器、流媒体传输技术经验。从2015年开始负责全面构建阿里云CDN直播分发系统, 致力于打造全球顶级的流媒体分发网络, 服务于数十亿终端用户。开源社区Apache TrafficServer代码贡献者。

High scale events – Akamai and 22Tbps streams for the World Cup 2018

William Robert Law

Akamai 首席架构师

三体云视频抗抖动演进之路

张光

三体云技术副总裁

张光，三体云技术副总裁。2005年开始从事音视频通讯技术研究，至今已有13年移动终端音视频研发经验。早期曾担任国内知名软件视频会议公司研发经理，负责过政府、电信、医疗、教育、金融等多种行业领域的100多个音视频开发项目，是2008年北京奥运会TD3G供应商项目的主要负责人。目前负责陌陌/全民快乐/尚德机构等业内知名平台的实时音视频技术服务，拥有处理每日百万级用户和数千万分钟实时音视频通讯技术实力，专注于实时音视频技术未来发展方向。

AI Powered FPGA-based Video Transcoding for Real Time Applications

Narges Afsham

Aupera AI Engineer

Senior Embedded Vision/AI Engineer at Aupera Technologies

Evaluating your Codec Options

Jan Ozer

Streaming Media Magazine Contributing Editor

Jan Ozer is a leading expert on H.264, H.265, and VP9 encoding for live and on-demand production. As a contributing editor to Streaming Media Magazine, Ozer reviews codecs, encoders, video quality analysis tools, and ancillary tools and services like QoE and QoS monitoring services. Ozer owns the Streaming Learning Center blog and is the author of several streaming-related books, including Video Encoding by the Numbers and Learn to Produce Videos with FFmpeg. In his consulting practice, Ozer helps streaming publishers produce highly optimized and deliverable streams and to choose encoders, transcoders, and workflows that optimize cost, efficiency and flexibility.

圆桌：成本与QoE

圆桌：新技术，新产品，新机会

Trends and Challenges with Multimedia Chip Design for Blu-ray, Digital-TV and Smart-phone SoC

Tsu-Ming Liu

MediaTek Lead of Advanced Innovation Research Department

Tsu-Ming Liu received M.S. and Ph.D. degree from National Chiao-Tung University in 2004 and 2007, respectively. From 2004 to 2006, he served as a Lecturer in the Tze-Chiang Foundation of Science and Technology (TCFST). In 2007, he joined the Mediatek Inc. where he develops video processing architecture for Blu-ray player and TV applications. In 2010, he published “VLSI for Video Decoding”, (ISBN 3-8433-6531-8) a text book on low power design for MPEG-2 and H.264 hardware video decoder published by LAP Lambert Academic Publishing. He received MediaTek Best Contribution Award and Innovation Award for his distinguished contributions in 2010 and 2013, respectively. In 2014, he is a manager and lead advanced innovation research department in MediaTek. He serves as ISSCC's speaker and had been invited for the publication in the special issue of JSSC in 2007 and 2016. He has authored and co-authored over 50 patents, international journal and conference proceedings. His major research interests include new multimedia application research and associated VLSI architectures. Dr. Liu was an IEEE member from 2005 and received the Best Impact Award from IEEE Taipei Section in 2006. He was a recipient of the Ph.D. candidate scholarship of MediaTek Inc. in 2007, and he is also an honorary member of Phi-Tau-Phi.

FFmpeg 硬件加速的现状与将来

赵军

腾讯云 FFmpeg决策委员会委员，专家工程师

赵军，腾讯云专家工程师、FFmpeg决策委员会委员、开源爱好者。2018年成为FFmpeg maintainer，2019年入选 FFmpeg 决策委员会(voting committee)，具备丰富的基于Linux 的Router/Gateway 开发经验，并持续关注Linux 在网络方面发展。曾开发基于Linux 的高清/ 标清H.264/MPEG2视频解码器及图像处理平台。曾在Intel DCG/NPG 负责基于FFmpeg以及Intel平台上的视频编码/解码/转码、视频后处理、视频分析的硬件加速的工作。目前在腾讯云负责视频云的系统优化相关工作，在持续向FFmpeg社区提交patch的同时，也倡导引领同事以开放的心态拥抱开源。

解密GPU：视频转码与分析加速

季光

英伟达高级工程师

季光，计算机专业博士，毕业于中科院计算所，现为英伟达高级工程师，参与GPU应用技术研究，擅长GPU加速的视频处理以及GPU计算性能加速。曾任云游戏基础设施开发项目负责人；作为Video Codec SDK v8.1应用层主要开发者以及DeepStream SDK v1.0主要开发者，在GPU视频编解码以及CUDA编程与优化方面积累了丰富的经验。

视频媒资保护主要手段解析与实现

刘歧

OnVideo视频云创作平台联合创始人

刘歧， OnVideo 视频云创作平台联合创始人，技术负责人，FFmpeg 社区活跃开发者，FFmpeg决策委员会委员、腾讯云 TVP，擅长音视频流媒体技术，分布式流媒体系统设计，流媒体CDN系统开发，个人技术兴趣领域广泛，包括音视频技术，操作系统，分布式系统，通信技术，嵌入式技术等。

视频加密和DRM的实施实践

周源

阿里云视频云媒体处理服务负责人

周源，阿里云高级技术专家，有着十多年音视频领域研发经验。之前在阿里巴巴负责淘宝视频开放平台，目前负责阿里云-视频云的媒体处理服务，致力于打造一流的、大规模的多媒体计算平台。在大规模系统架构设计、云计算方面有丰富的实战经验。

爱奇艺版权保护技术与维权实践

陈赫

爱奇艺技术产品中心高级经理

陈赫，爱奇艺技术产品中心高级经理。毕业于北京航空航天大学，10年余来一直从业互联网视频技术研发，并有丰富的管理经验。主导参与爱奇艺分布式视频编码平台、AI云平台等项目的研发，目前负责爱奇艺视频转码、AI视频理解、版权保护等项目的建设。