RTC 2019—第五届实时互联网大会

免费报名中

95004 人关注

时间 2019-10-24 09:00 ~ 10-25 18:00

地址北京朝阳区悠唐皇冠假日酒店

活动由声网Agora , RTC开发者社区 , 极客邦和 CSDN 主办

免费报名中

95004 人关注

微信分享

使用微信扫一扫分享到朋友圈

大会讲师

赵斌

声网Agora 创始人&CEO

作为实时互联网的领军人物，赵斌在1997年作为创始工程师参与Webex（网讯）创业，2008年作为CTO参与YY （欢聚时代）创业，两家公司分别于2000年及2012年在纳斯达克上市。 2014年，赵斌创立声网Agora，开创了全球实时互联网服务，其实时音视频API已经帮助超过12万应用和企业实现全球范围的实时音视频互动能力。公司目前融资总额已逾1.25亿美元，客户遍布社交、教育、IoT、金融、医疗等行业，是全球使用最广的实时音视频互动SDK。

Reggie Yativ

声网Agora 国际业务 COO

曾领导财富500强企业和高增长初创企业的发展，拥有超过17年的战略商业企业领导和商业管理经验，推动公司和团队在全球范围内取得成功和成就。加入Agora以前，Reggie就职于Redis Labs，这是一家世界领先的NoSQL数据库技术公司，他帮助公司引进了大量人才，并作为销售副总裁带领团队实现了巨大的增长。Reggie在Redis Labs任职期间，该团队在德勤2017年的技术快速500™排名中高居榜首，这是北美发展最快的500家技术公司之一。在加入Redis Labs之前，雷吉曾担任强生公司的高级董事，以及Magic Software Enterprise的首席风险官，总部位于以色列的纳斯达克交易企业软件公司。

钟声

声网Agora 首席科学家

北京大学数学系博士。曾任海信芯片总经理、博通资深主任科学家、华亚微电子技术副总裁。在美国拥有50余项技术专利，在中国拥有超过20项技术专利。曾是MPEG/JVT (H.264)与 INCITS主要成员，IEEE 成员，并发表了30余篇论文，内容覆盖了模式识别、视频编解码、计算机视觉等技术领域。

Philippe Le Hégaret

万维网联盟 (W3C) Web 技术总负责人

万维网联盟 (W3C) Web 技术总负责人，管理 W3C 所有在进行的 Web 标准技术项目。曾是 W3C 的前端技术总监，对 Web 性能、Web 多媒体技术、Web 安全等有十分深入全面的了解。万维网联盟由Web的发明者 Tim Berners-Lee 及W3C的首席执行官 Jeffrey Jaffe 领导，由设立在美国麻省理工大学（MIT）、欧洲数学与信息学研究联盟（ERCIM）、日本庆应大学（Keio University）和中国北京航空航天大学的四个全球总部（W3C Hosts）的全球团队联合运营。W3C的使命是通过开发协议、指南和标准确保Web的长期发展，尽展Web的潜能。W3C 发布的都是开放性标准，基于Royalty-Free（RF）的方式加以实现，标准都对公众可用，且使用标准没有额外的费用，其技术规范覆盖了IT及互联网、出版、电视与媒体、汽车、金融、航空等众多领域。"

陈伟

搜狗公司 AI交互事业部高级总监、语音技术部负责人

搜狗AI交互事业部高级总监，语音技术部负责人，负责搜狗语音(识别、合成、声纹等)、图像(手写、唇语识别等)、机器翻译等多个技术方向，并主要负责搜狗知音OS、机器同传、语音听写、旅行翻译宝、录音翻译笔等多项软硬件产品的技术研发工作，致力于通过技术和产品的创新提升人工智能技术的实际落地能力，为用户提供优质的使用体验。

叶琰

阿里达摩院机器智能技术实验室视频技术负责人

叶琰是阿里巴巴（美国）达摩院机器智能实验室的视频技术负责人，负责 ITU-T/VCEG 与 ISO/IEC/MPEG 等国际视频标准，视频编解码实现，以及视频理解和内容分析等方向的研发工作。在加入阿里巴巴之前，她是 InterDigital的研发总监，统管视频标准与平台研发，带领团队进行国际视频标准化制定和端到端视频通讯系统原型的开发工作。加入InterDigital之前，她还曾在杜比实验室负责图像技术研究工作，也曾在高通负责过多媒体研发与标准的建立。她参与了多项视频编解码与流媒体的国际标准制定工作，包括 H.266/VVC，H.265/HEVC ，SHVC，MV-HEVC，SCC，MPEG PCC，MPEG DASH和MPEG CMAF 等。她是 VVC 测试模型与 360Lib 算法描述的联合作者，也是HEVC 可扩展和SCC 扩展标准的联合作者。她的研究涉猎广泛，包括基于机器学习的视频编码，视频处理与内容分析，AR/VR，视频编码，视频流传输，和实时的沉浸式视频通话等。她在中国科技大学获得本科及硕士学位后，进入加州大学电子与计算机工程学院，并获得了博士学位。她是 IEEE 的高级会员。

Zoe Liu

Visionular Inc 联合创始人兼首席科学家

Zoe Liu（刘宇新）是 Visionular （微帧科技）的联合创始人、董事长兼首席科学家。Visionular 是一家创立不久的致力于提供高质量视频存储与传输服务的创业公司。在此之前的5年，Zoe 曾任 Google Chrome Media 团队软件工程师一职，并作为开源视频编解码标准 AOM/AV1 的核心成员参与研发与标准制定。她在清华大学获得了学士、硕士与博士学位，并在美国普度大学获得了第二个博士学位。不论作为主要贡献者还是技术负责人，Zoe 在多个音视频产品的设计与研发工作中都有突出贡献，包括苹果 FaceTime、Tango 视频电话、Google Glass 视频电话等。Zoe 还在多个著名研究实验室有多年的创新研究经验，包括贝尔实验室、诺基亚研究中心、太阳微处理器中心实验室、惠普实验室等。她曾发表过40余篇国际论文，并拥有50多项国际专利。她还曾作为演讲人，在2018年的 Google I/O 大会上为开发者们分享了 AV1的核心技术与最新动态。

肖康

数美技术副总裁

数美科技技术副总裁，在云计算、大数据、人工智能领域有9年一线实战和团队管理经验。先后就职于百度、360，历任技术经理、技术总监，负责数千PB数据量、数万台服务器规模的云计算和大数据平台建设，参与网页搜索、云存储、在线广告、语音识别等数据智能业务研发。

孙雨润

声网Agora 技术VP

负责全球音视频传输技术架构。原YY 后台架构师，主导Web YY整体后台系统架构搭建。曾任职腾讯QQ研究员，主导QQ空间面孔墙等项目；任职微软Microsoft 期间，参与高性能计算产品项目。

高泽华

声网Agora 技术VP

音频编码与抗丢包技术专家，设计开发声网NOVA／SOLO／SOLO-X系列语音编解码器。先后在士兰微电子、摩托罗拉、虹软科技，YY语音负责音频系统设计与架构。2014年加入声网，负责音频、视频、工程管理和客户交付与服务等方面工作。

北京大学信息科学技术学院教授， 2005年博士毕业于中国科学院计算技术研究所。2005年8月至2007年8月在美国南加州大学进行博士后研究，之后到北大工作至今。主要研究方向为视频编码及处理，已发表论文200余篇，已获授权发明专利40多项。担任IEEE Transactions on Circuits and System for Video Technolgoy(TCSVT)、Journal of Visual Communication and Representation(JVCIR)期刊编委(AE)、中国图象图形学学会理事、AVS视频组联合组长等。自2002年起，陆续参与组织AVS1、AVS+、AVS2一系列国家标准的制定，曾获国家技术发明奖二等奖、国家科学技术进步奖二等奖等奖励。

陈若非

声网Agora 音频体验与工程总监

负责基础音频技术的架构和研发，主要研究基于模型重建的语音增强技术，对回声消除，降噪，增益控制，多麦，音效处理，丢包隐藏等语音技术有丰富经验。曾任职YY基础技术研发部门，担任IEEE权威语音期刊和会议专业reviewer。

Tsahi Levent-Levi

WebRTC领域知名博客 BlogGeek.me 博主

WebRTC领域知名博客 BlogGeek.me 博主，W3C WebRTC 技术的布道师。超过20年的，软件通信领域工作经验。致力于帮助公司简化通信技术，创造优雅有效的解决方案。现在担任 testRTC 的联合创始人兼首席执行官，该公司专注于测试和监控 WebRTC 应用程序。

孙松林

北京邮电大学信息与通信工程学院多媒体教研中心主任、博士生导师

博士生导师，现任北京邮电大学信息与通信工程学院多媒体教研中心主任、IEEE 高级会员、中国计算机学会 CCF 高级会员、ACM 会员。2003 年于北京邮电大学获得工学博士学位。研究方向为智能信号处理、视频编码与通信，在移动互联网安全技术国家工程实验室、可信分布式计算与服务教育部重点实验室从事科研工作。负责的留学研究生课程《通信综合实验》在 2016 年被教育部评为来华留学英语授课品牌课程，是目前获评的唯一的实验类课程。2014 年获得北京邮电大学“大学生创新实践工作突出贡献指导教师奖”。2016 年，赴美国马里兰大学参加“北京邮电大学优势学科全英文课程体系建设青年骨干教师海外研修计划”项目。2014 年、2015 年连续两年获得中国产学研合作创新成果奖。国家自然科学基金评审专家、教育部学位与研究生教育发展中心评审专家、北京航天飞行控制中心评审委员会专家。

秦昊

相芯科技 CTO

相芯科技首席技术官，于2016年取得浙江大学工学博士学位。先后于微软亚洲研究院以及美国Adobe研究院开展计算机图形学研究工作，发表ACM/IEEE期刊论文3篇，并获得多项中国及美国发明专利。2016年加入相芯科技，负责研发团队的组建及智能图形技术的研发工作，带领团队将前沿的智能图形技术落地为行业解决方案，并累计服务了超过400家企业客户。

刘成城

微软研发总监

2009年毕业于北京大学计算机系，就职于百度网页搜索部。2011年加入微软，2014年加入小冰团队。目前任微软小冰研发总监。

胡泊

依图科技高级架构师

逾十年内容安全、公共安全、网络安全、反电信诈骗系统设计开发经验。在依图科技负责将语音识别、自然语言理解、声纹识别、智能视频解析等技术落地为安全行业产品和解决方案。曾任公安部科信局副处长。

谢晓辉

HULU 首席研发经理

Hulu首席研究主管，视频内容理解和创新孵化团队负责人，具有18+年算法研发创新和管理经验。专注于模式识别、图像视频文本等多媒体信息处理，对人工智能、人机交互领域的研究以及成果落地和产品化有丰富经验，拥有上百项相关专利，学术论文近20篇。本科毕业于西安交通大学实验班，北京邮电大学取得模式识别领域博士学位。曾先后就职于松下电器研发中心、诺基亚北京研究院、联想研究院。主导研发的手写计算器曾作为诺基亚旗舰机N97首发的市场卖点之一，在Lenovo主导研发了Horizon桌面PC的创新手势交互，荣获CES数项大奖，等等。

章真

声网Agora 资深架构师

毕业于上海交通大学，声网SDK资深架构师，负责前端API和整体架构。原摩托罗拉家庭部门首席工程师，研究多媒体系统框架，超过10年的音视频相关领域经验。

刘阳

字节跳动高级移动端图像算法工程师

目前在北京字节跳动网络科技有限公司AI Lab部门担任移动端算法工程师。在字节跳动工作期间推动了深度学习及CV技术相关技术在移动端的落地应用。参与了字节跳动深度学习及CV相关技术在移动端落地从无到有的整个过程，擅长为实际业务线上的CV算法需求在移动端提供落地解决方案

吉奇

声网Agora 资深技术架构师

硅谷回国码农一枚，现负责声网RTM实时信令云服务后台及SDK技术架构设计。毕业于中国科学技术大学和Clemson University，曾就职于Verizon，负责视频广告业务API平台及服务端设计实现，在大型分布式系统后台、网络传输优化及API架构设计和实践领域有深厚的经验积累。加入声网，全面负责RTM实时信令产品的架构设计与实现。钟爱在国内按硅谷时间工作。

马展

南京大学电子学院副教授、博士生导师

南京大学电子学院副教授，博导。2004年和2006年获华中科技大学学士和硕士学位，2011年获纽约大学（New York University）博士学位。2011年至2014年分别在三星电子美国研究院，华为美国研究院从事下一代视频压缩技术的研究和标准化工作。2015年获登峰计划支持，加入南京大学。长期从事视频信号处理和通信研究，并在视频处理能耗感知、视觉感知和计算等方面做出一系列开创性研究。发表学术论文60余篇，被Google Scholar引用1900余次，申请美国发明专利40多项，获得专利授权17项。多项专利技术被国际/国家标准采用。曾获863国家数字视音频编码特别贡献奖，2018 ACM SIGCOMM研究竞赛入围, 2018 PCM最佳论文入围, 和2019 IEEE 广播技术协会最佳论文。

周世付

声网Agora AI算法工程师

毕业于上海大学，博士学位，图像算法工程师，主要从事机器学习、计算机视觉算法的研究及落地。

汪磊

Wishlife CTO

Wishlife 联合创始人兼CTO。他有超过 15 年的系统架构与安全相关研发经验。在 Wishlife 之前，他曾任 SuccessFactors（已被 SAP 收购）带领团队从无到有，设计研发了服务于数百万用户的产品。他也是GraphQL 的早起参与者，并是开源软件graphql-clj 的作者。在不写代码的时候，他会去海里冲浪和Tahoe 滑雪，他也是单板滑雪一级教练。

任职于爱奇艺直播云技术团队，任爱奇艺研究员，负责实时CDN的研发工作，方向包括基于rtmp的实时直播CDN以及基于RTC的超实时直播CDN，支持爱奇艺奇秀直播和游戏直播等业务。早前曾在摩托罗拉家庭事业部从事VOD系统研发工作。

聂永

新浪微博技术专家

打杂多年，前后端都有涉及：Web Page、HTTP API、GraphQL、Erlang、Lua、Golang、Linux Kernel、TCP Server、UDP/QUIC、运维、测试等，也乐此不疲，自好比一块砖，哪里需要哪里填 :)。个人喜好折腾，为公司贡献5项技术创新专利。

黄佳伟

滴滴出行高级软件开发工程师

毕业于浙江大学，2016年加入滴滴，专注于日志系统构建，负责当前的滴滴大数据日志系统，承接20GB+/s的日志流量，拥有丰富的大数据开发经验。

陈炉军

阿里巴巴闲鱼事业部，无线开发专家

阿里巴巴闲鱼事业部，无线开发专家。哈尔滨工业大学本硕，毕业6年多来一直专注于音视频技术在移动端上的产品落地。曾作为手机QQ音视频iOS客户端技术负责人，负责手机QQ音视频通话（双人，多人）的产品在客户端的研发工作。如今在闲鱼负责视频、图片等的多媒体链路开发及维护，致力于音视频框架的管线化、模块化以及Flutter化推进。

李超

新东方集团产品研发中心音视频技术专家

目前就职于新东方集团。在视频行业深耕近十年，具有丰富的音视频研发经验。精通 WebRTC 整体架构及其处理流程；对常见的 3A 问题（回音消除、降噪、增益）具有非常丰富的实战经验；对网络传输有独道的见解。

Lorenzo Miniero

Meetecho 董事长, 开源项目Janus SFU联合创始人

那不勒斯费德里克二世大学计算机工程博士，Meetecho创始人兼董事长，开源项目Janus SFU联合创始人。资深WebRTC专家，IETF成员。

丁建强

Bilibili 资深前端工程师

丁建强（Tuzkiss），现任 bilibili 资深前端工程师，2016 年加入 B 站之后一直从事 Web & H5 播放器方面工作。目前主要负责直播 web & H5 播放器项目、播放器内核研发、播放器平台化支持、播放器性能优化和用户体验优化等。

石柯

沪江CCTalk CCtalk服务端开发经理

多年互联网应用服务开发经验。曾就职于腾讯、巨人，现在任职沪江负责CCtalk服务端的架构和开发工作。先后在不同公司参与研发的软件有QQ、嘟嘟语音、CCtalk等。在IM、互动直播间、互动教学场景等方面耕耘多年。关注高并发高可用服务和大型互动教学场景的服务架构实践。

赵晓涵

声网Agora 音频算法工程师

赵晓涵，北京理工大学毕业，2018 年加入声网后担任音频算法工程师，主要负责编解码器SOLO X以及AI-PLC的研发，并参与SOLO的开源。个人对能切实带来便利性、提升幸福感的技术感兴趣。

李佳俐

声网Agora 高级视频算法工程师

本科和博士分别毕业于中国科技大学和博士香港科技大学，14年在Apple实习，毕业后就职于声网，主要做视频编解码以及前后处理相关工作。对视频编解码中并行算法设计、码率控制、降噪、屏幕共享、视频质量评估、主观视频编码，画质提升以及视频编码的硬件设计等课题比较感兴趣，有所涉猎。

毛玉杰

声网Agora WebRTC高级架构师

2011年毕业于华东师范大学，原英特尔WebRTC核心研发工程师，2011年开始参与Android，Chromium，WebRTC等多个开源项目开发，常年活跃于开源社区，2014年成为WebRTC Committer，2015年加入声网Agora，主要负责WebRTC在服务端架构设计与开发，探索H5在音视频领域的应用。

现任onvideo资深前端开发工程师。负责编辑器部分的核心功能开发。精通图像处理及动效制作，有着丰富的渲染和动效方面的开发经验

目前就职美团点评服务体验平台部，担任前端工程师。主要负责前端工程化、基础工具建设以及通讯业务相关的前端研发工作，探索WebRTC，Electron等技术在客户服务业务场景中的应用。

Evan McGee

SignalWire CTO 兼联合创始人

Evan McGee是SignalWire的CTO和创始人，该公司通过简单的API的强大功能为所有技能水平的开发人员提供可编程的语音，消息和WebRTC通信。 Evan在电信行业拥有十多年的丰富经验，包括在无线MNO / MVNO，传统PSTN和VoIP / WebRTC OSS方面的技术和业务专业知识。他拥有涵盖硬件和软件设计的专利和专利申请，并经常在会议上演讲，主题涉及容器化的全球SaaS部署，微服务架构以及实时设置中的机器学习应用。

议程

2019-10-24

2019-10-25

2019-10-24

09:00 -12:00

高峰论坛

实时互联网，为实时互动而生。人们在互联网上完成的社交、娱乐、游戏、工作、学习、问诊、阅读、购物、打车、运动等等，都引入了实时互动多种场景。这些场景不仅极大提升了互动体验，有的甚至产生颠覆性地影响。实时互动场景的爆发，正在重构互联网的流程和体验，实时互联网是下一代互联网的主要潮流。RTC 实时音视频技术，作为实时互联网发展的基础硬核技术，也在快速迭代裂变。在音视频编解码、超高清音视频等多个领域，探索与人工智能AI技术的深度结合带来体验优化；在传输架构、QoE 质量领域，不断刷新海量并发高点，实现、更高清、更实时、更高质量的可能性；在开发实践领域，快速支持最新框架、新语言，几行代码简单实现 RTC；在生态技术领域不断延展，实现实时消息、应用加速、AI语音变声等更多可能性。

2019-10-24

09:00-09:40

实时互动即服务：专业化，驱动行业进化

嘉宾

赵斌

声网Agora 创始人&CEO

Reggie Yativ

声网Agora 国际业务 COO

2019-10-24

09:40-10:20

实时视频技术的现状与未来

将介绍和展示我们近期在RTC技术中实时视频传输、编码和基于人工智能算法的处理等技术方向取得的进展，并对RTC未来发展的一些趋势做简要分析。

嘉宾

钟声

声网Agora 首席科学家

2019-10-24

10:20-10:50

The rise and future of real-time communications on the Web

嘉宾

Philippe Le Hégaret

万维网联盟 (W3C) Web 技术总负责人

2019-10-24

10:50-11:20

基于AI的实时语音交互的前沿探索

嘉宾

陈伟

搜狗公司 AI交互事业部高级总监、语音技术部负责人

2019-10-24

11:20-12:00

高峰对话

2019-10-24

13:30 -17:15

人工智能 AI 与 RTC

2019-10-24

13:30-14:15

Deep Learning based Super Resolution for mobile RTC

嘉宾

周世付

声网Agora AI算法工程师

2019-10-24

14:15-15:00

基于内容的视频推荐和实践

嘉宾

谢晓辉

HULU 首席研发经理

2019-10-24

15:00-15:45

RTC x Audio x AI，现状和展望

嘉宾

陈若非

声网Agora 音频体验与工程总监

2019-10-24

15:45-16:30

互联网语音内容审核中的关键AI技术

相较于成熟的图片、视频审核，语音是行业公认的新难题。语音违规不仅风险更隐蔽、影响更恶劣，其对应的AI技术也存在更高的壁垒。难点一：高复杂度场景下的语音识别。语聊房、视频直播、短视频中的语音往往伴有极强背景音（如音乐、噪声等）、语速极快咬字不清、口音严重等情况，使得其识别难度数倍于传统场景。难点二：极低误报率要求下的违规内容过滤。上述场景中，违规内容出现的概率往往在万分之一甚至十万分之一，这就要求算法模型在不漏太多的情况下尽可能的减少误报（从而减少人工审核的工作量）。本次演讲，依图将结合自身经验，介绍如何有针对性的进行技术实现和方案设计，克服以上难点。

嘉宾

胡泊

依图科技高级架构师

2019-10-24

16:30-17:15

基于神经网络的自适应传输

网络是动态变化的，如带宽波动和意想不到的延迟，伤害用户的体验质量（QoE），而且全球网络媒体服务都需要面对这个问题。在这次演讲中，我们提出了一个神经自适应传输（NAT）框架解决全球网络规模下互动媒体服务的网络问题。整个神经自适应传输（NAT）系统有三个主要组成部分：一个基于学习的云覆盖层路由（COR）方案，通过绕过网络拥塞并找到最低延时路径，提供最佳传输路径；一个基于协同视频处理（CVP）系统的残余神经网络在设备端来协调端上的计算能力，通过学习分辨率缩放来改进QoE;还有一个深度强化学习（DRL）的自适应实时流（ARS）策略，用来选择适当的视频比特率，以获得最大QoE。我们验证过COR可以提高用户满意度5％到43％，CVP可以减少相同质量下带宽消耗的30％以上，基于DRL的ARS可以保证流媒体流畅度，QoE也可改善50％以上。

嘉宾

马展

南京大学电子学院副教授、博士生导师

2019-10-24

13:30 -17:15

编解码 Now And Then

2019-10-24

13:30-14:15

AV1编码优化在实时视频通信中的探索

嘉宾

Zoe Liu

Visionular Inc 联合创始人兼首席科学家

2019-10-24

14:15-15:00

面向互联网的抗丢包音频编码器的开源与实践

嘉宾

高泽华

声网Agora 技术VP

2019-10-24

15:00-15:45

VVC overview and progress

多功能视频编码（VVC）标准是自2018年4月开始由ITU-T和MPEG联合视频标准委员会JVET开发的新一代视频压缩标准。与目前压缩性能最好的HEVC标准相比，VVC的目标是使用一半的比特率实现相同的视频质量。 VVC的另一个重要设计目标是为各种视频应用的格式提供高压缩效率，包括传统的standard dynamic range（SDR）格式，high dynamic range（HDR）格式和全方向360度视频等格式。在最近的2019年7月的JVET标准会议上，VVC标准达到了被称之为committee draft（CD）的重要里程碑，标志着VVC标准中主要编码工具和功能已经基本选定，接下来的技术发展进入稳定阶段。在本次演讲中，我们将一起回顾一下VVC中的一些主要编码工具及VVC所支持的一些重要功能。我们还将VVC与其它视频编解码标准（如HEVC和AV1）做客观压缩性能的比较。最后我们会展望未来，看看在VVC定稿之前的最后的一年中JVET委员会还需要做的工作，并探讨一下业界预期VVC在行业和市场中会产生什么样的影响。

嘉宾

叶琰

阿里达摩院机器智能技术实验室视频技术负责人

2019-10-24

15:45-16:30

新一代AVS3视频编码标准

新一代AVS3视频编码标准自启动以来得到业界的广泛关注，已制定完成的AVS3基准档次相比于已有标准编码效率提升30%，将引领未来8K超高清、VR视频等产业应用的发展。本报告简要介绍新一代AVS3视频编码标准的最新进展情况，包括制定过程、关键技术、行业应用和未来展望等内容。

嘉宾

马思伟

北京大学信息科学技术学院教授

2019-10-24

16:30-17:15

感知编码在实时通信上的实践

感知编码是指在编码的时候结合人眼特性，进一步减除人眼通常注意不到的地方以达到节省码率的目的，或者加强人眼观看的主观效果。感知编码可以包含前处理、后处理以及编码过程中的多个算法。这里会简要介绍一下相关话题以及我们在实时通信领域限制下的相关实践。

嘉宾

李佳俐

声网Agora 高级视频算法工程师

2019-10-24

13:30 -17:15

下一代 RTC

2019-10-24

13:30-14:15

5G时代中音视频的机遇与挑战

在移动通信技术发展史上，从来没有像5G这样，让CT与IT技术如此紧密的结合在一起。5G的能力开放让更多的资源可以为开发者使用，系统解耦让更多的技术可以不断迭代更新，网络切片让更多的业务可以复用于同一张网络。
5G时代展示了一个全新的生态，由此对音视频的冲击不仅仅是高速率低时延，还有丰富的场景和业务。音视频编码技术在充分考虑了智能算法之后，开始考虑工业互联网场景，新场景新业务的爆发将是5G时代的重要特点。音视频应用也不再会局限于短视频，很多深度体验和强交互式业务将有可能获得新生。

嘉宾

孙松林

北京邮电大学信息与通信工程学院多媒体教研中心主任、博士生导师

2019-10-24

14:15-15:00

高速实时传输的拥塞控制

嘉宾

章真

声网Agora 资深架构师

2019-10-24

15:00-15:45

微软小冰实时感官系统与未来发展趋势

微软小冰是微软（亚洲）互联网工程院研发的人工智能机器人。微软小冰实时感官系统是微软小冰的线下实时交互平台，她具有多种实时识别和动态捕捉的能力，并可以用户进行实时交互。本次演讲将会对实时感官系统全方位深度剖析，并以之为例介绍实时感官系统的构成与应用，引领听众探索其未来发展趋势。

嘉宾

刘成城

微软研发总监

2019-10-24

15:45-16:30

智能图形技术的进展及应用

嘉宾

秦昊

相芯科技 CTO

2019-10-24

16:30-17:15

6DoF视频技术赋能下一代3D化体育/综艺观看体验

嘉宾

盛骁杰

优酷高级算法专家

2019-10-25

09:00 -17:15

QoE 与高并发网络架构

2019-10-25

09:00-09:45

实时互联网技术在5G时代的挑战与机遇

嘉宾

孙雨润

声网Agora 技术VP

2019-10-25

09:45-10:30

高并发实时信令以及在教育场景的应用

在国内在线教育领域，CCtalk是功能完备，体验优秀的授课平台。不同于一般的秀场模式的直播间，在线教学中师生的双向互动是教学练测中很重要的环节。小型的互动直播教室可能很容易实现，在成长为10万人规模的直播教室的道路上会有哪些难点？大型直播教室内的人人参与的频繁文字发言为何被视作洪水猛兽？业务的堆叠与服务的效率之间怎么兼得？分布式链路上的消息顺序问题怎么解决？服务宕机时怎么快速转移和恢复数据？这些疑问本次演讲带您一窥究竟。

嘉宾

石柯

沪江CCTalk CCtalk服务端开发经理

2019-10-25

10:30-11:15

利用Kubernetes 部署视频流录制服务器

深入浅出的介绍一个视频流录制服务器的实现，以及视频录制和应用服务器集成常见的坑。本演讲会通过一些实例，分享在生产环境利用Kubernetes StatefulSet 和Helm Charts来实现实时部署可扩展的视频录制服务器集群。

嘉宾

汪磊

Wishlife CTO

2019-10-25

11:15-12:00

Creating a Global Multicloud RTC Framework with Docker

创建和运行一个现代化的、全球分布的RTC基础设施需要思考：如何以最有效的方式弹性的部署服务。许多云服务商已经表明，不再需要运行自己的数据中心；现在，Docker Swarm & Kubernetes等框架结合的API向我们表明，使用单一云服务商同样过时。本次演讲将具体讨论：在全球范围建立多云rtc基础设施的技术和业务考虑。

嘉宾

Evan McGee

SignalWire CTO 兼联合创始人

2019-10-25

13:30-14:15

RTM后台水平扩展实现

嘉宾

吉奇

声网Agora 资深技术架构师

2019-10-25

14:15-15:00

滴滴20GB+/S日志系统的架构设计

滴滴每天服务几千万人次出行的过程中，产生了20GB+/S的日志数据，这些数据需要及时、完整的同步到大数据体系中，以满足业务实时、离线数据加工的需求。面对数以万计的服务节点，复杂的线上环境，严格的资源消耗，秒级的延时要求，建设一个稳定、及时、安全的日志采集系统是一个充满挑战的问题

嘉宾

黄佳伟

滴滴出行高级软件开发工程师

2019-10-25

15:00-15:45

爱奇艺超低延时直播服务RTCDN系统的实现及应用

在实时互动直播服务中，低延迟、低卡顿一直是最核心的诉求，在一定的画质下，延迟越低、卡顿率越低直播体验就越好，主播和观众间的沟通就会越顺畅；典型的，在秀场直播和游戏直播中，当前业界常规延迟在2-5秒甚至更高，这带来一定的沟通延迟，影响了互动体验。基于此，爱奇艺研发了一套完全基于WebRTC的超低延时CDN系统，RTCDN(Real Time CDN)，它即具备WebRTC的实时性，又具备CDN的高并发特性，同时兼顾卡顿率，来改善互动直播的体验。我将介绍爱奇艺RTCDN系统的工程实现和在直播中的应用情况。

嘉宾

陈坤中

爱奇艺终端网络部研究员

2019-10-25

15:45-16:30

新浪微博极速版四层接入网关的重构历程

这是一个直接处理四层数据的接入网关，同时为客户端提供TCP、HTTP等链路接入通道，本演讲将逐一介绍该网关从诞生、业务分离、增加插件机制等重构过程和设计理念等。

嘉宾

聂永

新浪微博技术专家

2019-10-25

16:30-17:15

实时消息在同城货运场景中的设计与应用

嘉宾

刘新翠

快狗打车移动研发部负责人

2019-10-25

09:00 -17:15

大前端应用开发峰会

2019-10-25

09:00-09:45

Common WebRTC mistakes and how to avoid them

嘉宾

Tsahi Levent-Levi

WebRTC领域知名博客 BlogGeek.me 博主

2019-10-25

09:45-10:30

Flutter浪潮下的音视频研发探索

分享主要针对闲鱼APP在当下流行的跨平台框架Flutter的大规模实践，介绍其在音视频领域碰到的一些困难以及解决方案。并带来了闲鱼基于Flutter的音视频开源框架TPM以及基于该框架完成的Flutter音视频开源插件如播放器、相册等等。

嘉宾

陈炉军

阿里巴巴闲鱼事业部，无线开发专家

2019-10-25

10:30-11:15

H5 实时音视频直播的技术探索

嘉宾

毛玉杰

声网Agora WebRTC高级架构师

2019-10-25

11:15-12:00

实时通讯在美团客服的跨端应用实践

嘉宾

杨尚林

美团资深前端工程师

2019-10-25

13:30-14:15

MPEG-DASH 在 bilibili 的实践、优化与思考

伴随着音视频和网络技术的快速发展，音视频内容逐渐成为互联网内容的主流，而这些内容的用户体验也显得愈发重要。B 站一直致力于用户音视频播放体验的改善及优化，于去年正式引入并全量上线 MPEG-DASH 作为新的流媒体解决方案。上线之后经过多次版本迭代优化，最终实现 5分位秒开，卡顿率得到大幅优化，切换体验大幅提升，获得用户一致好评。

而我们 B 站使用的 MPEG-DASH 是一种自适应比特率串流技术，使高质量流媒体可以通过传统的 HTTP 网络服务器以互联网传递。MPEG-DASH 播放器可以无缝适应不断变化的用户网络或者缓冲区大小并提供高质量的播放体验，减少卡顿率。同时，基于 B 站现有的音视频技术，我们也在一直思考如何为用户带来更独特的内容，更炫酷的方式，以及更优质的体验等。

嘉宾

丁建强

Bilibili 资深前端工程师

2019-10-25

14:15-15:00

基于深度学习实时直播内容风控

随着互联网高速发展，直播场景日益丰富，违规音频视频图片已经泛滥成灾；同时国家内容监管日益趋严，监管政策集中出台，行政处罚愈发严格，实时内容风控日益重要，传统的人工方式也已经无法满足实时风控的需求，时代呼唤新的解决方案。数美基于深度学习技术，提出全栈式AI实时直播内容风控的解决方案，包括LSTM、RNN、CNN、GAN等深度学习模型，有效识别直播视频涉政、暴恐、涉黄等违规内容，保证内容合规，净化了网络环境。

嘉宾

肖康

数美技术副总裁

2019-10-25

15:00-15:45

深度学习CV算法在WebRTC领域的应用

嘉宾

刘阳

字节跳动高级移动端图像算法工程师

2019-10-25

15:45-16:30

基于信令流的应用状态同步实践

嘉宾

陶泽宇

无网信息科技 CTO

2019-10-25

16:30-17:15

基于 node-canvas 与 FFmpeg 的数据可视化视频合成

大多数数据可视化是将数据生成为图片。但将数据实时生成为可视化的视频也存在很大需求。如何将数据从 Web 前端输入，最后生成一个可视化的视频，并支持在前端预览？如何解决其中的性能挑战？完成数据的可视化之后，合成为视频会遇到什么坑？我们在本演讲中，将分享数据可视化从canvas做成video的开发思路和这个过程中的一些坑和痛点。

嘉宾

孙博文

OnVideo 资深前端开发工程师

2019-10-25

09:00 -17:00

WebRTC 工作坊

2019-10-25

09:00-12:00

WebRTC 从 1 对 1 到服务端的技术实践

嘉宾

李超

新东方集团产品研发中心音视频技术专家

2019-10-25

13:30-15:00

Janus 服务端实践

嘉宾

Lorenzo Miniero

Meetecho 董事长, 开源项目Janus SFU联合创始人

2019-10-25

15:00-16:00

WebRTC 网络抗丢包策略

嘉宾

赵晓涵

声网Agora 音频算法工程师

2019-10-25

16:00-17:00

WebRTC 降噪与回声消除

嘉宾

李超

新东方集团产品研发中心音视频技术专家

实时互动即服务：专业化，驱动行业进化

赵斌

声网Agora 创始人&CEO

Reggie Yativ

声网Agora 国际业务 COO

实时视频技术的现状与未来

钟声

声网Agora 首席科学家

The rise and future of real-time communications on the Web

Philippe Le Hégaret

万维网联盟 (W3C) Web 技术总负责人

基于AI的实时语音交互的前沿探索

陈伟

搜狗公司 AI交互事业部高级总监、语音技术部负责人

高峰对话

Deep Learning based Super Resolution for mobile RTC

周世付

声网Agora AI算法工程师

毕业于上海大学，博士学位，图像算法工程师，主要从事机器学习、计算机视觉算法的研究及落地。

基于内容的视频推荐和实践

谢晓辉

HULU 首席研发经理

RTC x Audio x AI，现状和展望

陈若非

声网Agora 音频体验与工程总监

互联网语音内容审核中的关键AI技术

胡泊

依图科技高级架构师

基于神经网络的自适应传输

马展

南京大学电子学院副教授、博士生导师

AV1编码优化在实时视频通信中的探索

Zoe Liu

Visionular Inc 联合创始人兼首席科学家

面向互联网的抗丢包音频编码器的开源与实践

高泽华

声网Agora 技术VP

VVC overview and progress

叶琰

阿里达摩院机器智能技术实验室视频技术负责人

新一代AVS3视频编码标准

马思伟

北京大学信息科学技术学院教授

感知编码在实时通信上的实践

李佳俐

声网Agora 高级视频算法工程师

5G时代中音视频的机遇与挑战

孙松林

北京邮电大学信息与通信工程学院多媒体教研中心主任、博士生导师

高速实时传输的拥塞控制

章真

声网Agora 资深架构师

微软小冰实时感官系统与未来发展趋势

刘成城

微软研发总监

2009年毕业于北京大学计算机系，就职于百度网页搜索部。2011年加入微软，2014年加入小冰团队。目前任微软小冰研发总监。

智能图形技术的进展及应用

秦昊

相芯科技 CTO

6DoF视频技术赋能下一代3D化体育/综艺观看体验

盛骁杰

优酷高级算法专家

实时互联网技术在5G时代的挑战与机遇

孙雨润

声网Agora 技术VP

高并发实时信令以及在教育场景的应用

石柯

沪江CCTalk CCtalk服务端开发经理

利用Kubernetes 部署视频流录制服务器

汪磊

Wishlife CTO

Creating a Global Multicloud RTC Framework with Docker

Evan McGee

SignalWire CTO 兼联合创始人

RTM后台水平扩展实现

吉奇

声网Agora 资深技术架构师

滴滴20GB+/S日志系统的架构设计

黄佳伟

滴滴出行高级软件开发工程师

毕业于浙江大学，2016年加入滴滴，专注于日志系统构建，负责当前的滴滴大数据日志系统，承接20GB+/s的日志流量，拥有丰富的大数据开发经验。

爱奇艺超低延时直播服务RTCDN系统的实现及应用

陈坤中

爱奇艺终端网络部研究员

新浪微博极速版四层接入网关的重构历程

聂永

新浪微博技术专家

实时消息在同城货运场景中的设计与应用

刘新翠

快狗打车移动研发部负责人

Common WebRTC mistakes and how to avoid them

Tsahi Levent-Levi

WebRTC领域知名博客 BlogGeek.me 博主

Flutter浪潮下的音视频研发探索

陈炉军

阿里巴巴闲鱼事业部，无线开发专家

H5 实时音视频直播的技术探索

毛玉杰

声网Agora WebRTC高级架构师

实时通讯在美团客服的跨端应用实践

杨尚林

美团资深前端工程师

MPEG-DASH 在 bilibili 的实践、优化与思考

丁建强

Bilibili 资深前端工程师

基于深度学习实时直播内容风控

肖康

数美技术副总裁

深度学习CV算法在WebRTC领域的应用

刘阳

字节跳动高级移动端图像算法工程师

基于信令流的应用状态同步实践

陶泽宇

无网信息科技 CTO

基于 node-canvas 与 FFmpeg 的数据可视化视频合成

孙博文

OnVideo 资深前端开发工程师

现任onvideo资深前端开发工程师。负责编辑器部分的核心功能开发。精通图像处理及动效制作，有着丰富的渲染和动效方面的开发经验

WebRTC 从 1 对 1 到服务端的技术实践

李超

新东方集团产品研发中心音视频技术专家

Janus 服务端实践

Lorenzo Miniero

Meetecho 董事长, 开源项目Janus SFU联合创始人

那不勒斯费德里克二世大学计算机工程博士，Meetecho创始人兼董事长，开源项目Janus SFU联合创始人。资深WebRTC专家，IETF成员。

WebRTC 网络抗丢包策略

赵晓涵

声网Agora 音频算法工程师

WebRTC 降噪与回声消除

李超

新东方集团产品研发中心音视频技术专家

活动门票

活动筹备中

售票推广中

活动结束

选择票

门票名称

单价(￥)

截止时间

数量

普通票（不含WebRTC工作坊）

￥88

2019-10-25 18:00

已售罄

门票权益：1场千人高峰论坛；5大技术分会场；展区参观；大会资料；100元代金券（用于报名WebRTC工作坊）。注：代金券将会随报名成功后的电子门票一起发放。

标准票（不含WebRTC工作坊）

￥388

2019-10-25 18:00

已售罄

门票权益：1场千人高峰论坛；5大技术分会场；展区参观；大会资料；2天午餐；大会订制双肩包；150元代金券（用于报名WebRTC工作坊）。注：代金券将会随报名成功后的电子门票一起发放。

WebRTC工作坊

￥188

2019-10-25 18:00

已售罄

门票权益：专场全天培训；培训当日午餐；展区参观；培训资料；

VIP赠票

仅邀请

免费

2019-10-23 16:00

已结束

门票权益：1场主会；5大技术分会场；不含workshop；展区参观；大会资料；大会PPT下载；双肩包；自助餐；VIP晚宴

门票只能通过使用邀请码获得

WebRTC工作坊学生票

免费

2019-10-25 18:00

已售罄

此门票需要主办方审核

门票权益：不含大会其它场次，其它场次需单独报名。含工作坊专场全天培训；培训当日午餐；展区参观；培训资料；需提交学生证带有学校、学号的照片，才可以审核通过。

普通票学生票

免费

2019-10-25 18:00

已售罄

此门票需要主办方审核

需提交学生证带有学校、学号的照片，才可以审核通过。

Agora 员工门票

仅邀请

免费

2019-10-25 18:00

已售罄

门票只能通过使用邀请码获得

退票说明：不支持退票

优惠或邀请码

使用优惠或邀请码

票价

￥ 0

活动已结束

本活动由百格活动提供技术支持