使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
主办方致辞
联席主席致辞
《交互式视频的处理》
交互式视频为用户提供了一种新颖的视频观看体验,拉近了用户与内容创作者的距离。我将会介绍我们如何实现交互式播放,如何编码交互式视频流,在落地过程中遇到的种种问题及解决方法。
《The Challenges of Deploying HTTP over QUIC at Scale》
QUIC comes into a world, where having one well known transport protocol for HTTP was taken for granted. It brings new ideas, features and possibilities, but it also brings changes in some of the existing paradigms and new challenges. During the deployment of QUIC support to Akamai edge servers, we faced many of the challenges and learned numerous lessons. Let's peek under the hood of one of the world's largest distributed computing platforms.
《互联网视频产业的商业生态和未来值得关注的颠覆性技术》
《Open Source multimedia communities: VLC, FFmpeg, dav1d》
Jean-Baptiste Kempf is the president of VideoLAN, the non-profit organization behind x264, VLC media player and the dav1d, and active in numerous other multimedia projects like FFmpeg, x265 or AOMedia. This presentation will talk a bit about the history of VideoLAN and the organizations of those open source projects.
《下一代视频压缩:从HEVC到VVC》
《360视频云Web前端HEVC播放器实践剖析》
随着360视频云服务平台IoT媒体能力不断拓展、HEVC在业务解决方案中的普及,其前端团队也围绕HEVC前端播放及解密实现了一套基于WebAssembly、WebWorker的通用模块化Web播放器,本次分享将同大家一起详细剖析这套播放器的架构设计、核心原理,具体痛点问题的解决方式。
《图像视频降噪的现在与未来——从经典方法到深度学习》
《淘宝直播低延迟技术探索》
《视频通话与功耗优化》
《视频云的下半场 向前走还是向“厚”走》
2016年到现在视频云,包括腾讯在内的各家视频云平台,和直播、短视频的高速增长同步,聚焦在内容和流量的分发、CDN,各家在比拼质量、大事件上量的稳定性、架构及成本。而到现在,流量的增长基本都到了一个平稳期了。这个时候,面向产业界,面向开发者,我们如何提供更多更新的能力给到他们,提升平台的用户体验呢?向前走,主要就是面向内容供给侧、内容的聚合、生产制作、媒体处理等;而向“厚”走,就是把PaaS平台做的更好,比如对更多格式、协议的支持,比如AV1、SRT协议,比如VR、AI应用等,也包括终端SDK和小程序插件能力等等。本次分享,希望和业界一起探讨视频云下半场的方向与定位,也希望与产业界同仁一道,共建更好的大视频生态。
《虎牙直播边缘计算网络框架》
虎牙直播一直在直播行业尝试着技术突破。行业第一个10M蓝光,大规模的cdn p2p等技术,都是虎牙直播追求技术突破的例子。随着5G到来,新的应用和商业模式推陈出新,未来将催生大量不同应用,对网络性能产生更高要求。 边缘计算技术就是解决不同应用带来的多样化网络需求的核心技术之一,在靠近接入网的机房增加计算能力,后移端上算力,让用户体验得到质的飞跃。虎牙直播利用自建的CDN融合网络,大规模、高灵活性的边缘计算资源,开放给主播端、观众端,以实现复杂的计算逻辑、更高清视频、更多样化的产品需求。缘计算应用系统:udp视频上行,虎牙自建p2p、3D虚拟直播、多人连麦、户外高清直播。
《美图视频云处理系统的优化演进之路》
随着视频逐渐成为用户主流的内容表达方式,服务端的视频处理能力作为保障用户的生产和消费体验、降低平台运营成本的重要环节也面临着更大的技术挑战。本次演讲将以美图大规模视频云处理系统在保障业务快速迭代的过程中,围绕高可用保障、性能优化及成本优化的实战经验,给大家带来大规模视频云处理系统的最佳实践。
《大规模直播场景下的边缘计算体系支撑》
边缘计算是对云计算的补充,其分布式、低延时计算、智能化的特性为大视频应用的发展带来了全新动力。网宿边缘计算平台,通过虚拟化及传输优化技术,将CDN节点资源池化,并搭配CDN传输网络,对外提供灵活易用并具备规模化的弹性资源能力,平台在内部CDN直播应用以及商业化应用上已积累了大量的实践经验。本次演讲,将分享边缘计算平台在大规模直播平台构建上,提升推流、连麦、转码、CDN分发等一体化直播平台质量及运营效率的一些实践经验。
《华为云视频通话-激活伙伴商业无限潜力》
《音视频合成的云边缘计算实现》
在互联网云时代的今天,实时音视频的各种计算也向云端发展,由于音视频的数据计算量巨大,加上移动,联通,电信等运营商之间的互通的问题,使得中心云端的计算压力巨增,互通性的成本也随之增加,为了最优的解决这一矛盾,三体云在实践中不断的改进优化,实现了一套充分利用边缘云端分散计算的方式,很好的的解决了这一矛盾。
《不同应用场景中,如何实现最优用户体验?》
面对音视频各应用场景的开发,如何针对场景的不同特性来提升用户体验,如:直播如何实现秒开?连麦如何无感切换?东南亚地区如何对抗自然灾害引起的弱网?在线教育如何保证音视频和课件的绝对同步?这些问题值得我们思考与探讨。
《全链路的数据和质量监控体系解决方案》
网易云信在音视频服务中全链路的数据和质量监控体系的构建方面的一些实践,可能包括数据采集与传输优化,实时和离线计算,实时监控规则引擎,时序数据存储等,通过实时立体的监控体系,影响和优化网络链路调度策略,QoS和QoE保障等,另外可以介绍一些在音视频服务质量可视化方面的工作,通过数据可视化方便内部服务优化和方便用户针对质量问题事中事后排查分析等。
《FPGA视频加速方案及NGCodec介绍》
《基于FPGA的实时多媒体处理接口》
本次演讲讨论基于现实中数据中心所有到一般性问题,尤其是数据处理的困境。而联捷计算科技(CTAccel)针对基于FPGA的异构计算的特点,与赛灵思配合提出发挥FPGA特长的多媒体解决方案,并以应用接口的方式提供给用户。联捷计算科技的图片处理(CIP)核心技术已获得美国专利,通过硬件流水设计和任务级并行,大大提升了数据中心的图片处理性能,包括更小的响应延时,更大的并发请求和更低的TCO。
《高效视频处理与AI融合架构》
要做到高效的视频内容处理及分析,首先要解决的是海量视频的编解码算力,需要提供高密度的计算力,可负担的起的计算力,Aupera专注于构筑视频专属的分布式计算架构,真正意义实现了基于FPGA的异构计算,在视频编解码的同时,嵌入了实时AI的加速引擎,同样的硬件、一套高度集成的软件框架,特别适用于海量视频需要实时对内容进行处理的场景,并让广大开发者在我们的平台上无负担开发应用。本次演讲主要介绍Aupera的分布式异构计算平台的优势,高度融合视频编解码与嵌入式AI分析,以及该架构在云端及边缘侧的适用场景,助力AIoT时代视频AI应用的普及。
《基于FPGA异构计算快速构建高性能图片处理解决方案》
图片已经成为互联网主要的内容构成,与其相关的图像处理业务负载给互联网数据中心带来巨大的算力挑战。基于FPGA+CPU的异构计算因其可以支持细粒度的流水线和并行化算法架构,平台灵活可配置,受到了越来越多的市场关注。但是由于传统FPGA设计方法基于低层次设计语言,如Verilog/VHDL等,设计周期漫长,无法很好满足互联网用户快速迭代的行业需求特点。为此,依托于核心团队在FPGA芯片设计与EDA领域10年的积累,深维科技基于Xilinx Alveo平台推出了性能领先的JPEG缩略图以及JPEG/WebP转码方案。该方案可以完整的支持FFmpeg, ImageMagick,OpenCV等开源框架,可以快速集成到各类客户场景。同时由于该产品完全基于Xilinx SDAccel平台进行设计开发,充分利用了C/C++高层次设计语言的表达效率,大幅缩短产品开发周期,简化了研发流程,可以在获得领先的性能指标同时,快速响应客户的特定需求。
《点云压缩与通信》
Point cloud data arise from depth sensing and capturing for both auto driving/navigation/smart city, as well as content capture and VR/AR playback applications. Recent advances in sensor technology and algorithms, especially 77Ghz MIMO radar systems, and high resolution structured light in conjunction with very high resolution RGB camera arrays, have made point cloud capture getting closer to real world applications. In this talk I will overview the related research at the Multimedia Computing & Communication Lab at UMKC, in conjunction with our industry partners for the auto driving thrusts at the new NSF Center for Big Learning, and discuss the main technical challenges in point cloud capture, compression and communication for auto driving and smart city applications, especially the static and dynamic geometry compression, as well as attributes compression problems, and the new graph signal processing tools that can bring new coding efficiency. Some initial results will be presented and discussed, as well as the MPEG Point Cloud Compression call for proposal and results.
《AI驱动的沉浸体验新玩法》
高速5G和性能更强大的终端为社交、游戏、教育等场景带来的更丰富的互动体验,本次分享将介绍AI驱动的沉浸式体验实践,以及因此带来的新的用户交互方式。
《Immersive video coding and standardization》
Due to the rapid advancement of software development and mobile devices, applications related to VR have become more and more popular in recent years. In order to provide an excellent immersive experience, the recorded VR360 videos require extremely high resolution. Therefore, efficient compression technology is necessary for storage and transmission. In this talk, an overview of immersive video coding including the trends and recent developments in JVET VR360 standardization will be presented first followed by our proposed efficient projections and VR360[1] specific video coding tools. In addition, the standardization of point cloud coding will also be introduced.
《基于Open WebRTC Toolkit (OWT)的8K全景视频低延时直播系统》
《视频编解码结合的画质增强和移动端优化》
本次分享将重点介绍图像和视频画质增强概览;实时视频画质增强的难点;基于视觉显著性的直播ROI编码;解码结合的实时视频超分;移动端异构加速的视频增强;5G时代的移动端视频处理展望等几方面内容。
《金山云AV1云转码实战》
5G时代的来临将使视频体量呈爆炸式增长,使云转码技术研究有着重要的战略意义。金山云在视频云转码领域深耕多年,积累了KSC265、集智高清等行业领先的编码产品研发技术,目前正积极推动新一代视频编码技术AV1的落地。AV1已于2018年6月定稿,能够带来比H.265更高的压缩比,且具备良好的生态。本次分享主要介绍金山云如何为云转码场景量身定制AV1的优化策略。
《基于视觉感知特性的视频编码-提高用户最终体验》
近年来,基于视觉感知特性的视频编码算法获得工业界和学术界的广泛关注。 在本次讲座中,我们将展示如何在视频编码和处理的整个过程中提高视觉编码性能。 此外,我们还将讨论在现实应用中应用此类算法所面临的问题和挑战。 最后,我们将讨论未来视觉编码算法发展的趋势,旨在提高最终用户的体验。 本讲座潜在的受众包括但不限于学术界和工业界中视频编码,处理和质量评价方面的研究人员/开发人员。
《影像一体化解决方案中视频编码技术的尝试与应用》
大疆创新致力于提供高端影像解决方案,其在无人机、专业相机及手持设备上均提供了高品质的摄影体验。本讲座旨在探讨在实际拍摄环境中视频编码技术如何与影像设备相结合,以提供高质量的视频编码效果,并对大疆创新在此方面的尝试进行介绍和总结。
待定
《中国AVS系列超高清视频编码标准与生态建设》
随着5G时代来临,多媒体技术进入以4K/8K超高清视频时代。为了应对超高清视频数据通量爆炸带来的实时传输技术挑战以及编解码内核供应链安全挑战,中国音视频编解码标准工作组分别面向4K、8K,制定了AVS2、AVS3国家标准,并向国际推广。本报告重点介绍面向下一代视频应用的AVS系列标准技术以及在广播电视、IPTV、和移动互联网等领域的应用生态建设情况。
待定
《实时远程医学影像服务质量保障与网络优化》
实时远程医学影像产品与传统影像产品有一个共性既医生对影像评价的本质是对图像质量的严苛评判,对远程而言这意味着对图像传输的失真、卡顿、延时提出更高要求。本次分享将介绍华大智造影像产品研发团队如何在现有网络保障实时远程医学影像的服务质量及在网络方面做的优化。
《平安云实时音视频网络传输优化实践》
实时音视频产品面临很多技术挑战,其中最重要的挑战是如何在复杂多变的网络条件下提供稳定、可靠的、清晰的音视频通话。本次分享将介绍平安音视频云在弱网对抗、大群组通话、信令接通率优化等方面做的一些思考和实践。
《5G音视频的全球标准》
本次分享将重点介绍超高清的全球标准、未来趋势、落地关键因素。
《SRT协议在互联网领域的实践》
SRT协议诞生于广播电视行业,解决了流媒体在公网传输上稳定性不足的问题。但是由于广播电视行业ToB的特性,在互联网行业落地时会遇到一些挑战。例如高负载,流媒体传输协议和封装协议生态的适配。本次演讲会重点分享bilibili在遇到这些挑战时的应对和经验,和大家共同提高流媒体的体验质量。
《QUIC Performance Optimizations》
Top racing cars are never finished. They need continuous research, improvements and tuning. Transport protocols are no different. When used at scale, they encounter a myriad of network conditions that change every moment and they consume amounts of computing resources, in order to perform as expected. They need continuous attention to stay at the top and keep up with the changing world. QUIC is not a silver bullet to change that reality and it even caught UDP stack unprepared. Let’s dive into the details of QUIC performance optimizations.
《TCP的问题与解决方案》
TCP是互联网应用最广泛的数据传输协议之一,今天绝大多数的网络社交、云计算、大数据和智能终端应用等都在使用TCP作为底层协议传输数据,也是我们音视频行业关注的传输协议之一。作为一个伴随着互联网的诞生而发展起来的 “老”协议,TCP过去40年来改变了世界,但也成为了新的技术瓶颈。在这个主题演讲里我们深度分析TCP瓶颈的根源,回顾这些年来互联网在TCP根本问题没有解决的情况下如何解决视频传输问题,然后分享我们TCP的研发经验,剖析学术和工程难点,最后例举了典型音视频行业TCP场景案例。
《腾讯视频P2P带宽节省率持续提升之路》
P2P节省率=P2P带宽/ (P2P带宽 + CDN带宽), 要想提升P2P带宽节省率,最直接的方式当然是直接压缩CDN带宽如减少CDN下载,但是简单粗暴的减少CDN下载势必会带来播放体验问题;所以我们的思路是先优化我们的P2P网络,在P2P网络下载的效率和稳定性提升之后,再来合理的减少CDN下载。
待定
《华为云昇腾视觉计算解决方案》
基于华为自研昇腾芯片,华为云推出AI推理加速云服务器,这里介绍其在视觉计算领域领先业界的解决方案。
《基于 WebRTC 低延迟海量观众的直播系统解析》
《学而思网校QoE优化实践》
本议题将介绍QoE在不同行业内的常见优化思路;并分享在大规模教育直播场景下,学而思网校进行全链路数据收集、监控,从而驱动技术升级、产品改进、直播规范,进而优化QoE的一些经验。
《基于流式协议的直播多码率自适应优化》
游戏直播领域,清晰度与流畅度的平衡一直是行业痛点,如何为用户选择最合适的分辨率与码率档位是业界一大难题。本次演讲将会带来快手在基于流式协议的直播多码率自适应框架下,如何以数据驱动在播放器、CDN、算法等多个环节进行深度调优,得到QoS与QoE的提升。
《音视频评测的道与术》
《IoT OS 下的音频实践-以智能音箱为例》
提纲:
智能音箱大趋势
打造具有竞争力的智能音箱方案(方案对比,软件+硬件)
智能音箱方案框架及趋势(市场主流的框架说明)
3.1 硬件 mpu->mcu linux->RTOS
3.2 软件 重采样 + 混音 + 混响 + 打断唤醒 + 音效
基于IOTOS的音频开发实践软件
4.1 RTT 简单介绍
4.2 软件实践
爬坑经验
《更高效,更省空间的音频Huffman解码算法》
介绍Huffman解码,是MP3/WMA当中的一个关键算法
介绍常用Huffman解码做法
分析选用的Huffman解码做法的优点及不足
利用动态规划算法导出最优解码表
实际结果评测与在MP3/WMA中的应用(其中WMA可节省60%左右空间)
《如何定义和设计一颗智能音箱芯片》
智能音箱的特点
音频播放:(codec)设计上的考量、设计的优势
录音:(Mic阵列)设计上的考量、设计的优势
低功耗:(PM)设计上的考量、设计的优势
打断唤醒 :(DSP)设计上的考量、设计的优势
经典蓝牙+BLE:(配网+传统音箱)
性能与成本的平衡考虑
《小程序多人语音开放技术之道》
开放的语音通信服务能力,与App体系内的通信相比,除了技术点上实现,更要关注的是扩展性,兼容性,运营和服务能力。本次分享将探讨小程序多人语音的开放中面临的设计和技术问题,思考和解决之道。
《MPEG-H在流媒体和广播领域的应用》
《智能语音交互技术实践及发展趋势》
随着5G和AIoT技术的发展,语音做为新型的人机交互入口得作用越来越明显,本演讲结合语音交互技术在各类智能设备上的应用实践,面向对语音交互技术感兴趣的观众,介绍语音AI落地中的诸如嘈杂环境效果差、技术标准化程度不一致等痛点问题的成功解决方案以及语音芯片等相关的发展趋势。
《端对端语音识别及其应用》
近几年来,语音识别技术一直在突飞猛进地发展着,从HMM到CTC,再到Attention。端到端语音识别技术已经逐渐走出了实验室,并成为工业应用的主流系统。本报告将回顾端到端语音识别技术的发展,并展开分析其在工业应用中的特点。
《音视频内容审核中的人工智能》
音视频行业蓬勃发展,但色情低俗、暴力恐怖、违法违禁等不良信息的存在,让APP下架事件频发,内容治理成为了互联网平台健康发展的必选项。本次演讲将会分享网易易盾在音视频内容审核中全方位运用人工智能技术的实战经验。针对海量的音频、视频、图片等多媒体内容,算法审核在守护平台内容合规的过程中发挥了重要作用。该分享可以让对人工智能算法或音视频内容审核感兴趣的听众了解语音、图像等算法技术在内容安全领域的落地方式。
《面向5G + AI时代的高效视频处理》
当前互联网上大于75%的流量都来自于视频,据估计5G时代视频流量更是高达90%以上。如何压缩,传输,以及分析视频内容成为5G部署及大规模应用的关键。虽然传统的5G部署也有一定市场,但经过AI加持的智能终端/边缘/云计算可以为5G带来更大的收益及降低其部署成本。本次报告主要探索了在硬件层面如何利用传统方法及深度学习方法对视频进行压缩和分析,以及如何在5G信道中传输压缩后的码流。
《AI在视频拆条中的应用》
传统媒体视频中经常夹杂无效信息及敏感信息片段,传统人工拆条费时费力。本次分享如何使用AI技术代替传统视频拆条,实现特定场景下视频的自动拆条工作。
《机器学习在语音增强中的应用》
近年来,机器学习,特别是深度学习大大改变了基于短时傅里叶变换的语音信号处理,提供了噪声鲁棒性和语音可懂度更好的技术方案。本专题将讨论深度学习在语音增强领域的应用,并分享我们在线教育场景下落地的探索。
《自研海外pcdn系统技术架构与演进》
PCDN海外复杂环境中如何提高穿透率和分享率的同时,保证弱网的用户体验和内容版权的保护中采用的技术,架构演进及实际落地效果展示。
《白山流媒体出海架构与实践》
随着中国移动互联网的全球化,越来越多的企业选择出海,将自己的产品和模式带到海外,开拓新的用户市场,特别是短视频和直播流媒体行业。本次分享重点介绍白山流媒体的出海架构以及在复杂网络环境下,如何通过质量化数据运营,全链路监控和多种传输优化手段,保障出海客户的流媒体服务质量和体验的同时,更好地满足客户的特殊场景需求。
《音视频应用的安全趋势和Akamai纵深防御体系》
随着OTT、短视频、互动直播等各类音视频应用的兴起,各种与之相关的安全问题越发凸显。本次分享重点介绍音视频行业的安全趋势,以及Akamai的纵深防御安全体系如何确保服务的可靠和安全。
《微软云音视频应用架构》
借助微软云服务,可以在任何设备、平台上随时随地传送媒体内容。通过点播和直播传送,用安全的方式为电视、个人电脑、移动设备等端点设备上载、存储、编码和打包视频或音频内容。
主办方致辞
联席主席致辞
《交互式视频的处理》
《The Challenges of Deploying HTTP over QUIC at Scale》
《互联网视频产业的商业生态和未来值得关注的颠覆性技术》
《Open Source multimedia communities: VLC, FFmpeg, dav1d》
《下一代视频压缩:从HEVC到VVC》
《360视频云Web前端HEVC播放器实践剖析》
《图像视频降噪的现在与未来——从经典方法到深度学习》
《淘宝直播低延迟技术探索》
《视频通话与功耗优化》
《视频云的下半场 向前走还是向“厚”走》
《虎牙直播边缘计算网络框架》
《美图视频云处理系统的优化演进之路》
《大规模直播场景下的边缘计算体系支撑》
《华为云视频通话-激活伙伴商业无限潜力》
《音视频合成的云边缘计算实现》
《不同应用场景中,如何实现最优用户体验?》
《全链路的数据和质量监控体系解决方案》
《FPGA视频加速方案及NGCodec介绍》
《基于FPGA的实时多媒体处理接口》
《高效视频处理与AI融合架构》
《基于FPGA异构计算快速构建高性能图片处理解决方案》
《点云压缩与通信》
《AI驱动的沉浸体验新玩法》
《Immersive video coding and standardization》
《基于Open WebRTC Toolkit (OWT)的8K全景视频低延时直播系统》
《视频编解码结合的画质增强和移动端优化》
《金山云AV1云转码实战》
《基于视觉感知特性的视频编码-提高用户最终体验》
《影像一体化解决方案中视频编码技术的尝试与应用》
待定
《中国AVS系列超高清视频编码标准与生态建设》
待定
《实时远程医学影像服务质量保障与网络优化》
《平安云实时音视频网络传输优化实践》
《5G音视频的全球标准》
《SRT协议在互联网领域的实践》
《QUIC Performance Optimizations》
《TCP的问题与解决方案》
《腾讯视频P2P带宽节省率持续提升之路》
待定
《华为云昇腾视觉计算解决方案》
《基于 WebRTC 低延迟海量观众的直播系统解析》
《学而思网校QoE优化实践》
《基于流式协议的直播多码率自适应优化》
《音视频评测的道与术》
《IoT OS 下的音频实践-以智能音箱为例》
《更高效,更省空间的音频Huffman解码算法》
《如何定义和设计一颗智能音箱芯片》
《小程序多人语音开放技术之道》
《MPEG-H在流媒体和广播领域的应用》
《智能语音交互技术实践及发展趋势》
《端对端语音识别及其应用》
《音视频内容审核中的人工智能》
《面向5G + AI时代的高效视频处理》
《AI在视频拆条中的应用》
《机器学习在语音增强中的应用》
《自研海外pcdn系统技术架构与演进》
《白山流媒体出海架构与实践》
《音视频应用的安全趋势和Akamai纵深防御体系》
《微软云音视频应用架构》