使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
签到
致辞:包研——LiveVideoStack 创始人
联席主席致辞: 从微信看视频图像技术——谷沉沉
在过去的一年中,我们可以看到多媒体特别是音视频技术的能力在严峻的挑战下,为各行各业带来了巨大的变化。疫情过后,又会有哪些多媒体新技术、新实践呈现在大众的视野当中?为行业的发展与应用带来哪些新的趋势与机会?
视频大时代下基础架构的演进趋势
过去十年,随着端上算力和通讯能力的提升,我们见证了一个业务玩法日趋复杂、用户覆盖遍及全球的视频大时代的诞生。随着多个市值千亿以上的泛视频行业公司得到更多的关注,其背后支撑业务高速迭代、承载核心技术的视频基础架构也慢慢浮出水面。视频基础架构包含哪些核心能力,在过去和现在经历着什么样的演进,对于未来我们又该如何期许?在本次主题演讲中,我们将结合快手自身实践与行业观察,和大家一起探讨。
编解码再进化:Ali266与下一代视频技术
过去的一年见证了人类百年不遇的大事记,也见证了多种视频应用的厚积薄发。而因此所带来的视频数据量的爆发式增长更加加剧了对高效编解码这样的底层硬核技术的急迫需求。正是在这样的大环境下,在ITU-T VCEG和ISO/IEC MPEG两大标准组织再次联手推出的最新视频编解码标准VVC定稿不久之后,阿里巴巴的视频团队开始全力投入开展VVC软件编解码的开发工作。经过一年的努力,我们最近推出的Ali266不但在业界第一次实现了高清实时VVC编码能力,也同时充分印证了VVC强大的压缩效率。本次主题演讲将带给大家Ali266 的开发过程以及我们对Ali266在云端协同、5G网和云计算等环境下的落地展望。最后我们以“后VVC时代“视频业界所面临的技术和业务挑战为结尾,期许带给大家有意义的“思想盛宴”(food for thought)。
视频产业新挑战与新机遇
4G的诞生推动了视频行业的蓬勃发展,也催生了新的视频应用和业务形态,视频内容越来越多,视频能力正在成为一种基本能力。5G时代已经到来,视频行业将会出现什么样的挑战和机遇?在行业,技术,商业,产品等方面会出现什么趋势,对于从业者又有什么建议?本次分享将和您一起探讨。
午餐&休息
讲师问诊
地点:金辉5厅
换场
随着云计算的普及与高速发展,5G网络、VR技术的日益成熟,我们正向着全真互联网时代大步迈进。伴随着新时代的到来,“元宇宙”、“沉浸式”等概念横空出世,挑战与机遇同在,我们不得不思考,哪些行业、产品和商业模式将最早受到全真互联网的影响?腾讯云音视频基于在音视频领域21年的积累,构建了RT-ONE™“三合一”音视频通信基础网络,本次专场将为大家带来全新all in one终端引擎、跨平台能力、海外直播技术、云渲染技术、多媒体处理等技术的最新动向。
新一代音视频终端引擎框架设计和技术实现
经过五年的努力,腾讯云终端团队不断完善和积累出了一套完整的终端 SDK 方案体系,包含即时通信,主播推流,直播播放、点播播放、RTC实时互动、短视频录制,特效编辑等一系列音视频和实时通信相关的功能特性。在这些功能背后,团队是如何完成了框架设计、组件的打磨、数据的流转、性能的优化的呢?本次分享会从产品能力、架构设计、以及技术原理等多个角度进行剖析,期待您的关注。
音视频前端跨平台技术应用
随着跨平台技术的不断发展,从最早的跨平台技术Hybrid App,再到ReactNative、Weex等框架,上面两个阶段性能上都跟App端有或多或少的差距。为了解决性能瓶颈,google开源的Flutter出现了,它自带渲染引擎,可直接编译成原生代码,性能优异。除了支持移动端、它还支持了桌面端和web端,目前star数已经远远超过了ReactNative,带给我们更多的想象空间。Flutter是近两年大火的跨终端框架,实时音视频因为疫情的缘故也越来越融入到人们的日常工作生活中,如线上会议、在线教育等。两者结合起来可以碰撞起什么样的火花呢?利用Flutter实时音视频sdk,我们可以快速开发一个跨平台的会议、娱乐、教育等APP。本次分享主要讲述了利用Flutter如何进行实时音视频渲染,并深入底层,优化视频渲染的性能。
腾讯云海外音视频技术架构
腾讯云海外直播系统建设起始于2016年,致力于打造全球先进的高质量流媒体处理和分发平台。在近5年的建设时间里,系统从单一中心化的架构发展为全球共11个直播中心的分布式架构系统,直播中心之间通过专线互连,边缘加速点覆盖全球共61个国家或地区,真正意义上具备了就近接入就近分发的能力。海外直播平台不仅具备优质的物理资源,在软实力上得到了很大提升。在传输层上,除了传统的TCP协议,同时支持基于UDP的加速协议QUIC。在流媒体协议上,支持传统的RTMP、HTTP-FLV、HLS等协议,同时支持多码率自适应HLS和DASH,在此基础上,升级实现了低延时的CMAF协议。近年来,基于WebRTC协议,海外直播系统实现了秒级延时的WebRTC低延时直播能力,在播放Qos优化上迈出了更大的一步。
云渲染技术框架及互动新玩法
随着游戏及软件云端化运行能力的支持,大型游戏和软件可以在浏览器、轻客户端以及小程序中运行,在扩展了使用场景边界的同时,也为游戏和软件探索云原生实现提供了基础。腾讯云云渲染 PaaS 提供了基于 WebRTC 的万人级互动交互的云原生能力,包括操作权限转移管理、多人语音会话等,本次分享会介绍互动新玩法上的技术实现。
全真时代与智能时代的多媒体技术
视觉体验在全真时代显得越发重要,如何提高用户的视觉体验?更好的编码标准带来的低码率高画质、超分等视频处理手段带来的画质提升、三维视频带来深度感知、任意视点视频或者VR360视频带来的用户交互、扩展现实与虚拟现实带来的超现实感……另一方面,智能时代革新了音视频技术,通过音视频分析更好的理解数据与链接用户、通过辅助创作让音视频内容极大丰富……让我们一起发掘在全真时代与智能时代里多媒体技术的无限可能。
多媒体技术日新月异,可以预见的是网络承载内容向更高质量以及更多新的展现形态的改变。超高清、HDR,全景视频,AR/VR,带来的不仅是更清晰的视觉感官冲击,还有更多全新的沉浸、交互式体验。
美摄科技素材创作平台构建
基于跨平台的SDK能力和统一的素材格式,美摄建立了统一的素材创作平台,围绕美摄的素材生产工具(ARScene工具、特效制作工具、模板生产工具),解决产品中的素材生产和购买等难题。ARScene工具使用fbx模型,基于美摄SDK的3D storyboard渲染实现了实时ARScene效果的预览,特效制作工具使用QPainter和QGraphics,实现了时间线实时预览级别的特效制作体验。
智能视频生产中专业视频预设和视频模板数据导出规范的探索
随着5G的到来,视频内容成为了信息传播的主要媒介,普通用户和企业迫切需要的是能够低成本、批量的制作专业视频的技术能力。然而目前国内视频智能自动化生产技术中的视频预设(滤镜、贴纸、视频动画、视频转场、视频特效、文字动画、视频模板)大部分还是利用开源的BodyMovin工具导出预设,达不到专业作品的预设要求。本次分享将重点介绍VE视频引擎方案中自研的设计师预设导出工具VE Exporter以及对应视频解决方案相关的研发经验。
半监督、自监督算法在数字内容风控业务上的落地
深度学习领域中,半监督、自监督算法通过借助无标签数据与无监督训练任务,可有效改善传统有监督算法中“泛化性能不足”、“模型过拟合”、“严重依赖数据标注质量”等问题。本次演讲将总结半监督学习领域的发展脉络,并展示半监督、自监督算法在网易易盾数字内容风控业务上的创新应用,希望为听众在“降低数据标注成本”、“提升深度学习模型效果”方面带来一些启发。
内容大纲:
1. 半监督领域发展脉络介绍
a) P-label分支介绍
b) 一致性正则分支介绍
2. 自监督领域发展介绍
3. 半监督、自监督方法在易盾音视频业务
待定
待定
换场
音视频技术在近几年呈现突飞猛进的发展,一方面满足了企业对于业务高速增长的需求,另一方面也为业务的发展创造了更多的可能性。在本专题中,将展示字节跳动背后的音视频技术,以及如何利用这些技术支撑业务发展并满足合作伙伴的需求。本专场将从音视频编解码开始,回顾音视频编码技术并进行展望,介绍编码的优化与评估;随后,将介绍音视频在直播方面的应用和如何通过音视频支持业务的增长;最后,将以抖音为例,介绍RTC技术是如何追求极致的体验。
视频编码标准、优化和画质评估
演讲内容涉及视频编解码方向的两个话题:
首先,将介绍视频编码技术现状与展望。对于下一代编解码技术H.266/VVC标准,相比前一代H.265/HEVC标准,可以在主观质量不变的情况下节省约50%的码率。H.266/VVC标准之后是否还会有新的标准,如果有,可能涌现出哪些新技术?本次分享将为大家介绍H.266/VVC标准中的新技术,以及对下一代标准的探索。
之后,会分享视频自适应编码优化和画质评估。考虑到目前视频占据了超过80%的网络流量,在有限的码率下,设计高效的视频编码压缩方案,为用户提供最佳的视频画质体验,是整个业界都高度关注的问题。本次分享主要介绍字节跳动在视频的自适应编码优化和画质评估方面的工作,一方面探讨如何高效地优化不同内容视频的编码,在保证画质的前提下,尽可能节约视频码率,另一方面介绍了字节跳动的画质评价体系和工具,如何对视频画质进行有效准确的评估检测。
内容大纲:
– H.266/VVC标准
– 标准简介:与H.265/HEVC标准相比压缩性能大幅提升
– 字节跳动相关技术
– HMVP (History-based Motion Vector Prediction)
– CCLM (Cross-Component Linear Model)
– Affine AMVR (Adaptive Motion Vector Resolution)
– IBC (Intra Block Copy)
– HLS (High-Level Syntax)
– 基于深度学习的环内滤波器设计:在H.266/VVC标准基础上的探索
– 整体介绍字节基于感知优化的视频处理编码系统
– 具体介绍字节自适应编码优化技术
– 整体介绍字节视频画质评估体系
– 具体介绍字节自研的画质评估工具
抖音背后的RTC是如何追求极致的
自从RTC相关技术崛起后,实时音视频为直播、社交、在线教育等行业带来了巨大增长。随着RTC的应用越来越普及,业务对用户音视频体验的要求也越来越高,包括更流畅、更清晰、更快的首帧速度等。面对不断拔高的挑战,RTC需要在各个技术领域不断突破。在服务抖音、西瓜、头条等国民App的过程中,我们以提升用户体验为使命,不断追求更高的目标。本演讲将分享我们在追求极致用户体验这一路路上的沉淀和积累。
内容大纲:
1. 自研音频编码,对抗极端弱网
2. 动静态机型适配,实现个体最佳体验
3. 场景化最佳实践,极致体验的最后一公里
自从RTC相关技术崛起后,实时音视频为直播、社交、在线教育等行业带来了巨大增长。随着RTC的应用越来越普及,业务对用户音视频体验的要求也越来越高,包括更流畅、更清晰、更快的首帧速度等。面对不断拔高的挑战,RTC需要在各个技术领域不断突破。在服务抖音、西瓜、头条等国民App的过程中,我们以提升用户体验为使命,不断追求更高的目标。本演讲将分享我们在追求极致用户体验这一路路上的沉淀和积累。
从体验出发,构建以增长为目标的视频服务体系
增长一直是业务的诉求,和增长相关的因素很多,内容、人群、创意玩法、性能体验等等,本次分享聚焦在字节跳动视频通过性能体验优化促进业务增长的实践。包括在分析方法上的探讨,如何衡量和预估体验优化对业务增长的贡献,以及具体的体验优化实践分享。
内容大纲:
1. 介绍字节衡量视频技术对体验贡献的方法,视频中台如何更好的关注业务结果
3. 视频体验优化能力介绍
3. 如何分析和预估收益空间,为自己的业务选择合适的优化手段探讨
直播新玩法背后的音视频技术演进
直播越来越深刻地改变了整个互联网行业,直播的形态也在不断地丰富。在多场景的KTV歌房、直播答题、互动游戏、连麦、电商、拍卖、企业直播等的快速演进中,我们积累了大量架构和质量优化相关的经验,这次分享主要介绍我们的相关积累和可以快速迁移的高质量的音视频能力。
内容大纲:
1. 直播的新场景新玩法
2. 音视频引擎如何灵活、快速、保证质量地支持直播业务的多场景下的演进
3. 直播服务可以快速迁移到新业务的音视频能力
随着以VVC、EVC、AVS3和AV1为代表的新一代视频编解码标准制定完成,面向多样化业务的既有编解码标准的软、硬件实现优化逐渐成为工业热点。另一方面,使用AI技术来提升传统视频编码压缩效率正沿面向人眼观看与面向机器任务的两条技术路径蓬勃发展,国内外标准组织已制定相关工作计划。本专题将介绍这些新变化并进行深入探讨。
拍乐云基于AV1的实时视频系统技术实践
实时视频系统对于时延的要求极高,所以视频编码器必须满足实时性的要求。AV1相比H.264在 Rate-distortation 性能的提升上是以复杂度的上升为代价的,当前应用设备的碎片化非常严重、设备的运算能力差异巨大,这些都是新技术落地实时音视频系统将面临的挑战。拍乐云最近发布了PanoVenus视频引擎,采用AV1编码标准,为用户提供编码性能和编码速度更好的实时低码高清体验。相比2003年推出的主流编码标准H.264,Venus可实现带宽40%-70%的节约,支持在主流PC和移动终端上实时运行。本次分享将介绍拍乐云在设计PanoVenus实时AV1通信系统时的一些技术实践和未来工作。
欢聚集团AV1技术实战
随着业务的发展和用户数的增加,带宽成本问题也越来越突出。通过对最新编解码标准AV1的落地研发,欢聚集团成功的将其在小视频业务中上线应用。本次分享主要分为三个部分,第一部分针对业务和技术背景介绍技术方案的选型及其准备工作;第二部分介绍AV1编码器优化的一些思路,主要集中在模式决策,运动估计和滤波三个模块;第三部分和大家分享最终上线收益以及在研发过程中所踩过的一些坑。
迈向更智能的视频压缩:信号,感知和语义
随着计算能力,数据形态和应用场景等多方面演进,视频相关领域正在发生深刻变革。信号层面的压缩效率提升难以适配通用化、智能化的视频压缩需求,报告从智能视频编码入手,将与视频技术专家和研究人员一起讨论深度学习时代视频编码技术研究的发展情况,介绍标准化进程以及面临的技术挑战,同时还将报告在感知编码和语义编码领域的部分研究进展。此外还将分享对智能视频压缩领域重点研究方向以及未来发展趋势的展望。
内容大纲:
1. 介绍智能编码的历史和发展历程,重点介绍深度学习编码工具研究的技术细节和技术路径,包括混合框架编码的深度网络模型以及端到端编码结构,
2. 介绍深度学习编码标准化情况,以IEEE DCSC(AVS3),MPEG,JPEG以及MPAI标准研究小组为例进行重点分析。
3. 智能编码正在突破基于信号层面的压缩,因而报告还将介绍面向感知编码和语义编码最近进展,讨论神经网络编码的率失真特性以及对机器视觉有更好支持的压缩方法。
4. 未来技术展望
换场
音视频技术服务、产品出海趋势依旧强劲,如东南亚、南美等市场,面对纷繁且复杂的基础设施与网络环境,有针对性的,合理的架构选择与优化策略尤为重要。
ZEGO即构如何构建全球实时音视频通信云
全球不同国家和地区的网络基建水平参差不齐,如何利用有限的网络资源提供更高质量的音视频通话体验是音视频服务商必须面对的挑战。本次议题将从面临的全球实时音视频通信挑战出发,解读自研海量有序数据网络(MSDN)的优势、以及如何进行音视频传输优化等。
影视媒体和直播娱乐的海外公有云出海战略
探探直播在海外市场的落地调优实践
随着国内直播行业的高速发展,越来越多的厂商向海外市场扩张。而面对海外复杂的基础设施与网络环境,国内模式的直接套用难免水土不服,如何快速适应落地并保证良好的用户体验成为了重点挑战。本议题将主要从服务体验量化、分发架构、推荐算法策略等多方面介绍调优过程,以及各项调优方案上线后的收益成果进行分享。
Opera视频出海非洲面临的技术挑战及应对
本议题主要面向视频出海听众,尤其是非洲出海视频类产品。议题主要分享Opera出海非洲所遇到的挑战及应对策略,主要包括非洲网络状况下视频播放问题及优化、用户网络流量问题及应对、不同国家视频播放策略等问题和其他(非洲安全问题、网络基建等)问题;通过本次分享听众能够对非洲互联网状况有进一步的了解,对后续出海非洲有一定的借鉴参考。
从K歌、游戏、电影到音乐教学,更好的声音表现力将给用户体验带来质的提升。本专题将讨论最新的音频方案,涉及全景声、语音合成、语音识别、回声消除等。
微信亿级通话的音频技术优化之路
微信通话系统的语音质量提升历程分享。从信源和信道质量保障上,介绍打造高品质语音通话的关键路径,为亿级用户提供优质通话服务。讲解端到端各节点可能遇到的问题,以及相应解决方案。
荔枝语音直播中的高音质技术实践
荔枝在语音直播中,用到了多种音频处理技术,譬如结合场景检测的智能降噪技术,能大大提升音乐等场景音质;自研的回声抑制技术,双讲性能得到很大提升。智能语音加减速技术,让延时较低的情况下保持声音自然清晰;在线机型匹配等技术,让机型适配更高效。
K歌中的歌唱评价与嗓音分析
音乐专家在评价歌唱行为时,可通过生理机能与演唱完成度两个层面对演唱者进行分析。传统的歌唱评价算法只对音准进行打分,维度较为片面。作为国内首创的综合评分功能,音街的综合评分系统可对用户的音准、节奏、气息、颤音、滑音、情感等维度进行综合评价,这些多维度评分在增加演唱趣味性的同时,也可为作品分发提供可用的标签。同时,对用户嗓音、演唱行为进行综合分析,可建立歌手能力图谱,依据用户嗓音条件,为他推荐适合演唱的歌曲。本次分享将围绕歌唱与嗓音分析,介绍相关的体系与算法实现。
音频场景分类及下游应用
音频场景分类(Audio Sence Classification)是机器学习领域的重要研究方向,其应用场景非常广泛,近年来得到了越来越多的学者的关注。本次报告将分享我们在该领域做的一些工作。此外,我们将音频场景分类技术应用于声源分离(Audio Source Separation)和声音活动检测(Voice Activity Detection)等领域上,取代了传统方法。实验表明新方法在和传统方法的对比中具有显著优势。本次报告中也将展示若干Demo和已上线的应用。
Q&A
结束
VIP社交晚宴
签到
多媒体技术日新月异,可以预见的是网络承载内容向更高质量以及更多新的展现形态的改变。超高清、HDR,全景视频,AR/VR,带来的不仅是更清晰的视觉感官冲击,还有更多全新的沉浸、交互式体验。
低延时技术在节目生产中的应用
短视频内容理解与生成技术在美团的创新实践
美团围绕丰富的本地生活服务场景,积累了海量视频数据。如何通过计算机视觉技术用相关数据,为用户和商家提供更好的服务,是一项重要的研发课题。本次分享将主要介绍,短视频内容理解与生成技术,在美团业务场景的落地实践。
云音乐在视频内容创作上的探索
随着短视频行业的火爆,视频内容传播和影响越来越大。视频内容创作重要性就毋庸置疑了,本演讲将重点介绍网易云音乐在视频内容创作上的探索及实践。
我们所理解的音画质量,不仅包括最基础的服务质量,还包括用户的观感体验。本专场将围绕实时音视频场景下,七牛云如何从多个维度实现保障和提升音画质量,分享针对保障和提升音视频质量从编解码到网络传输,从服务端到客户端等多领域的相关实践经验。此外,本次专场还会发布七牛云音视频质量分析系统,实现更客观、更专业的音画质量评测和优化。
H265在七牛QRTC场景的落地运用
近年来,伴随着采集渲染设备终端发展,人们对视频质量的需求也在日益“膨胀”,更高的分辨率:4k/8k,更宽泛的亮度,色度动态范围HDR/Dolby视界,更沉浸式感受:VR /AR 360全景体验等;这也给网络带宽/设备计算能力等带来了新的挑战,怎么在有限的容量下传输最有价值的视频信息始终是我们需要解决的核心问题;面向未来,七牛云作为领先的云服务厂商,全线产品支持更好的视频编解码成为必然选择;本次演讲会重点分享七牛云将H265落地运用到QRTC场景的一些创新经验和教训。
内容大纲:
1. 为什么在RTC场支持H265?
2. H265在RTC场景落地有哪些挑战?
3. QRTC视频编解码方面接下来的的演进规划
七牛云音视频质量分析系统发布
内容大纲:
1. 七牛云音视频质量分析系统决了什么样的问题?
2. 系统的核心亮点和七牛云产品的关系?
3. 如何获取内测资格?
QRTC 客户端音视频质量优化实践
内容大纲:
1. 当前现状和痛点:对于 RTC 服务而言,音视频的质量仍是用户体验的最重要的因素
2. 列举音视频质量相关的优化实践(可能会说数据驱动相关,丢包,延迟,抖动等弱网相关,移动端性能和兼容性相关的一些经验)
3. 总结或者展望
七牛云实时音视频网络质量优化
云时代,视频直播、实时音视频通信等在线音视频服务面临各种复杂的网络环境和流量爆发式的增长,对音视频网络质量提出新的严峻挑战。本次分享将详细介绍如何在内网传输以及最后一公里的网络下优化网络协议,保证网络抖动不影响数据完整性、以及能及时切换线路,最终保证质量。
内容大纲:
1. 数据同步协议的实现
2. 边缘动态路由协议的实现
3. 最后一公里 rs fec 优化
Q&A换场
随着多媒体业务的发展以及在各个行业场景下的进一步应用,业务与场景的差异性如对低延迟、体验质量等不同的要求,为了实现成本上的节省,存储、计算等资源正逐渐走向边缘,边缘计算、云原生的架构模式将会带来一大波技术、产品和商业的更新。
如何用好共享经济模式下的边缘计算资源
本演讲将详细介绍边缘计算的节点资源发展关键 — 共享经济模式,以及基于这种模式下的服务有什么特点,有什么场景适合,以及一些实践的案例。
云、网、边融合释放云平台设施潜力-金山云边缘云实践
据 IDC 2021 预测,中国云计算市场将实现云网边的融合,到 2024 年,有 25% 的组织将通过边缘数据与云平台上的应用集成来提高业务灵活性。本次分享将为大家介绍金山云如何通过云计算、网络、边缘计算相互配合将边缘节点之间互联做到极致,实现让“云”无处不在。
探讨视频云与边缘云平台的竞争力 — 基于Serverless的端边云一体化媒体网络
视频云与边缘云如何实现开源?视频在边缘的创新方向在哪?下一代视频云平台什么样?本次分享将从以Serverless为承载平台,以开放、专业的媒体处理能力为价值核心的方向,与大家一起探讨视频云与边缘云平台的下一代竞争力。
冲刺最后一公里 — 音视频场景下的边缘计算实践
近年来,边缘计算逐渐从未来风口变成了进行时,而内容分发这个天生与“下沉”密不可分的领域,在边缘计算实践中可谓一马当先。网心从14年开始探索边缘传输网络的商业可行性,实作了传统CDN到边缘CDN的技术演进,也见证了边缘CDN从超前概念到行业标配的发展历程。当数据下沉到最后一公里时,在如此复杂的节点和网络环境下构建百万量级的边缘节点网络,同时服务好需求不断深化的音视频业务,是一个不小的挑战。在这里与大家分享一些个中的实践历程和关键问题,以供参考。
视频边缘智能服务
边缘计算是云计算的演进发展。视频处理,特别是视频智能处理又是边缘计算的主要应用场景。本次演讲将介绍视频边缘智能的业务需求和发展趋势,提出制约视频边缘智能落地应用的主要问题。同时分享在视频边缘智能服务方面的解决方案和一些探索,为视频边缘应用开发者提供参考。
微博视频处理系统的云原生之路
随着容器技术的快速发展和广泛应用,云原生技术逐渐成为未来的发展趋势。微博视频处理平台针对面临的大规模、多业务、资源复杂、业务快速迭代等挑战进行架构升级,开启了云原生以及serverless的探索。从最初的调度器、执行器架构发展到最新的FAAS平台,为开发人员提供了开箱即用、可伸缩、基于事件驱动的函数编排服务。不仅提高了研发交付速度,而且基于标准化的资源分配和可复用的机器扩缩容策略,降低成本,达到更高的ROI。本次演讲将介绍微博视频处理系统的架构演进与云原生之路上的探索,我们为什么选择自建,以及如何实现基于原有基础服务的FAAS平台。为尝试云原生架构模式的开发者提供参考。
虎牙直播的云原生网络发展实践
随着业务的快速发展,业务架构的复杂度和基础设施规模也在指数级提升,同时直播类的在线业务以及数据分析类的离线任务对于稳定性、性能、吞吐都有不同的要求,这些都推动着虎牙在云原生方向的转型,特别是计算下沉边缘后,基础设施环境复杂、标准不统一等等,更是对虎牙的融合云提出更多的挑战。本次分享将分为三个部分,第一部分介绍虎牙融合云的云原生网络解决方案,以及从网络上怎么处理有状态业务和无状态业务,第二部分介绍在线业务和离线业务对网络的挑战,如何平衡离在线业务对网络资源的需求矛盾,第三部分介绍虎牙边缘基础网络的建设与管理,怎么解决边边、边中通信。通过以上三个部分将为大家系统的介绍虎牙在云原生架构下对于中心、边缘机房的基础网络设施建设经验。
主要内容:
1. 两年实现90%业务容器化-虎牙容器网络建设之路
2. 离在线混部-音视频与数据分析业务对网络的挑战
3. “无限网络”初探-复杂边缘环境下基础网络的建设
Q&A 换场
疫情的风暴席卷全球,改变着人们的生产和生活方式。许多公司在艰难中寻求发展,也有许多公司在蓬勃中站上浪尖。视频的大时代在加速到来,多媒体新技术、新产品、新应用不断迸发。浪淘风簸,如何在激烈的挑战中寻找机会?吹尽狂沙,如何将技术转换为商业价值?技术商业策略圆桌与您一同探讨。
圆桌论坛:海外音视频生态发展,机遇与挑战
除了短视频、直播流媒体服务等,在过去的一段时间内,越来越多的音视频相关服务及应用逐步走向海外,面对海外与国内差异化的生产及市场环境,如何做出正确的判断与选择,在业务需求、成本及用户体验平衡的挑战当中发闸门最恰当的业务产品、技术路线,寻求更长远的可持续发展。
圆桌论坛:开源技术与商业的融合之路
开源技术迎来了新的高潮,尤其是在多媒体领域,大量围绕“开源”的代码、软件及系统开发,推动整个行业及市场带来更加快速的创新发展与技术变革。本场圆桌邀请开源技术、项目领域资深专家,共同探讨开源技术的发展变化以及如何将开源与商业融合,取得更长足的发展。
圆桌论坛:视频会议的下半场
疫情导致我们日常办公使用远程会议的需求刚性骤升,而随着视频会议系统的不断普及,很多企业都会关心未来视频会议的技术发展趋势,在技术急速迭代的当下,视频会议是否能够在真正意义上脱离会议室的束缚,在用户体验、互联互通、开放协作和安全性等方面也面临着决定性的挑战。外部市场的竞争与饱和以及内部技术的生产力等等,都成为了视频会议将进一步赋能与渗透更多行业的过程中需要考虑的问题。
海量高质量视频内容理解,云+边缘+端大量数据计算的需求,对硬件处理提出了更高的要求,在考虑到成本、实时处理、性能等多方面要求的条件下,硬件芯片的设计和开发成为关注的热点。
基于GPU, FPGA,ASIC等平台对快手的多媒体业务的异构方案探索
内容大纲:
1. 快手异构部门介绍
2. 快手直播以及海量短视频处理的需求
3. 异构计算方案的探索
3.1. ASIC转码方案的评估及收益
3.2. GPU 在超分,去噪等算法加速取得的成果
AI辅助编解码的ASIC解决方案
本次演讲将详细列举目前常用的AI辅助编解码的方法,论述如何在硬件和软件层面将AI结合编解码的实践,探索新的标准和新一代编码器结合AI应该如何设计。受众群体为想要了解目前商业化的AI辅助编解码方案,已经有过实践但是想要了解在ASIC中实现AI+编解码优势。
内容大纲:
1. 目前商业化的AI结合编解码的方法介绍
2. 基于FFMPEG的AI+编解码的软件实现
3. ASIC内部AI结合编解码的硬件实现
4. 高密度低延迟的ASIC方案的优势
AI在视频处理领域的应用
内容大纲:
1. AI在视频处理领域的应用场景
2. AI视频处理对硬件性能的挑战——CPU和GPU的局限性
3. DSA架构加速AI视频处理的价值——高性能、超低延时、通用性
4. 瀚博半导体的芯片解决方案助力AI视频处理
Q&A 换场
实时视频通信、云游戏、VR/AR等强互动类媒体服务成为继流媒体之后媒体服务的新热点,这些场景要求极低的端到端延迟,极高的体验质量,对于网络传输中架构设计、传输协议选择、算法优化等多方面维度提出了更多的挑战。
网易云信自研大规模传输网核心系统架构剖析
随着边缘计算及RTC技术的兴起,业务服务器的边缘化可以带来大量收益:一方面就近接入可以优化客户端上下行质量,另一方面边缘节点可以大幅降低带宽成本。但如何保证相隔千山万水的边缘服务器之间的网络传输质量成了一个难题,本次分享将通过分析网易云信自研大规模分布式传输网(WE-CAN)核心系统的架构来探讨这些问题。
透过HESP实现媲美广播的超低延迟播放体验
午餐&休息
讲师问诊
地点:金辉5厅
近年来随着媒体内容处理、传输能力的提升以及内容呈现形式、形态等的不断变化,用户对于多媒体服务、内容质量的期待也越来越高,面对不同业务场景下的需求特性,通过丰富的数据监控与收集,进行更加针对有效的优化,才能提供更贴近用户需求的完美体验。
解密华为云媒体质量管理最新实践成果 — “视镜”
对全球不可靠的互联网络和大容量分布式系统的挑战,如何以用户为中心,从可用变得更好用,追求更流畅、更清晰、更快、更省的极致用户音视频体验?本次演讲将分享华为云媒体服务在追求极致用户体验质量道路上的沉淀成果 —— “视镜”。
图像质量评价模型的构建方法和应用
随着多媒体处理技术的快速发展,视频图像质量评价研究越来越受到大家的关注,它能广泛运用于多媒体处理技术/系统性能评价和优化中。本报告将首先介绍图像质量评价概念、分类及基本理论方法,然后回顾过去十年来的相关进展,进一步,通过介绍我们小组在该领域的一些相关工作,尤其是移动成像质量评价和VR质量体验方面的工作,来说明图像质量评价模型的构建方法和应用。
大众点评APP视频播放体验优化实践
作为大众点评APP内容生态的重要一环,视频播放体验非常关键。本次演讲会结合全链路监控、视频预热、码率自适应等实际优化措施来介绍我们是如何保障服务质量和提升用户体验的,并尝试探讨QoS与QoE的关系。期望对致力于提升客户端用户视频播放体验的读者提供帮助。
京东直播技术的演进之路
近年来直播飞速发展,尤其直播带货更是引领行业,除头部薇娅,李佳琪等越来越多的明显,大V 加入了直播带货行列,也使得电商中的直播成为一个常态,而直播过程中能否极大的提升GMV ,除了靠运营推广等明星效应,背后强大的直播技术支撑也是非常重要因素之一。本次分享将详细介绍京东由最初的开源推流工具加第三方CDN 的直播模式如何一步步实现所有模块自研,承载每年京东巨大体量的618,双11 直播大促活动,为京东零售带来可观的GMV 提升。同时在直播技术上不停的进行更新迭代,使京东直播技术逐步开始引领行业。
内容大纲:
1. 京东早期直播介绍
2. 自研直播核心能力
3. 直播连麦背后实现
4. 新技术的持续迭代
5. 未来直播技术探索
Q&A 换场
在过去的一年内,随着应用越来越广泛,短视频、直播、在线教育、游戏娱乐,音视频在不同场景的落地以及业务产品形态的变化,对新技术的要求也越来越高。除了要考虑如何满足用户更多样化的内容及交互体验需求,满足各种设备性能要求。同时还需兼顾实时、高并发,可用性与稳定性等系统服务需求,支持业务快速迭代。本专题将探讨从客户端到服务端,流媒体系统架构设计、开发优化等相关技术探索及应用实践。
大众点评客户端视频播放器研发探索与实践
视频播放器作为视频消费端重要的承载窗口,其在交互上及性能上的表现直接决定了用户在平台上视频观看体验的好坏,本议题主要分享我们在客户端播放器建设方面的一些探索及经验,对期望从技术优化手段提升用户视频体验的读者有一定的参考。
微博客户端HDR视频播放的落地实践
HDR格式视频具有更高规格的色彩表达能力,可以更准确的记录真实场景的内容。支持HDR视频拍摄能力几乎是这两年新发布手机的必备功能,HDR视频越来越流行。但是普通消费级的显示设备颜色展示能力千差万别,很难达到HDR视频标准的规格。如何充分利用显示设备的能力,结合手机微博产品的特点,正确的展示HDR的内容是我们尝试解决的问题。
面向在线教育业务的流媒体分发演进
随着在线教育业务形态的不断探索:从实时一对一,到小班课、大班课、分组大班课、互动小班课等形式,流媒体服务在与业务的相互影响中不断演进。本演讲将分享网易有道流媒体分发技术伴随业务的共同演进的过程,以及对一些关键问题的思考和实战经验:
1. 使用怎样的策略支撑业务的变化;
2. 大班与小班课对系统带来的不同挑战与应对策略;
3. 对自研系统与第三方流媒体服务关系的思考;
内容大纲:
1. 流媒体分发系统伴随业务的演进过程;
2. 演进过程中遇到的挑战、策略与经验;
3. 在业务技术团队视角对自研和第三方流媒体服务的思考;
实时音视频在教育场景的应用实践
本演讲架构详细介绍好未来实时音视频(TalRTC)的进阶演进过程,以及其在教育场景下的实战应用和特殊优化,如何使用技术手段最大限度保障老师和学生上课的音视频质量。
内容大纲:
1. 好未来直播中台全景介绍
2. TalRTC整体架构介绍
3. TalRTC高可用及弱网对抗策略介绍
4. 针对教育场景的特殊优化
Q&A 换场
视频云驱动着下一代技术浪潮的到来,在视频形态泛在化的今天,诸多云上新场景被创造。阿里云着眼于数字经济基础设施的建设,极力推动各行业的视频化,促进行业的第二增长曲线。本专场演讲,阿里云视频云依托阿里云服务数百万开发者的卓越服务能力与实践,从云计算服务、网络调度到端侧呈现等视频生产与消费的全流程角度出发,分享下一代技术趋势和判断,并从实践角度分享算法、架构、AI等多个具有实践指导意义的话题。
“三位一体” — 云原生视角下的视频生产全流程技术实践
视频生产有着天然的云服务属性,是5G+云原生时代最大的确定性和领域,云原生实践也在极大地改造着视频生产的全流程。通过多年实践,阿里云视频云形成了云边端一体、软硬一体、网络与协议一体的视频生产流程,形成了丰富的技术落地经验,拥有了极具竞争力的场景实践。本演讲将以理论与实践、技术场景深度结合的角度,全面介绍阿里云在视频生产中的创新之路。
拥抱智能,AI视频编码技术的新探索
随着视频与交互在日常生活中的作用日益突显,愈发多样的视频场景与不断提高的视觉追求对视频编码提出更高的挑战。相较于人们手工设计的多种视频编码技术,AI编码可以从大数据中自我学习到更广泛的信号内在编码规律。工业界与学术界发力推动AI视频编码标准并进行新框架的探索。阿里云视频云在JVET面向人眼的视频编码标准和MPEG面向机器视觉的视频编码标准上均做出重要贡献,对标准发展产生强有力的推动。结合产业需求强劲的视频会议、视频直播等场景,阿里云视频云还开发了AI生成式压缩系统,在同等质量下比VVC节省2-3倍码率,实现真正的超低码率视频通信。
基于微内核的阿里云下一代音视频引擎技术
基于微内核的一体化音视频引擎旨在通过一个SDK的接入,即可完美支持RTC、直播、会议、播放器、短视频制作等多项功能,按需出包以适配多种场景,在提升技术复用度的同时,将功耗、功能和体验提升了一个数量级,这套SDK目前已成为阿里云智能视频云的音视频底座,未来会全面支持客户的各类业务,本演讲中我们将围绕着业务背景、技术顶层设计、技术研发和业务接入等多方面展开,详细介绍一体化SDK的来龙去脉。
效能与未来:算法创新驱动的云端一体新视界
视频消费的新场景对视频技术的发展提出了新的需求,从当下的直播、短视频、RTC出发,到未来的XR,音视频技术对新场景的支撑越来越趋向于综合性,需要算法深度结合云边端软硬一体的能力进行创新和演进。本演讲将从阿里云视频云的最新场景探索出发,介绍阿里云视频云在智能视效、虚拟互动、极致高清等场景的最新创新实践。
Q&A 换场
在广阔的多媒体技术生态中,有大量的开源技术工具、框架和库,如何甄选并有效组合使用这些开源技术就成为能否快速致胜的关键。
高性能且灵活的 iOS 视频剪辑与特效开源框架 - VideoLab
随着移动互联网时代的到来,短视频成为了最流行的内容载体,而内容的产生离不开视频剪辑与特效创作工具。笔者借鉴 AE 视频剪辑的思路,开发了高性能且灵活的 iOS 视频剪辑与特效开源框架 – VideoLab。本次分享将重点介绍 AVFoundation 视频剪辑框架,以及 VideoLab 框架的设计与实现。
鸿蒙媒体框架及音频跨设备播控技术
SRS服务器RTC级联与QUIC传输协议
本次分享将详细介绍SRS WebRTC级联的选型过程, 横向对比几个传输协议,并重点介绍QUIC协议传输的一些机制。适合对开源技术方案实现和流媒体传输协议感兴趣的开发人员,从中了解到开源技术方案选型的过程和侧重点,以及常见的WebRTC服务器级联传输实现方案。
使用现代前/后端技术(flutter+go)降低WebRTC开发门槛
用最炫酷的flutter前端技术,与最流行的后golang 结合,探索是否可以通过现代技术来解决WebRTC开发的痛点。
Q&A
当音视频技术从传统互联网应用场景如短视频、直播等转向工业、智能制造,又将给人们带来怎样的惊喜?本专题将探讨音视频技术落地智能制造、汽车行业的技术发展路径及实践应用:从软件-硬件-解决方案-场景落地;从初级智能汽车辅助驾驶到真正完全实现智能化无人自动驾驶。
城市末端道路场景下的无人驾驶技术与挑战
本演讲将详细介绍无人驾驶的主要技术模块,及其在末端道路场景下的应用和挑战。
智能驾驶3D目标检测所遇到的问题
当前智能驾驶受到广泛关注,其中行人和车辆的3D目标检测仍有待进一步提升。本报告将介绍一种新的GIoU和L2损失结合3D目标检测方法,同时引入神经网络架构搜索方法,提升3D目标检测精度和检测速度。受众人群:3D目标检测,计算机视觉,智能驾驶感知;受益:系统了解3D目标检测以及神经网络架构搜索的相关知识。
软硬结合,加速高级别自动驾驶落地
内容大纲:
1. 自动驾驶感知困境(分析行业普遍的痛点、瓶颈,快速切入)
2. 当前技术路线比较(比较特斯拉纯视觉和国内技术厂商的差异性,不比优劣)
3. 基于征程 5 的FSD研发与感知效果展示(地平线对感知的认识、解决思路、研发进度、效果)
4. 如何实现自动驾驶更高效落地(地平线的规划、量产实践)
结束
签到
致辞:包研——LiveVideoStack 创始人
联席主席致辞: 从微信看视频图像技术——谷沉沉
视频大时代下基础架构的演进趋势
编解码再进化:Ali266与下一代视频技术
视频产业新挑战与新机遇
午餐&休息
讲师问诊
换场
新一代音视频终端引擎框架设计和技术实现
音视频前端跨平台技术应用
腾讯云海外音视频技术架构
云渲染技术框架及互动新玩法
全真时代与智能时代的多媒体技术
美摄科技素材创作平台构建
智能视频生产中专业视频预设和视频模板数据导出规范的探索
半监督、自监督算法在数字内容风控业务上的落地
待定
换场
视频编码标准、优化和画质评估
抖音背后的RTC是如何追求极致的
从体验出发,构建以增长为目标的视频服务体系
直播新玩法背后的音视频技术演进
拍乐云基于AV1的实时视频系统技术实践
欢聚集团AV1技术实战
迈向更智能的视频压缩:信号,感知和语义
换场
ZEGO即构如何构建全球实时音视频通信云
影视媒体和直播娱乐的海外公有云出海战略
探探直播在海外市场的落地调优实践
Opera视频出海非洲面临的技术挑战及应对
微信亿级通话的音频技术优化之路
荔枝语音直播中的高音质技术实践
K歌中的歌唱评价与嗓音分析
音频场景分类及下游应用
Q&A
结束
VIP社交晚宴
签到
低延时技术在节目生产中的应用
短视频内容理解与生成技术在美团的创新实践
云音乐在视频内容创作上的探索
H265在七牛QRTC场景的落地运用
七牛云音视频质量分析系统发布
QRTC 客户端音视频质量优化实践
七牛云实时音视频网络质量优化
Q&A换场
如何用好共享经济模式下的边缘计算资源
云、网、边融合释放云平台设施潜力-金山云边缘云实践
探讨视频云与边缘云平台的竞争力 — 基于Serverless的端边云一体化媒体网络
冲刺最后一公里 — 音视频场景下的边缘计算实践
视频边缘智能服务
微博视频处理系统的云原生之路
虎牙直播的云原生网络发展实践
Q&A 换场
圆桌论坛:海外音视频生态发展,机遇与挑战
圆桌论坛:开源技术与商业的融合之路
圆桌论坛:视频会议的下半场
基于GPU, FPGA,ASIC等平台对快手的多媒体业务的异构方案探索
AI辅助编解码的ASIC解决方案
AI在视频处理领域的应用
Q&A 换场
网易云信自研大规模传输网核心系统架构剖析
透过HESP实现媲美广播的超低延迟播放体验
午餐&休息
讲师问诊
解密华为云媒体质量管理最新实践成果 — “视镜”
图像质量评价模型的构建方法和应用
大众点评APP视频播放体验优化实践
京东直播技术的演进之路
Q&A 换场
大众点评客户端视频播放器研发探索与实践
微博客户端HDR视频播放的落地实践
面向在线教育业务的流媒体分发演进
实时音视频在教育场景的应用实践
Q&A 换场
“三位一体” — 云原生视角下的视频生产全流程技术实践
拥抱智能,AI视频编码技术的新探索
基于微内核的阿里云下一代音视频引擎技术
效能与未来:算法创新驱动的云端一体新视界
Q&A 换场
高性能且灵活的 iOS 视频剪辑与特效开源框架 - VideoLab
鸿蒙媒体框架及音频跨设备播控技术
SRS服务器RTC级联与QUIC传输协议
使用现代前/后端技术(flutter+go)降低WebRTC开发门槛
Q&A
城市末端道路场景下的无人驾驶技术与挑战
智能驾驶3D目标检测所遇到的问题
软硬结合,加速高级别自动驾驶落地
结束