数字人与元宇宙
数字人与元宇宙概念异常火爆,其价值核心在于虚拟现实化和现实虚拟化,对视觉技术的发展提出了更高的要求与期待,加速了视觉应用技术从理解世界到创造世界的转变。在创作数字世界的过程中,如何做到精度高、时效快、交互强、成本低,是落地应用的关键。本专题从成像技术、增强现实、虚拟场景、虚拟人物多维度,研讨前沿发展及其落地应用。
多模态AI的研究和应用趋势
近年来,单模态AI正朝着多模态AI的方向在快速演进,结合文本、图像、视频、语音等多种模态共同理解和生成的多模态技术成为新的研究热点,模拟了人类在理解真实世界和人与人交互过程中时视觉、听觉、触觉、味觉等感官同时接收和处理信息的特点。在多模态融合的技术趋势下也使得更多应用场景成为可能。
本专场将呈现图-文、视频-文、语音-文三种典型的多模态融合方式,分享多模态预训练、多模态理解和多模态生成方向的最新技术进展,并分析在互联网真实的、规模化的应用场景中可以解决什么样的问题。让参会者对多模态AI的前沿进展有完整的了解。