云原生架构与生态技术
云计算架构向着虚拟化、容器化、边缘化、分布式、智能化方向发展,将会带来更强有力的支持。云计算的成熟,让企业 IT 设施逐步向云端迁移,充分挖掘云上产品(包括块存储、文件存储、对象存储、Kubernetes 以及函数计算等)的优势,构建低成本、高可靠且富有弹性的上层业务系统,服务网格、无服务架构、存算分离以及事件驱动等,日益催生云原生架构应用的广泛落地。
云原生生态发展也从技术理念、核心架构、最佳实践等方面,帮助企业 IT 平滑、快速、渐进式地落地上云之路。与此同时,CICD、GitOps 以及 AIOps 等现代化的研发流程也逐渐在行业中占据主导地位。在云原生化的进程中,业界还沉淀出一系列与平台无关的行业标准,比如 OpenTelemetry 和 CloudEvents。更多重构研发组织文化和架构,让应用、中间件、AI和大数据等通过统一的基础设施进行治理,为企业降本增效,真正落地云价值。
AI基础设施架构与技术
从AI/ML诞生之初,就对算力保持着强烈的需求;特别是2023年初大模型问世以后,对算力提出了更高的要求。AI基础设施通过对硬件及软件的管理 及优化,为AI应用提供了灵活、高效的算力资源。通往 AGI 的道路上,Infra 未来将定义一切。LLM 从学术研究 演变成了 数据工程科学。 在巨量的数据、模型参数、GPU 卡下, 任何模型结构和算法调优不再显得重要, 各家大模型公司实际上比的是谁的数据收集的多、质量清洗的好、配比调的优。更低的成本训练更大的模型也是AI发展的主旋律。
随着AI/ML的发展,AI基础设施也在硬件,平台,框架等方面也发生了巨大的变化;从CPU到GPU 再到xPU,从单机训练到Slurm再到Kubernetes,而在框架方面则是百花齐放,向量数据库,大模型框架 (LangChain)等。