使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
签到
《大模型实践:LLMOps和LLM Agent的关键方法与展望》
随着大语言模型的快速发展,大模型训练及其应用落地面临诸多挑战。本次演讲将重点分享大模型落地实践的方法与经验,聚焦LLMOs和Agent。
首先,将以简洁的方式介绍LLMOps和LLM Agent。接下来会深入探讨大型模型应用在实际场景中所面临的挑战和问题,以及LLMOps和Agent如何应对大型模型在训练和应用过程中所面临的各种困难。最后,展望LLMOps和LLM Agent的未来发展趋势,以及如何推动大型模型的实际应用。
本次演讲的主要目标是通过全面概述大型模型的训练、应用和实际落地过程,帮助观众更好地理解大型模型领域所面临的挑战,以及如何通过系统化的LLMOps和LLM Agent来促进大型模型的有效应用。
《网易有道子曰大模型落地实践》
大模型具有更多的参数需要更大的存储和算力,其推理引擎开发有比较大的难度,落地面临低延高、成本高的挑战。本文将会分享大模型面临的挑战,我们如何使用FasterTransformer实现高性能、低成本的大模型推理引擎,以及介绍有道子曰大模型在教育领域中的6大落地应用。
茶歇&交流
《拓展大语言模型边界:利用向量检索构建知识库》
随着大语言模型的火热流行,其多方面的局限性也逐步暴露出来(如更新不及时,对于专业领域知识不深等),本次演讲介绍了用知识库改进大语言模型的方案,并对比其他技术路径比较方案优劣。同时还会具体演示利用开源方案和向量数据库搭建实际案例。
《大规模图学习中的图对比学习方法与应用》
近年来,大模型在NLP及CV方向取得了革命性的成果,然而其在社交网络、分子结构,交通网络这些图结构数据上却未能取得显著突破。我们深入刨析了当前图对比学习范式,发现图对比学习所追求的正样本对齐严重削弱了其泛化能力,导致其在下游任务上表现不佳,随后利用信息论方法取得了对比学习表现与泛化能力之间的平衡;并且通过谱域上的预处理缓解其过平滑问题的同时增强其泛化能力以获取表达能力更强的大规模图神经网络。
签到
《大模型实践:LLMOps和LLM Agent的关键方法与展望》
《网易有道子曰大模型落地实践》
茶歇&交流
《拓展大语言模型边界:利用向量检索构建知识库》
《大规模图学习中的图对比学习方法与应用》
往期回顾:掘力计划系列活动
21期回顾:【掘力计划第21期】北京站·线下沙龙|大模型的崛起:解析大语言模型的训练和应用
22期回顾:【掘力计划第22期】杭州站·线下沙龙|聊聊前端工程化实践和未来
❤️ 报名且线下参会签到前100名用户可获得掘金社区准备的精美小礼品一份,现场发送哦~
如需交流请添加 掘金酱 企业微信,回复任一关键词 掘力计划 即可入群
海淀区北三环西路甲18号院大钟寺广场1号楼3F-lecture17
可到达13号线大钟寺站A/B口,向西步行400m米
🚩大钟寺南站,步行约20米(专216路)
🚩大钟寺站,步行约404米(87路、88路、94路、300路快车外环、315路、361路、368路内环、425路、584路、606路、658路、695路、921路、夜30路内环、夜30路外环、专168路、专216路)
🚩地铁大钟寺站,步行约276米(87路、88路、94路、315路、361路、368路内环、425路、606路、658路、695路、921路、921路快车、夜30路内环、夜30路外环、专168路)
🚩大钟寺东站,步行约510米(专168路)
可终点设置为大钟寺广场1号楼东门
😋 茶歇参考: