使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
在当前的数字化浪潮中,人工智能已经成为一种无处不在的存在,它渗透进了各个行业和领域,带来了前所未有的变革。而在这场人工智能的革命中,大型深度学习模型,也就是我们常说的大模型,扮演了领头羊的角色。这种模型以其强大的数据处理能力和深度学习的潜力,成为了人工智能领域最具影响力的研究焦点。那么,大模型的实现原理究竟是怎样的呢?11月11日, 掘金特邀3位嘉宾将深入探讨这些问题,带领大家了解大模型的原理及应用。
CodeShell:本地化轻量化的智能代码助手
北京大学知识计算实验室最近发布了性能强大的代码基座大模型 CodeShell-7B 和代码助手 CodeShell-Chat,同时将本地化轻量化的软件开发代码助手完整解决方案全部开源。本次演讲将介绍代码大模型的研究现状、CodeShell 相关模型的一些技术细节、CodeShell 代码助手的部署与使用,与软件开发者和 AI 从业者一起探讨代码大模型的技术发展与应用。
昆仑万维天工大模型技术实践与探索
昆仑万维集团于10月30日发布了13B模型系列,该系列包括了天工base和math模型,并且支持商业使用。这一举措将为大规模模型应用和开源社区的发展提供技术支持。此外,昆仑万维还推出了国内首个AI搜索产品——天工AI搜索,该产品结合了开源社区的技术实践和算法基础,并成功应用于工业界。昆仑万维在AGI 与AIGC 领域的布局始于2020年,如今已经成为行业领先大模型能力提供商。在人工智能领域取得了重大突破,构建了AI大模型、AI搜索、AI游戏、AI音乐、AI动漫和AI社交六大业务领域的矩阵。昆仑万维是国内模型技术与工程能力最强、布局最全面、同时致力于开源社区建设的企业之一。
下一代快速生成模型: 从潜在扩散模型(LDM)到潜在一致性模型(LCM)
潜在扩散模型(LDMs),例如Stable Diffusion,已在AIGC领域取得显著成就,它们能够根据文本描述生成具有出色艺术效果的图片。但图片生成过程的迭代性质使得计算资源消耗巨大,速度缓慢。我们基于一致性模型的原理,创新性地提出了潜在一致性模型(LCMs),这一模型能显著提升预训练潜在扩散模型的生成速度。通过将引导逆扩散过程视作求解增广概率流常微分方程(Aug-PF-ODE),LCMs能直接在潜空间中快速预测ODE的解,大幅减少迭代次数,实现快速且高质量的图像生成。
茶歇 & 交流
CodeShell:本地化轻量化的智能代码助手
昆仑万维天工大模型技术实践与探索
下一代快速生成模型: 从潜在扩散模型(LDM)到潜在一致性模型(LCM)
茶歇 & 交流
往期回顾:掘力计划系列活动
21期回顾:【掘力计划第21期】北京站·线下沙龙|大模型的崛起:解析大语言模型的训练和应用
22期回顾:【掘力计划第22期】杭州站·线下沙龙|聊聊前端工程化实践和未来
23期回顾:【掘力计划第23期】AIGC 的应用和创新|线上直播
24期回顾:【掘力计划第24期】北京站·线下沙龙|大语言模型的应用和实践
25期回顾:【掘力计划第25期】北京站·线下沙龙|性能专场
❤️ 报名且线下参会签到前100名用户可获得掘金社区准备的精美小礼品一份,现场发送哦~
如需交流请添加 掘金酱 企业微信,回复任一关键词 掘力计划27 即可入群
海淀区北三环西路甲18号院大钟寺广场1号楼3F-lecture17
可到达13号线大钟寺站A/B口,向西步行400m米
🚩大钟寺南站,步行约20米(专216路)
🚩大钟寺站,步行约404米(87路、88路、94路、300路快车外环、315路、361路、368路内环、425路、584路、606路、658路、695路、921路、夜30路内环、夜30路外环、专168路、专216路)
🚩地铁大钟寺站,步行约276米(87路、88路、94路、315路、361路、368路内环、425路、606路、658路、695路、921路、921路快车、夜30路内环、夜30路外环、专168路)
🚩大钟寺东站,步行约510米(专168路)
打车:可终点设置为大钟寺广场1号楼东门
驾车:大钟寺1号楼停车引导(西门)
位于北三环西路联想桥南侧,沿北三环辅路由西向东行驶到北三环辅路与四道口路交会处右转直行300米,左手边可见如图示出入口,有物业安保人员在门口指引,地图软件搜索“大钟寺广场1号楼西门”导航即可。
高德会显示:大钟寺中坤广场C座西北门,百度地图:大钟寺广场1号楼西门,去东门不能停车。
😋 茶歇参考: