微信分享
【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙

使用微信扫一扫分享到朋友圈

活动分享
【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙

使用微信扫一扫进入小程序分享活动

活动介绍

在当前的数字化浪潮中,人工智能已经成为一种无处不在的存在,它渗透进了各个行业和领域,带来了前所未有的变革。而在这场人工智能的革命中,大型深度学习模型,也就是我们常说的大模型,扮演了领头羊的角色。这种模型以其强大的数据处理能力和深度学习的潜力,成为了人工智能领域最具影响力的研究焦点。那么,大模型的实现原理究竟是怎样的呢?11月11日, 掘金特邀3位嘉宾将深入探讨这些问题,带领大家了解大模型的原理及应用

活动日程
2023-11-11
2023-11-11
14:00-14:40

CodeShell:本地化轻量化的智能代码助手

北京大学知识计算实验室最近发布了性能强大的代码基座大模型 CodeShell-7B 和代码助手 CodeShell-Chat,同时将本地化轻量化的软件开发代码助手完整解决方案全部开源。本次演讲将介绍代码大模型的研究现状、CodeShell 相关模型的一些技术细节、CodeShell 代码助手的部署与使用,与软件开发者和 AI 从业者一起探讨代码大模型的技术发展与应用。

嘉宾
【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
谢睿
助理研究员 CodeShell核心贡献者
2023-11-11
14:50-15:30

昆仑万维天工大模型技术实践与探索

昆仑万维集团于10月30日发布了13B模型系列,该系列包括了天工base和math模型,并且支持商业使用。这一举措将为大规模模型应用和开源社区的发展提供技术支持。此外,昆仑万维还推出了国内首个AI搜索产品——天工AI搜索,该产品结合了开源社区的技术实践和算法基础,并成功应用于工业界。昆仑万维在AGI 与AIGC 领域的布局始于2020年,如今已经成为行业领先大模型能力提供商。在人工智能领域取得了重大突破,构建了AI大模型、AI搜索、AI游戏、AI音乐、AI动漫和AI社交六大业务领域的矩阵。昆仑万维是国内模型技术与工程能力最强、布局最全面、同时致力于开源社区建设的企业之一。

嘉宾
【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
陈岩峰
天工商业化团队-产品总监
2023-11-11
15:40-16:20

下一代快速生成模型: 从潜在扩散模型(LDM)到潜在一致性模型(LCM)

潜在扩散模型(LDMs),例如Stable Diffusion,已在AIGC领域取得显著成就,它们能够根据文本描述生成具有出色艺术效果的图片。但图片生成过程的迭代性质使得计算资源消耗巨大,速度缓慢。我们基于一致性模型的原理,创新性地提出了潜在一致性模型(LCMs),这一模型能显著提升预训练潜在扩散模型的生成速度。通过将引导逆扩散过程视作求解增广概率流常微分方程(Aug-PF-ODE),LCMs能直接在潜空间中快速预测ODE的解,大幅减少迭代次数,实现快速且高质量的图像生成。

嘉宾
【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
骆思勉
交叉信息研究院 - LCM论文作者
2023-11-11
16:30-17:00

茶歇 & 交流

CodeShell:本地化轻量化的智能代码助手

【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
谢睿
助理研究员 CodeShell核心贡献者
谢睿博士毕业于北京大学软件工程国家工程研究中心知识计算实验室(KCL),主要研究方向为软件工程与人工智能交叉领域,目前聚焦大模型训练与评估方向的学术研究与产业落地,是代码大模型CodeShell的核心贡献者。谢睿博士在ACL、WWW、ASE等国际顶级会议上发表论文十余篇;参与/带领学生参与并获得AI科技竞赛奖励十余次,代表获奖包括2017年阿里聚安全算法挑战赛冠军、2022年中国法律智能技术评测“事件检测”竞赛冠军等。

昆仑万维天工大模型技术实践与探索

【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
陈岩峰
天工商业化团队-产品总监
陈岩峰,统计学硕士, 毕业于密歇根州立大学,从事AI算法、产品相关工作6年, 曾就职于美国头部金融机构EPIC LP. 管理1.5亿美金规模的金融产品,目前昆仑万维科技股份有限公司担任产品总监, 负责大模型商业化应用产品化和模型开源运营。

下一代快速生成模型: 从潜在扩散模型(LDM)到潜在一致性模型(LCM)

【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
骆思勉
交叉信息研究院 - LCM论文作者
Latent Consistency Model(LCM)论文作者,清华叉院二年级在读硕士,本科毕业于复旦大学大数据学院。研究方向为机器学习与生成模型。研究兴趣包括:多模态生成,AIGC模型加速。致力于开发下一代的生成模型。以一作身份发表多篇计算机视觉和机器学习顶级会议(ICCV,NeurIPS)论文。LCM模型上线半个月,在Hugging Face平台下载量超9w,模型调用次数超35w次。

茶歇 & 交流

活动嘉宾
  • 助理研究员 CodeShell核心贡献者谢睿
    谢睿
    北京大学 助理研究员 CodeShell核心贡献者
    谢睿博士毕业于北京大学软件工程国家工程研究中心知识计算实验室(KCL),主要研究方向为软件工程与人工智能交叉领域,目前聚焦大模型训练与评估方向的学术研究与产业落地,是代码大模型CodeShell的核心贡献者。谢睿博士在ACL、WWW、ASE等国际顶级会议上发表论文十余篇;参与/带领学生参与并获得AI科技竞赛奖励十余次,代表获奖包括2017年阿里聚安全算法挑战赛冠军、2022年中国法律智能技术评测“事件检测”竞赛冠军等。
  • 天工商业化团队-产品总监陈岩峰
    陈岩峰
    昆仑万维科技有限公司 天工商业化团队-产品总监
    陈岩峰,统计学硕士, 毕业于密歇根州立大学,从事AI算法、产品相关工作6年, 曾就职于美国头部金融机构EPIC LP. 管理1.5亿美金规模的金融产品,目前昆仑万维科技股份有限公司担任产品总监, 负责大模型商业化应用产品化和模型开源运营。
  • 交叉信息研究院 - LCM论文作者骆思勉
    骆思勉
    清华大学 交叉信息研究院 - LCM论文作者
    Latent Consistency Model(LCM)论文作者,清华叉院二年级在读硕士,本科毕业于复旦大学大数据学院。研究方向为机器学习与生成模型。研究兴趣包括:多模态生成,AIGC模型加速。致力于开发下一代的生成模型。以一作身份发表多篇计算机视觉和机器学习顶级会议(ICCV,NeurIPS)论文。LCM模型上线半个月,在Hugging Face平台下载量超9w,模型调用次数超35w次。
  • 活动详情

    往期回顾:掘力计划系列活动

    21期回顾:【掘力计划第21期】北京站·线下沙龙|大模型的崛起:解析大语言模型的训练和应用

    22期回顾:【掘力计划第22期】杭州站·线下沙龙|聊聊前端工程化实践和未来

    23期回顾:【掘力计划第23期】AIGC 的应用和创新|线上直播

    24期回顾:【掘力计划第24期】北京站·线下沙龙|大语言模型的应用和实践

    25期回顾:【掘力计划第25期】北京站·线下沙龙|性能专场



    ❤️ 报名且线下参会签到前100名用户可获得掘金社区准备的精美小礼品一份,现场发送哦~


    💬 入群交流

    如需交流请添加 掘金酱 企业微信,回复任一关键词 掘力计划27 即可入群

    1692017879326.jpg

       

    🔔出行提示

    海淀区北三环西路甲18号院大钟寺广场1号楼3F-lecture17


    🚇 地铁出行:

    可到达13号线大钟寺站A/B口,向西步行400m米

    🚌 公交出行


    🚩大钟寺南站,步行约20米(专216路)

       

    🚩大钟寺站,步行约404米(87路、88路、94路、300路快车外环、315路、361路、368路内环、425路、584路、606路、658路、695路、921路、夜30路内环、夜30路外环、专168路、专216路)


    🚩地铁大钟寺站,步行约276米(87路、88路、94路、315路、361路、368路内环、425路、606路、658路、695路、921路、921路快车、夜30路内环、夜30路外环、专168路)


    🚩大钟寺东站,步行约510米(专168路)

        

    🚗 驾车/打车

    打车:可终点设置为大钟寺广场1号楼东门


    驾车:大钟寺1号楼停车引导(西门)

    位于北三环西路联想桥南侧,沿北三环辅路由西向东行驶到北三环辅路与四道口路交会处右转直行300米,左手边可见如图示出入口,有物业安保人员在门口指引,地图软件搜索“大钟寺广场1号楼西门”导航即可。




    高德会显示:大钟寺中坤广场C座西北门,百度地图:大钟寺广场1号楼西门,去东门不能停车。

       



    😋 茶歇参考:

    1614204242971445.jpg

    往期精彩
    【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
    【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
    【掘力计划第27期】大模型的实现原理和应用|北京站·线下沙龙
    活动主办方