使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
人工智能率先在互联网和金融行业落地,如今正逐渐深入各行各业,尤其是大模型的发展更加速了这一进程。通过在汽车、医药等行业落地知识提取、查询、开发、问答、规划等功能,人工智能将持续为研发、设计、供应链、生产、营销、物流等行业典型场景赋能,并极大简化工作流复杂度,挖掘新兴场景,为企业降本增值。这一愿景的实现始终离不开行业数据的支持,从数据集成、数据治理,到模型训练、模型推理,大数据与人工智能始终是紧密关联和作用的。优质数据推动智能提升,智能算法优化数据质量,数据与智能形成知识规范化与凝练的飞轮,融为一体。
为此,2024年4月19-20日,秉持“数聚垂域,智领未来”信念,DataFunCon2024·上海站将继续顺应趋势,邀请数据智能技术专家与行业专家,探讨数据智能落地的现在与未来。
与行业专家,探讨数据智能落地的现在与未来。
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
个人介绍:在大规模分布式搜索推荐系统、大数据分布式系统等方向拥有超过15年的经验,现任阿里云MaxCompute产品等自研大数据平台负责人。曾担任微软搜索与人工智能事业部Partner Group Engineer Manager,带领团队研发网页检索更新系统以及个人数据搜索系统,创建并领导推荐平台,大数据计算和深度学习平台,支撑微软Bing,Ads,MSN news, Office OneDrive等在线服务,大数据处理以及模型训练业务。毕业于清华大学计算机专业,获得伊利诺伊大学博士学位。
现任小质科技技术 VP,曾任阿里巴巴资深技术专家、网易数据科学中心大数据平台技术负责人。是阿里云交互式分析产品 Hologres 核心开发,担任 Hologres 产品的研发以及商业化相关工作。还曾设计开发阿里云流计算产品 StreamCompute V1.0/Galaxy,支持多届阿里巴巴双 11 实时大屏业务及集团大部分流计算业务。担任网易数据科学中心大数据平台技术负责人期间,负责网易大数据平台建设,自研系统研发与开源组件功能扩展与集成、大数据产品化输出。
个人介绍:现任京东健康智能算法部负责人,负责京东健康在医疗AI领域的技术创新和解决方案研发。IEEE Senior Member,毕业于浙江大学,主要研究方向在大规模语言模型和多模态学习,是医疗大模型京医千询的技术负责人和视频多模态大模型VICTOR的作者。具有10年以上人工智能的研发经历,在创新科技前沿具有丰富的实战经验并引领多项核心技术突破,覆盖大健康、电商、搜索引擎、内容推荐、互联网广告等多领域。
演讲题目:大模型趋势下的医疗人工智能
演讲提纲:
1. 对大模型和人工智能在医疗领域的重要性介绍
2. 大模型如何改变医疗诊断和治疗方法
3. 京医千询的技术实践
4. 对医疗实践和医患关系的影响与挑战
听众收益:
1. 对大模型技术的优势与挑战有深入的认识
2. 了解医疗人工智能技术的发展趋势
3. 引发听众对于跨学科合作、数据隐私保护、算法公平性等问题的思考,促进医学和技术领域的深度合作与交流
个人介绍:于中国科学技术大学,获得计算机科学博士学位。随后加入理光研究院,并在亚利桑那州立大学(ASU)担任博士后研究员。14年回国,加入阿里巴巴,现担任蚂蚁金服大数据智能风控总监。
个人介绍:何震瀛,博士,复旦大学计算机科学学院副教授,中国计算机学会数据库专委会执行委员、大数据专委会通信执行委员,中国人工智能学会智能服务专委会委员,中国中文信息学会网络空间大搜索专委会常务委员。主要研究兴趣:数据管理和数据分析(包括海量数据管理和分析、数据智能)等。主持和参加二十余项科技部重点研发计划、核高基、863、国家自然科学基金重点和面上项目、上海市科技创新重大计划等。近五年,在数据管理、数据分析等方面进行了大量研究工作,发表论文80余篇。
个人介绍:中科大硕士,曾服务于百度腾讯等互联网大厂,在大数据人工智能领域有十多年经验。
个人介绍:腾讯IEGG首席数据工程架构师,有超过10年的大数据架构和应用相关的经验,曾负责过QQ数据基础和应用平台从0到1的构建,腾讯公有云大数据产品技术架构的演进,目前负责IEGG数据团队技术架构优化相关工作。
个人介绍:李少春先生现任云南白药数字战略科学家、智慧科技业务单元(BU)总经理,CIO。专注于 医疗行业专业场景和前沿数字化技术的深度融合,在大健康领域拥有深厚行业实践经验。持续专注于 大数据分析、人工智能、云计算、物联网等多个领域前沿研究和创新,推动全球创新合作的战略和执 行,推动 AI 科技和生态系统创新解决方案,助力医疗和生命科学行业企业的完整价值链的数字化重 塑进程,为其提供做出关键医疗、临床、运营和创新决策所需的洞察力,使企业和组织能够利用领先 技术实现可信的数字化智慧医疗平台转型。李少春先生致力于打造智慧医疗健康创新生态。深度和临床医生、研究人员、数据科学家、 政府机构、业界思想领袖以及医疗大健康产业生态企业深入链接和合作,致力于将数据、技术和业务 整合实现数智化重塑。李少春先生多次作为行业领袖受邀在全球和国内人工智能、医药研发、医疗和 相关产业科技大会发表洞见演讲。李少春先生就读长江商学院和北大光华高管学院,荣获北京大学工 学院、E 药经理人等行业专家理事。历任 IBM 大中华区医疗和生命科学行业总经理,前 IBM 大中华区沃森健康(Watson Health)总经理,IBM 中国研究院研究技术创新总监,IBM 发明大师(超过 60 项全球专利),获 得 15 项 IBM 年度全球研究科技成就奖,其中 3 项为杰出成就奖项,屡次荣获 IBM 全球杰出业 务奖、技术奖、经理人奖。
演讲题目:大模型时代的数字医疗和数智医药转型创新
演讲提纲:数字化1.0阶段的效率提升主要依靠将线下的业务行为搬到线上,利用业务数字化工具提升业务运营的效率。数字化2.0阶段聚焦全域业务数据分析带来的效率,实现企业“上帝视野”数据驱动的管理和经营。数字化3.0阶段是超级自动化的效率实现,是把行业和产业链的外部数据和企业的内部数据链接在一起;把过去和现在的数据链接在一起;把企业执行数据和企业经营结果数据链接在一起;把消费者需求数据和产品研发生产数据链接在一起。在AI大模型的时代,企业的决策不再是靠经验和普世的规则,而是依靠全链条的数据洞察、机器学习和AI判断,结合外部的生态链和行业的洞察实现自动化,是企业超级自动化的新效率时代。大模型重新定义了人工智能的新可能,促进AI应用规模化落地,对医疗医药行业领域赋能更深,将促进未来企业管理模式和用户互动模式的进步和改变。AI工具和数字化手段,将作为重要的“工具创新”和“能力建设”途径,为企业推动数字化转型装上强大的增长引擎。
听众收益:
1. 科技数字化新范式,企业发展新机遇
2. AI 大模型时代带来的数字医疗的新机会
3. 医药企业数字化转型和中医药产业链创新
个人介绍:阿里巴巴机器学习平台资深技术专家,长期参与超大规模模型训练、异构资源调度、MLOPS 等领域的研发。
个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据治理与挖掘等。在领域主流期刊和国际会议上发表论文近200篇,主持十余项国家和省部级科研项目。
演讲题目:大模型驱动的数据清洗与数据合规技术展望
演讲提纲:我国高度重视数字经济建设,数据成为重要的生产要素之一。在持续推动数据要素市场发展的进程中,数据治理成为释放数据要素价值的重要瓶颈。传统的数据治理技术受限于小模型的建模、表达与泛化能力,难以应对复杂动态的数据市场环境下来自百业千行的领域数据治理需求。大语言模型因其对现实世界的强大建模能力和良好泛化能力,为数据治理技术带来重大革新契机。然而,基于大模型的数据质量和数据合规治理研究方兴未艾,充满机遇与挑战。如何构建安全可信的大模型用于数据治理?如何让大模型助力真实复杂场景的数据清洗?如何利用大模型辅助领域数据的合规性检查?如何提升大模型对数据治理的决策规划能力?针对以上问题,本此分享讲者将做一些深入的分析和探讨,并展望以大模型为驱动核心的智能数据质量与合规治理技术的研究。
听众收益:
1. 数据清洗与数据合规的难点以及大模型带来的契机;
2. 大模型驱动的数据治理技术的整体思路与研究框架;
3. 大模型驱动的数据清洗和数据合规的可能技术方案。
个人介绍:梁家卿博士,复旦大学大数据学院青年副研究员,主要研究方向为基于知识图谱与大模型的认知智能。在国际顶级学术会议与期刊(包括TKDE,AAAI,IJCAI,ICDE等)发表论文50多篇。在应用落地方面,作为技术负责人研发并公开发布了多个知识图谱与大模型应用平台如CuteGPT、Emo-CuteGPT、CN-DBpedia、ProbasePlus、CN-Probase、“不倒翁”智能问答等,相关产品API被工业界与学术界多家单位已调用累计17亿次以上,并形成了16个专利。有成功训练百亿参数量级别模型的经验和在大规模集群上训练千亿参数量级别模型的经验。先后在国际性的“知识库构建”比赛中荣获第二名;在中国计算机学会和中国中文信息学会的主办的语言与智能技术竞赛“信息抽取”比赛中荣获第一名。主持研发的情感增强大模型 CuteGPT 在上海卓辰信息科技有限公司(帮助其情报信息知识抽取准确率达到 90%以上)、上海双地信息系统有限公司(帮助其开发了内容管理产品“小孔商业智能AI助理”)、上海光唯文化传媒有限公司(应用于其客户在新产品研发业务,新产品销售额超过千万元)等单位实现了落地应用。并且曾获ACM-ICPC区域赛金牌、TopCoder Open全球前150名、吴文俊人工智能科学技术奖科技进步奖三等奖、上海市优秀博士毕业生、上海市计算机学会优秀博士论文、华为云最佳论文复现奖、复旦大学超级博士后、上海市超级博士后、中国博士后科学基金面上资助、国家自然科学基金青年基金资助。
演讲题目:大模型的持续能力提升
演讲提纲:当前大模型在发布一个版本以后,往往需要大量的专家进行评估、数据合成和继续优化以发布下一个版本。这一模型迭代过程的时间长、人工贵、结果难以估计、无法稳定获得提升。而且,其中模型的评估和能力提升往往过于领域限定,难以推广到模型通用能力的提升。事实上,授“人”与鱼不如授“人”以渔,模型的提升需要更多的原理指导和对其自身学习能力的依赖。因此,我们的核心目标是:如何简化(自动化)大模型的持续能力提升流程?为了达到这一目标,我们从以下三个方向进行了一些研究:
1. 分析模型能力获取和增强的原理作为指导
=> 模型能力体系产生与强化机理
2. 自动收集和筛选最“有效”的语料
=> 模型继续训练中的语料处理
3. 基于模型自身的元能力进行自我迭代
=> 模型的元能力激发
个人介绍:复旦大学计算机学院教授、博导,上海市数据科学重点实验室副主任,复旦大学社会计算研究中心主任,美国卡耐基梅隆大学(CMU)访问学者。现为中国计算机学会杰出会员、协同计算专委秘书长,上海市计算机学会协同信息服务专委会副主任。研究兴趣包括社会与协同计算、人智协同与交互、群智协同与系统、数字社会智能治理等。主持多项国家自然科学基金项目、科技部重点研发计划课题、863课题和上海市项目。成果发表在CSCW、CHI、UbiComp、NeurIPS、WWW、SIGIR、IEEE TKDE、ACM TOIS等权威会议和期刊上。常规担任CSCW、CHI等的AC,担任多个国内外学术会议的PC/TPC Chair以及多个国内外学术期刊的AE和GE。
存储领域专家,小红书的存储和数据库团队负责人,先后在 EMC、华为、阿里云担任存储产品的专家和架构师。目前负责小红书的 NoSQL 数据库、关系型数据库、NewSQL 数据库的规划和架构演进,以及存储产品的建设。
个人介绍:抖音集团电商数据BP专家,从业大数据行业十余年,曾在腾讯、虎牙等互联网企业工作,在数据仓库,数据架构等方向有丰富经历,多次在行业公开分享。
个人介绍:王鹏,复旦大学计算机科学技术学院,教授,博导,上海市数据科学重点实验室副主任。主要研究兴趣包括:工业大数据、智能运维等。2012年获得教育部自然科学二等奖(第三完成人)。主持或主要参与科技部重点研发计划、国家青年973、自然科学重点/面上基金、上海市科委、上海市经信委的多个项目,以及微软、IBM、EMC、华为等企业的资助项目。在数据库领域顶级国际期刊与会议SIGMOD、VLDB、ICDE、SIGKDD、TKDE、ICDM等发表论文50多篇。曾担任众多国际顶级与知名学术会议的程序委员会委员,包括SIGKDD、ICDE、DASFAA、WAIM等。国际知名学术期刊VLDB Journal、TKDE、KIS等的审稿人。
个人介绍:温绍锦,阿里云资深技术专家,花名高铁,阿里云 DataWorks 技术负责人。
个人介绍:我自2021年6月至今一直在eBay担任推荐算法Team Lead。在全站推荐业务中,我带领团队使用算法能力解决多个业务痛点,显著提高了eBay首页与商品详情页的GMV和广告收入。在之前的工作中,我曾在iQIYI爱奇艺公司担任高级机器学习工程师,领导了短视频推荐系统的开发,旨在提供高度个性化的视频推荐。我的学历背景包括香港大学计算机科学的本科与硕士学位,入选过院长荣誉榜(2011/12年,前10%),获得过宋庆龄奖学金。
演讲题目:eBay多模态与GNN商品嵌入技术:提升推荐系统效能与用户体验
演讲提纲:在本次演讲中,eBay的推荐系统专家将深入介绍他们创新性的多模态与图神经网络商品嵌入技术,旨在提升推荐系统的效能与用户体验。通过优化召回模块,整合多模态信息,以及运用图神经网络,演讲者将分享如何解决传统推荐系统中的挑战,提高推荐准确性,并展示这些技术在实际业务中如何根据用户痛点量身定制解决方案,为每一位用户创造更为个性化、精准的购物体验。
听众收益:
1. 如何使用算法能力撬动用户痛点的杠杆:深入讨论如何利用算法能力根据eBay业务实际特点解决用户痛点。通过演示多模态商品嵌入和GNN的应用,探索算法在推荐系统中的实际业务场景中如何精准地满足用户需求,提高购物体验,解决用户在推荐系统中可能遇到的问题,为业务实际特点量身定制解决方案。
2. 多模态召回模块优化:通过整合多模态信息,提升召回模块的准确性,解决单一模态在复杂情境下的推荐困难,为用户呈现更相关和个性化的推荐结果。
3. 图神经网络在推荐系统中的实践经验:深入探讨了GNN在构建用户-商品行为交互图上的应用,展示了GNN召回模型的在线实验结果,证明其在提升CTR和PTR方面的显著效果。
个人介绍:熊贇,教授,博士生导师。上海市数据科学重点实验室副主任。长期从事数据领域研究,研究工作获得了国家自然科学基金、国家863计划、上海市科委基金等以及企业资助。发表论文80余篇。获中国计算机学会科学技术发明奖、上海市科技进步奖、上海市计算机学会科技进步奖等奖项。在国内率先开展大数据和数据科学的研究工作,2009年出版第一本数据科学专著,原创性地提出了数据科学的定义和内涵;提出了一批新型的大数据挖掘算法,这些算法已经被应用于证券交易所、医联平台、交通信息中心等上海市大数据建设重要领域。
个人介绍:百度主任架构师。百度信息流推荐系统负责人。在AI系统,云原生服务有十余年丰富业务架构经验。
演讲题目:AI 原生应用中的 AI Agents 探索与实践
演讲提纲:
1. AI Agents 介绍与发展
2. AI 原生应用中 AI Agents 系统探索
3. AI Agents 一线实践经验
听众收益:
1. 了解 AI Agents 系统架构设计
2. 学习大规模 AI 原生应用中 AI Agents 实践经验
3. 思考 AI Agents 系统在业界未来发展方向
个人介绍:2014 年加入百度,现任商业平台部资深研发工程师,商业体系平台工程团队大数据方向 leader,百度商业大数据 LKT 成员。主要负责面向商业数据产品的大数据基建和应用架构工作,曾主导离线环境全面 Serverless 化改造,拥有数据治理领域十余项发明专利,对构建智能化 DataOps 大数据系统、保障复杂业务数据链路时效性与稳定性方面具有丰富经验。
个人介绍:于中国科学技术大学,获得计算机科学博士学位。随后加入理光研究院,并在亚利桑那州立大学(ASU)担任博士后研究员。14年回国,加入阿里巴巴,现担任蚂蚁金服大数据智能风控总监。
个人介绍:赵健博,大数据领域、存储领域专家,快手数据引擎与存储技术团队负责人,目前负责快手下一代数据基础架构、资源调度管理,以及存储技术的规划,建设与应用工作。
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
个人介绍:刘一鸣,目前负责阿里云ODPS等自研大数据产品,主攻云原生一体化数仓引擎能力的演进和商业化,在数据仓库、大数据计算、开源大数据行业有15年以上工作经验。原Kyligence 副总裁,Apache Kylin PMC。
演讲题目:阿里云大数据AI一体化最佳实践
演讲简介:Data+AI时代,大数据平台该如何建设?我们认为需要具备计算效率、开发效率、处理效率为一体的高效能力,才能保障企业AI时代下的业务创新。阿里云提供了从数据集成、清洗、建模、计算到服务的大数据+AI整套产品解决方案。 同时,阿里云自研大数据平台 MaxCompute 推出分布式计算框架 MaxFrame,100% 兼容 Pandas 等数据处理接口,打通数据管理、大规模数据分析、处理到 ML 开发全流程,打破大数据及 AI 开发使用边界,大幅提升开发效率,助力企业快速构建AI时代的基础设施。
个人介绍:周卫林,Aloudata(大应科技)创始人 & CEO,曾任蚂蚁集团研究员(P10)、蚂蚁集团数据平台部总经理,拥有 20 余年大数据领域从业经验,是国内最早一批数据仓库先行者。他曾深度参与并主导了阿里/蚂蚁集团从传统数仓体系到数据智能体系的数据技术演进过程,全面支撑了蚂蚁集团从支付工具到数字生活平台的升级,横向推动了整个蚂蚁集团业务数据化、智能化水平的提升。除此之外,他还是多个有影响力的数据工具类产品的主要缔造者,并由此孵化出多个进入 Gartner、Forrester 领导者象限的阿里云拳头产品。
演讲题目:NoETL,开启自动化数据管理新时代
演讲提纲:通过剖析企业数智化的典型场景和发展路径,探讨企业数据管理的挑战与目标,并通过介绍 NoETL 理念和技术创新,分享数据管理自动化领域的最新进展和实践经验。
听众收益:
1. 从 CDO 和工程架构视角了解企业数据管理面临的挑战和根因分析
2. 对 NoETL 与 Data Fabric 理念的专业解读
3. 为什么数据管理要实现自动化,如何实现自动化
个人介绍:博士,中国人工智能领军科学家,出版十几部中英文专著,翻译多部英文计算机经典学术专著。深入研究和实践AI领域十余年,包括大语言模型、多模态AI技术、通用大模型。担任多个国内外AI领域的学术组织的主要专家,在学术圈与产业圈有一定影响力。在智慧城市、智能制造、智慧医疗、智能金融等领域实现产业化落地和产品创新。曾在百度、商汤科技、上海人工智能实验室等多家行业龙头企业的研究创新机构从事人工智能相关技术研发与创新研究并担任主要领导科学家岗位,目前在中国的金融券商龙头机构、市值超过2000亿的东方财富集团担任AI首席科学家以及人工智能研究院执行院长。作为学者撰写了多部人工智能和数字经济领域的重要学术专著(目前出版了十几部中英文人工智能领域学术专著见详细介绍)。2018年加入同济大学人工智能与区块链智能实验室,与国际芯片公司ARM共同研发人工智能芯片生态相关项目。同年,著作《AI与区块链智能》被多所高校采用为教材。2019年,受邀在中英教育合作高峰论坛发表演讲,并被授予“中英教育合作交流特邀专家”荣誉。2020年,著作《智能经济》荣获中国新闻所颁发的大数据科技传播大奖,为首部讨论人工智能如何推动产业赋能以及相关技术思想的国内学术专著,同年参与了多个国家级研究项目,如科技部的《新一代人工智能报告》(2020年/2021年度)、人民网研究院的《移动互联网蓝皮书》(2020年)、联合国的《可持续发展白皮书》(2020)。2021年,为英国首相顾问丹尼尔·苏斯金德的新书《没有工作的世界》撰写序言。2022年底作为科技部专家代表参与中法人工智能研讨会,该会议由中国科技部与法国高等教育、研究与创新部门联合组织。2022年~2023年期间,在中欧国际商学院、长江商学院、上海交大安泰管理学院、上海交大高金、上海财经大学担任特约研究员和客座讲师,在多个行业顶尖大会上进行技术分享与主题演讲,给数十家顶尖投行基金授课(包括不限于摩根、汇丰、瑞银、景林资本、富国基金、麦格里投行等),演讲大会包括上海中国国际进口博览会(2021年)、上海世界人工智能大会(WAIC 2021/2022年)、杭州全球人工智能大会(2021年度)中国计算机学会YEF年度大会(2022年)、广州STC科技大会(2023年)等。2023年成为上海交通大学清源研究院研究员从事AI相关研究,作为第一作者出版学术专著《智能的启蒙:通用人工智能与意识机器》,得到多个国内媒体的报道。领导团队参与多项国家级和行业级AI标准的制定工作,如《人工智能产品伦理风险控制指南》和《人工智能风险评估模型》,《金融业人工智能平台技术要求和测试方法》,可信AI《大模型鲁棒性评估标准》,《大规模预训练模型基准测试》等。在海外学术交流方面,与爱丁堡大学金融学教授、欧洲科学院院士侯文轩共同撰写学术专著《Digital Finance》(作为第一作者);翻译出版了斯坦福大学语言与信息研究中心创始人Brian Cantwell Smith的学术专著《The Promise Of AI》,并在2022年出版了中文版,为国内读者提供了一部深入浅出的AI领域专著;担任微软全球研究院AI4Science实验室主任Christopher Bishop的经典著作《Deep Learning》(深度学习)一书(该书获得三位人工智能教父Geoffery Hinton, Yann LeCun, Yoshua Bengio推荐),作为中方翻译核心专家组成员推进相关工作预计2025年出版; 个人专著《AI Ethics and Governance》入围施普林格.自然2023年度“中国新发展奖”。在国际组织方面,于2022年5月成为国际电工委员会IEC生物数字融合系统评估组(IEC/SMB/SEG12)的专家成员,2024年受邀担任2024年第四届IEEE计算机通信与人工智能国际会议(CCAI 2024)技术委员会委员与会议论文审稿人。
演讲题目:基于世界模型视角的通用人工智能探索
演讲提纲:
1. 讨论通用人工智能技术的发展和内在技术逻辑
2. 讨论世界模型、强化学习以及自由能原理的内核
3. 讨论通用人工智能技术的未来和创新范式的演化
听众收益:
1. 讨论通用人工智能技术的发展和内在技术逻辑,帮助大家深度理解通用 AI 的前瞻性思考
2. 讨论世界模型、强化学习以及自由能原理的内核,帮助大家理解目前对 AI 智能上限的可能性
3. 讨论通用人工智能技术的未来和创新范式的演化,帮助大家梳理产业创新的重点场景和思考
个人介绍:陈炯,男,博士,清华大学电子工程系本科、博士,现任蔚来汽车技术规划部门技术专家,中国计算机学会智能汽车分会委员,中国汽车工程学会传感器分会委员,复旦大学、合肥工业大学校外研究生导师,曾任伊顿(中国)研究院资深工程师,多年来从事系统设计和前瞻研究相关工作,作为主要技术负责人完成过多项预研项目,并进行产品转化。拥有60+项专利(多项同时在美国PCT申请),在国内外杂志和期刊上发表论文17篇。在伊顿中国研究院工作期间,带领全球团队完成多项产品开发和技术攻关项目。在蔚来汽车工作期间,作为系统架构师,成功开发过蔚来第一代电动汽车充换电站,移动充电车等产品,也是蔚来自动驾驶第二代平台的核心架构师之一,现在主要进行大模型相关的系统架构设计和应用开发工作。入选 2022 年上海市产业菁英高层次人才。
演讲题目:大模型在智能电动汽车中的应用与实践
演讲提纲:
1. 智能电动汽车的发展趋势
2. 大模型赋能智能电动汽车的场景
3. 蔚来的应用与实践
听众收益:
1. 如何结合场景,深耕行业
2. 如何通过应用驱动,精准定位和解决问题
3. 如何设计统一的架构来支持应用
个人介绍:小红书推荐算法专家,在视频推荐、内容冷启动及社交推荐等领域拥有多年实战经验,担任公司多个推荐场景的负责人。
演讲题目:高时效推荐系統实践 - 从系统提效到内容冷启动
演讲提纲:本演讲将分享小红书去中心化高时效分发系统的实践和挑战,从推荐时效性提升开始,延伸至内容冷启动的多项探索和技术实践。
听众收益:
1. 高时效推荐系统的挑战和实践
2. 内容冷启动的常见方法
3. 小红书的内容冷启动实践
个人介绍:阿里云云效、通义灵码产品技术负责人,致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。
演讲题目:通义灵码智能编码助手技术解密
演讲提纲:随着大模型技术的成熟,以及大模型在代码生成中的优秀表现,让以智能化为核心的软件研发3.0时代很快就会到来。其核心是围绕大模型去构建新一代软件研发智能化工具,最终创造出“AI原生研发模式”,从而让研发效能出现质变。通义灵码就是基于大模型技术打造的新一代智能编码工具,其核心就是未来软件研发工具的“大脑”。本次分享将解密通义灵码核心技术,讲述其背后的思考与创新。具体包括:
1. AI成为软件研发的必选项
· AIGC从可选项逐步变成研发工作的必选项
· 企业软件研发的挑战及智能化的机会
· 智能化软件研发发展趋势
2. 通义灵码核心技术解密
· 极致的开发者体验
· 极致的技术优化
· 极致的模型能力
3. 企业落地研发智能的策略与路径
· 企业构建研发智能化的策略
· 通义灵码企业个性化方案
· AI 赋能软件开发全生命周期场景探索
听众收益:
1. 了解软件研发智能化趋势与机会
2. 了解通义灵码核心技术与最新代码大模型能力
3. 了解企业落地智能研发的策略与路径
个人介绍:英国爱尔兰Dublin City University博士,武汉大学本科,曾经就职于IBM Watson、阿里巴巴等企业,现就职于SHOPEE虾皮科技有限公司,负责商品智能化算法以及多语言商品知识图谱相关算法服务建设。
演讲题目:跨境电商物流系统相关异常信息识别
演讲提纲:
1. 跨境电商物流系统简介
2. 异常信息在跨境电商物流中的影响
3. 应用商品知识图谱实现异常检测
4. 未来的工作
听众收益:
1. 跨境电商异常预测业务
2. 异常预测模型架构
3. 如何建立商品知识图谱来解决
个人介绍:10年游戏海外市场发行及营销。2014年入职于德国慕尼黑上市电视媒体公司ProsiebenSat1游戏发行部门,负责中国区发行选品,分析和建模。2016年入职于德国柏林整合营销机构ComboStrike,负责中国办公室从0到1搭建,整合营销提案及执行。目前在腾讯游戏IEGG,探索海外游戏营销中台服务增长点。
演讲题目:欧美 KOL 营销技术应用探索
演讲提纲:
1. 文化差异:国内主流freemium和海外pc主机premium的差异:市场,玩家,产品,触媒习惯
2. 欧美游戏市场宣发和数据的运用(已落地实践部分)
3. 腾讯数据运用拓展方向探索:
① KOL业务为例:基本工作流程,效率提升点,产业结构,探索方向
② 游戏标签,内容标签,品牌安全,舆情,后链路 > 数据结构 > 推介算法的探索
听众收益:
1. 海外游戏营销的特征:国内免费手游为主,海外买断制pc/主机游戏是怎么推广的?和免费制手游推广有什么区别?
2. 腾讯如何探索搭建适合海外二方studio(腾讯投资)的业务?以正在探索的KOL板块为例。
个人介绍:抖音电商数据BP血缘项目架构师、火山引擎DataLeap研发架构师。专注大数据开发,致力于通过建设高质量的数据全链路血缘资产,围绕数仓的研发提效、模型质量、运维等场景,为各个业务方(数仓、DA、工程团队、B端客户)赋能。主导了抖音电商从数据源到数据应用的全链路血缘建设,并上线了一系列如代码速读、模型切换、影响面追踪等功能。
演讲题目:抖音电商数据血缘探索和实践
演讲提纲:
一、血缘底座
这部分介绍血缘底座的建设,包括数据生产侧和消费侧血缘数据的采集、存储、分析以及血缘数据的本身的评估方法;此外还介绍宽口径/中口径字段血缘及其适用的场景。
二、基于血缘的应用
基于血缘的应用很多,重点介绍一下如下三个(分别对应质量、提效、运维场景)
1. 模型评估:介绍如何基于血缘数据评估数仓的建设质量;在治理过程中,如何高效、可靠地完成大规模的数仓模型切换。(模型优化&模型切换)
2. 字段口径探查:介绍如何基于血缘,探查某个字段的加工逻辑,支持穿透到上游ODS模型,能够减少80%的代码阅读量,并且提供一种可视化代码展示方式。(代码逻辑可视化&字段口径探查)
3. 影响面评估:① 如何利用字段血缘评估变更的影响面;② 如何及时、准确地将上游变更影响周知到关联方。
听众收益:
1. 数据全链路血缘如何采集、加工、存储?
2. 如何衡量血缘建设质量?
3. 抖音电商是如何通过数据血缘,帮助用户节省80%的sql阅读量的?
4. 抖音电商是如何在高速发展的过程中,快速完成2W+任务切换?
个人介绍:邓伟洪,马上消费金融AI研究院副院长,作为主要研究人员参与 OpenCV等开源项目的研发工作,长期致力于多模态大模型和计算机视觉系统的理论研究和实用化落地,在 CVPR、TPAMI 等顶级会议和期刊上发表100多篇文章,谷歌学术引用15000多次,曾获北京市优秀博士学位论文奖、北京市科技新星项目、国家级青年人才项目,2023年入选斯坦福“全球前2%顶尖科学家”和科睿唯安“全球高被引科学家”榜单。
演讲题目:“天镜”大模型与多模态金融场景
演讲提纲:多模态技术可以将不同类型的数据(如文本、图像/视频、语音等)进行整合,并利用大模型对数据进行理解和生成,在金融场景有广泛的应用。本报告将介绍马上消费金融的“天镜”大模型的关键技术与实践应用,同时展望未来多模态的广阔应用。例如,可以利用图像和语音识别技术对金融场景情况等进行监测和评估,从而提前预警潜在的风险。结合文本分析和情感分析等技术对市场情绪进行预测,帮助投资者做出更准确的决策。利用语音识别和自然语言处理技术对交易的语音通话进行实时监测和分析,从中提取出有用的信息,辅助决策和发现潜在的违规行为。
听众收益:
1. 多模态大模型的关键技术与应用
2. “天镜”金融大模型的关键技术与实战应用
3. 多模态大模型的金融应用场景
个人介绍:邓亚峰,毕业于清华大学,二十年人工智能算法及产品研发经验,现任碳硅智慧创始人兼CEO。他曾任360集团副总裁、人工智能研究院院长兼搜索事业部总经理,科创版第一家人工智能上市公司格灵深瞳CTO,北京人工智能产业联盟副理事长等职务,曾获2021年中国人工智能年度十大风云人物称号、教育部技术发明奖二等奖。他带领团队在AIDD、计算机视觉、多模态大模型、机器人、智能搜索等领域做出过创新成果或先进产品,多次在国际国内主流人工智能评测中获得过第一名,累计申请发明专利140余项(已授权98项),发表论文50+篇。
演讲题目:基于生成式AI和预训练大模型打造分子设计平台
演讲提纲:介绍2021年后生命科学领域结构预测、生成式AI和预训练模型方面的最新技术进展,结合碳硅智慧实践,简介基于生成式AI和预训练模型在对接、成药性预测、分子生成优化等方面的领域前沿技术,以及基于这些技术打造的一站式数据驱动创新药研发平台,以及平台在实际场景中的验证情况。
听众收益:
1,了解生命科学前沿AI技术;
2,了解AIDD最前沿的工具平台的发展现状和未来趋势;
3,了解基于AIDD平台进行药物设计的最佳实践;
个人介绍:京东零售数据应用工程师,架构师,北京大学硕士。在大数据处理,分析,应用,架构等有丰富的实战经验。现负责京东零售数据资产的标准制定以及指标中台的建设。
演讲题目:京东零售的指标中台建设
演讲提纲:京东零售从2022年开始指标中台的建设,来解决口径有歧义,存算不受控,开发效率低,指标难共享等问题。期间结合京东零售多种运营视角、多种组合计算、多种销售属性等特点,分别在查询层,语义层和加速层进行了创新,这个过程中基于 RBO、HBO 等多级加速引擎、基于代价与场景消费的智能物化策略、基于 One Metric 的异构融合服务、基于 One Logic 语义层的离近在线转换,显著提升业务数字化决策效率。
1. 背景介绍
a) 问题和痛点
b) 建设目标
2. 指标中台建设
a) 语义层建设-数据知识系统化,使资产放心好用、治理有依据
b) 查询层建设-统一查询语言,最佳查询策略、最优查询性能
c) 加速层建设-基于数据消费行为、系统内置规则自动加速
3. 应用实战案例
a) 通用域指标建设-离近在线转换
b) 专属域指标建设-切分资产扩维
4. 总结与展望
听众收益:
1. 了解京东零售的数据治理思路和经验
2. 了解如何基于现状,在有历史包袱的情况下搭建指标中台,以及在建设过程中遇到的问题
3. 了解如何如何从海量的数据模型与数据指标中提升检索数据的效率,降低数据存算的成本,提供更可信的数据内容和多种应用模式快速支撑业务的数据决策与分析
个人介绍:12 年数据业务从业经验,历任阿里集团淘宝商业分析负责人、阿里音乐商业智能中心负责人、蚂蚁集团用户增长分析与洞察产品负责人。在数据体系搭建、数据分析、用户标签建设、用户洞察、用户增长等方面,拥有丰富的数据驱动业务实践经验。
演讲题目:第三代指标平台如何摆脱 ETL 宽表开发 做“轻”数仓
演讲提纲:
1. ETL 的原罪与 NoETL 的全新思路
2. 第三代指标平台如何实现集市层 NoETL?
3. 第三代指标平台的能力与价值
4. 做“轻”数仓, 第三代指标平台案例实践
听众收益:
1. 企业管理层和业务人员:如何借助自动化指标平台实现更加灵活、高效、准确的数据洞察
2. CDO:指标“管、研、用”一体,真正兼顾敏捷分析、数据有序、成本可控、语义资产沉淀与复用
3. 数据工程师:做“轻”数仓,数据集市层 NoETL,不再疲于应对大量的报表开发
个人介绍:目前负责汽车之家的大模型和基础AI技术。曾任职于雅虎、百度、腾讯、爱奇艺等多家头部互联网公司。有多年的AI产品技术管理经验,曾任腾讯新闻产品技术部算法中心总监,爱奇艺智能分发部高级总监。2007年毕业于中科大-微软联合培养博士项目。曾任SIGKDD, SIGIR, AAAI, WSDM等多个国际会议的程序委员会委员。
演讲题目:汽车领域大模型建设和数字化营销应用
演讲提纲:
1. 汽车领域基座大模型建设
2. “仓颉”大模型多模态扩展
3. “仓颉”大模型应用平台框架
4. 大模型基础上的AIGC引擎
5. B端C端数字化营销案例
听众收益:
1. 了解垂类领域大模型的建设过程、难点和特点
2. 如何在垂直领域内有效落地大模型应用
3. 了解汽车数字化营销中的具体落地案例
个人介绍:复旦大学博士后,毕业于复旦大学软件工程专业。主要负责的工作内容:AI4DB(包括NL2SQL以及查询可解释性问题),NLP传统研究任务(包括机器翻译、语义解析等),以及大模型相关技术(包括提示工程、参数高效微调、工具学习、模型量化剪枝等)。发表论文:在国际会议期刊ICDE、KBS、WISE、WWWJ等发表论文7篇。
演讲题目:数据库系统的自然语言交互方法探索
演讲提纲:为数据库提供自然语言的查询方式能够有效地增强传统数据库的可用性。通过此查询方式,用户能够在不熟悉数据库查询语言,以及不了解底层数据存储结构的情况下,直接通过日常使用的自然语言提交查询请求,从而获取数据库中的相关数据信息。近年来,随着机器学习技术的快速发展,尤其在自然语言机器翻译技术上取得的显著进步,越来越多的翻译方法被相继提出。在此基础上,我们从数据库的角度出发,在数据库的自然语言交互方法上也进行了一系列探索。
听众收益:
1. 除了通过传统序列到序列的翻译方法解决NL2SQL问题,是否还有其他方法?
2. 如何利用更可靠的排序机制,获取更可靠的翻译结果?
2. 如何能够指导大模型更好地生成可靠的SQL语句?
个人介绍:18年加入平安,目前负责平安产险数据智能应用落地及相关工作。
演讲题目:核保风控领域的大模型应用
个人介绍:本科毕业于上海交通大学电子系,随后取得香港中文大学信息工程博士学位,毕业后加入新加坡高级数字科学中心(美国伊利诺伊大学在新加坡的研究所)从事科研工作,在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前,傅正佳曾在新加坡科技公司Bigo Technology担任机器学习研发总监。
演讲题目:Alluxio AI|新一代AI/ML训练中台的数据I/O解决方案
演讲介绍:在以数据驱动的AI时代,高效访问存储中的大量数据对于模型训练和服务至关重要。然而,I/O 挑战往往会阻碍性能并限制 GPU 的利用率。本次分享,我们将介绍基于 Alluxio 构建的高性能数据访问层,如何克服 I/O 挑战并显著提高 GPU 利用率。通过丰富的用户案例和实验数据,您将了解在Alluxio中缓存数据集和模型的方法,将有多大幅度的性能提升。
演讲提纲:
1. 介绍常见的 I/O 挑战及其对 GPU 利用率和整体性能的影响
2. 如何将高性能数据访问层无缝集成到 ML 工作流中,以减少 I/O 开销
3. 提高AI工作负载性能的缓存策略
4. 增强数据访问和加速AI工作负载的未来方向
5. 行业应用案例分享
听众收益:通过此次分享,与会者将深入了解到由数据驱动的AI工作负载所带来的 I/O 挑战,并了解如何将 Alluxio 作为一种有效解决方案加以利用。我们将重点分享来自Meta、Uber、Shopee、知乎等用户的实践经验、探讨我们的方法对 GPU 利用率和整体性能的影响。
个人介绍:中国科学技术大学硕士毕业,曾就职于华为,2020年加入 Soul,组建视觉算法团队,主要负责视觉生成,多模态理解,虚拟数字人相关工作。
演讲题目:Soul 基于 AIGC 的实践与探索
演讲提纲:
1. 新时代的 AIGC 浪潮发展
2. Soul 在 AIGC 的各领域探索与实践
3. 领域垂类的优势构建与思考
4. 未来技术方向的发展与探讨
听众收益:
1. 社交领域的 AIGC 落地经验
2. 如何结合当前业务需求与技术变革
个人介绍:从事数据一线工作多年,先后在 ebay,携程从事数仓、数据分析、数据产品工作,目前在B站实践 DAMA 数据治理,负责过数据质量、数据成本2个主题 ,参与了B站的数委会、数据治理平台、元数据数仓建设、数据资产归属等一系列数据管理能力提升的项目活动。
演讲题目:B站基于数据治理运营框架的应用实践
演讲提纲:
1. 资源风险案例分析
2. 治理运营虚拟组织建设思路
3. 嵌入式治理的实施方案
4. 基于数据治理的元数据管理流程
5. 数据质量运营框架 与 2线6问
听众收益:
1. 从一线数据运营视角观察数据治理,理解数据治理、数据管理、数据运营的关系和异同点
2. 获得一套已经在应用中的元数据模型,支持数据治理工作开展、评价得失
3. 借鉴一次 DAMA 方法的落地应用,在开展其他主题的数据管理工作时有迹可循
个人介绍:易慧智能技术VP,中科院软件所硕士,先后任职于微软、阿里、百度等国内外知名互联网公司,有多年的搜索引擎、人工智能相关领域的研发和管理经验。近年来专注于大模型在垂直领域的落地应用,年初联合清华大学自然语言实验室、面壁智能发布大模型驱动的汽车行业群体智能技术白皮书,带领团队研发YiAgent群体智能协作平台。
演讲题目:基于大模型的群体智能解决方案
演讲介绍:伴随着大模型(LLM)和智能体(Agent)技术在各行各业的落地应用,基于多智能体的群体智能解决方案更是为企业带来了前所未有的效率提升和价值创新。在本次分享中,我将介绍群体智能解决方案的技术实现,包括行业大模型的训练和优化、智能体的设计和开发、群体智能的协作机制等。同时还有我们在群体智能生态建设和落地应用中的一些思考和实践,以及对群体智能解决方案未来发展的展望,包括技术的进一步优化、应用的更广泛拓展、生态的更深度融合等。我相信,随着大模型技术的不断发展和群体智能解决方案的不断完善,我们将能够在更多的场景中实现智能化的管理和服务,为企业的发展提供更强大的支持。希望通过本次分享,能够帮助大家更深入地理解群体智能解决方案,也希望能够激发大家对于大模型技术和群体智能的研究和应用的兴趣。期待与大家的交流和探讨。
演讲提纲:
1. 群体智能解决方案概览:自底向上依次是行业大模型、单智能体(Agent)、群体智能协作、场景应用
2. 群体智能协作平台:详细介绍群体智能相关的技术实现
3. 群体智能生态及落地应用
4. 后续展望
听众收益:
1. 了解智能体如何设计和开发
2. 了解多个智能体如何协同完成一个复杂任务
3. 了解群体智能相关生态,寻找你在其中的定位
个人介绍:洪思睿,DeepWisdom团队NLP&AIGC方向算法负责人。前智能控制上市企业NLP团队负责人,牵头千万级行业知识图谱及多项自然语言处理技术的应用落地;在DeepWisdom负责包括法律、物流、美妆、电商等多个领域的知识问答,搜索系统、多模态应用等行业落地;开源多智能体框架MetaGPT一作;NeurIPS AutoDL 顶级竞赛世界冠军,相关工作/论文发表于TPAMI顶刊。
演讲题目:MetaGPT:重塑自然语言编程,多智能体引领代码生成与协同的革新探索
演讲提纲:介绍多智能体编程框架MetaGPT,讲述如何通过自然语言进行智能体编程,高效实现智能体协作能力和代码能力提升,探索多智能体设计&开发创新之路。
1.MetaGPT:多智能体框架介绍
2. 基于自然语言编程,探索智能体能力增强
3. 协作与自我提升:SOP嵌入与递归式能力提升的探索
听众收益:
1. 深度解读前沿多智能体框架,了解智能体设计开发实践
2. 如何增强智能体的代码能力和推理能力,支持复杂工具使用
3. 如何设计多智能体协作模式
个人介绍:知乎舰桥平台研发 Leader,知乎舰桥平台是:面向内容运营、用户运营、活动运营、创作者运营、场景运营(热点&热榜&话题&推送等)、生态分析等业务场景搭建的一站式平台。其中包含内容&用户管理和运营平台、内部营销平台(活动引擎&搭建&分析&投放平台)、内部投放和资源管理平台、创作者管理平台、DMP平台、内容池平台、经营分析平台、场景运营平台等等,全方位赋能业务运营和业务发展。
演讲题目:知乎 DMP/CDP 平台的应用和实践
演讲提纲:数据驱动的时代正在全速向前,如何利用 Data Management Platform(DMP)和 Customer Data Platform(CDP)成为企业竞争力提升的关键。本次分享中,我们将深入探讨这两者在知乎的应用与实践。从其背后的业务逻辑出发,揭示知乎如何运用DMP/CDP驱动用户增长,提升内容定制、广告系统的精准度。同时,我们将揭示架构的设计思路,平台如何有效地落地运作,并分享在这一过程中遇到的技术挑战以及我们是如何解决它们的。最后,将扫描未来的趋势,对企业如何布局数据管理提出前瞻性的见解。无论您是产品还是研发,本次分享都将为您带来独到的洞察力和可行的建议。主要内容包括:
1. 业务背景
2. 平台的架构和设计
3. 难点和技术挑战
4. 未来趋势和展望
听众收益:
1. 通过 DMP(CDP)平台,为公司可解决哪些问题?
2. 平台的建设和落地中遇到的难点和挑战?
3. 不同业务场景下的问题如何解决?
个人介绍:博士毕业于亚利桑那州立大学计算机系,本科毕业于同济大学计算机系,曾就职于亚马逊美国搜索部门,阿里飞猪搜推算法部门,目前在阿里巴巴企业智能事业部。主要研究方向为大模型应用、搜索与推荐技术、图数据挖掘,在人工智能相关的顶级学术会议和期刊上发表论文30余篇。个人主页: https://turingcat.me/
演讲题目:大模型时代企业智能数字化办公的探索
演讲提纲:企业内部大量的应用、文档和工作流为企业数字化转型提供了大量的数字原油,然而由于缺乏有效的通信和信息共享仍然难以有效转化成宝贵的用于决策的燃料油。AI大模型以其惊艳的生成和推理能力,是这个时代企业跨越新数字鸿沟,消灭数字时代鲍莫尔成本病的引擎。 本次演讲将介绍我们打造员工和企业智能交互界面的尝试,利用大模型帮助员工高效地找信息(找人、找应用、找知识、找服务、办事)和找产品,达到有问必答,问题终结。我们会阐述我们的技术选型(通过检索增强的方式帮助大模型理解企业内部的知识),数据闭环(数据清洗,标注、反馈、微调、评估、回流),大模型微调(SFT和RLHF阶段的数据探索)。 具体包括:
1. 企业的数字化转型的背景介绍
2. 企业的数字化转型的问题和挑战
3. 企业智能数字化办公的技术方案(大模型整体架构、微调、评测)
4. 大模型赋能办公的展望
听众收益:
1. 了解大模型在企业内部落地的具体业务应用
2. 开拓一些新思路,用新方法如何解决传统的一些企业办公问题
3. 目前领域相关的挑战,以及大模型应用的未来的展望
个人介绍:李凝瑞(薯名:再兴),硕士毕业于华中科技大学,现就职于小红书存储&数据库组,现负责分布式数据库的架构演进,设计与研发。曾就职于百度,是自研图数据库HugeGraph的核心创始人之一,HugeGraph现已开源并贡献给Apache社区。
演讲题目:小红书图数据库在分布式并行查询上的探索
演讲提纲:图数据库概念从提出至今已有几十年,图数据库产品的大量出现也已快有10年,但很多互联网公司的在线业务上仍然只使用了图数据库的两跳及以下的查询能力,究其原因就是三跳及以上查询的时延无法满足在线业务的要求,故不得不放弃或另寻他法。小红书图数据库团队分析原查询模式上的弊端,提出了一些优化点,并着手将分布式并行查询的思想应用至图数据库上,对此进行了一些探索实践,验证了此方案是能显著提升多跳查询的响应时间的。
听众收益:
1. 为什么在线业务上需要图数据库,为什么需要低时延的多跳查询?
2. 传统图数据库中原有的查询模式存在什么问题,有哪些可以优化的点?
3. 如何将图数据库与分布式并行查询进行结合?
个人介绍:李少春先生现任云南白药数字战略科学家、智慧科技业务单元(BU)总经理,CIO。专注于 医疗行业专业场景和前沿数字化技术的深度融合,在大健康领域拥有深厚行业实践经验。持续专注于 大数据分析、人工智能、云计算、物联网等多个领域前沿研究和创新,推动全球创新合作的战略和执 行,推动 AI 科技和生态系统创新解决方案,助力医疗和生命科学行业企业的完整价值链的数字化重 塑进程,为其提供做出关键医疗、临床、运营和创新决策所需的洞察力,使企业和组织能够利用领先 技术实现可信的数字化智慧医疗平台转型。李少春先生致力于打造智慧医疗健康创新生态。深度和临床医生、研究人员、数据科学家、 政府机构、业界思想领袖以及医疗大健康产业生态企业深入链接和合作,致力于将数据、技术和业务 整合实现数智化重塑。李少春先生多次作为行业领袖受邀在全球和国内人工智能、医药研发、医疗和 相关产业科技大会发表洞见演讲。李少春先生就读长江商学院和北大光华高管学院,荣获北京大学工 学院、E 药经理人等行业专家理事。历任 IBM 大中华区医疗和生命科学行业总经理,前 IBM 大中华区沃森健康(Watson Health)总经理,IBM 中国研究院研究技术创新总监,IBM 发明大师(超过 60 项全球专利),获 得 15 项 IBM 年度全球研究科技成就奖,其中 3 项为杰出成就奖项,屡次荣获 IBM 全球杰出业 务奖、技术奖、经理人奖。
演讲题目:大模型时代的数字医疗和数智医药转型创新
演讲提纲:数字化1.0阶段的效率提升主要依靠将线下的业务行为搬到线上,利用业务数字化工具提升业务运营的效率。数字化2.0阶段聚焦全域业务数据分析带来的效率,实现企业“上帝视野”数据驱动的管理和经营。数字化3.0阶段是超级自动化的效率实现,是把行业和产业链的外部数据和企业的内部数据链接在一起;把过去和现在的数据链接在一起;把企业执行数据和企业经营结果数据链接在一起;把消费者需求数据和产品研发生产数据链接在一起。在AI大模型的时代,企业的决策不再是靠经验和普世的规则,而是依靠全链条的数据洞察、机器学习和AI判断,结合外部的生态链和行业的洞察实现自动化,是企业超级自动化的新效率时代。大模型重新定义了人工智能的新可能,促进AI应用规模化落地,对医疗医药行业领域赋能更深,将促进未来企业管理模式和用户互动模式的进步和改变。AI工具和数字化手段,将作为重要的“工具创新”和“能力建设”途径,为企业推动数字化转型装上强大的增长引擎。
听众收益:
1. 科技数字化新范式,企业发展新机遇
2. AI 大模型时代带来的数字医疗的新机会
3. 医药企业数字化转型和中医药产业链创新
个人介绍:李枭冰,硕士,抖音集团电商数据架构师,专注于实时任务开发、运维、治理流程化工具化平台化自动化体系化改造。
演讲题目:基于存储的近实时数仓架构在字节的应用
演讲提纲:
1. 字节实时架构的演变
2. 基于存储的准实时架构在平台侧、引擎侧的挑战与实践创新
3. 直播、短视频业务在基于存储的实时数仓架构的实践
听众收益:
1. 字节在基于存储的实时数仓的最佳实践
2. 通过存储实时数仓架构,简化了开发,降低了资源消耗
个人介绍:清华大学电子工程系长聘副教授,教育部长江学者。长期从事城市科学与城市模拟相关研究,在Nature 子刊等高影响力综合期刊发表论文数篇,发表学术论文100余篇(CCF-A类70篇),被引超过20000次,连续两年入选科睿唯安"全球高被引科学家", 10篇论文入选ESI前1%高被引论文;申请专利35项、已授权12项。入选国家"万人计划"青年拔尖人才计划、科协青年人才"托举工程"、获IEEE通信学会亚太杰出青年学者奖、教育部科技进步一等奖、湖北省技术发明一等奖、电子学会科技进步一等奖、电子学会自然科学二等奖、吴文俊人工智能科学技术奖优秀青年学者奖。
演讲题目:基于大模型 Agent 的城市社会经济系统仿真模拟
演讲提纲:
1. 城市仿真模拟背景
2. 基于大模型 Agent 的仿真模拟的优势与特色
3. 基于大模型 Agent 的城市社会经济系统
听众收益:
1. 大语言模型 Agent 与模拟仿真
2. 城市社会经济仿真系统
3. 大语言模型 Agent 与社会科学
个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据治理与挖掘等。在领域主流期刊和国际会议上发表论文近200篇,主持十余项国家和省部级科研项目。
演讲题目:大模型驱动的数据清洗与数据合规技术展望
演讲提纲:我国高度重视数字经济建设,数据成为重要的生产要素之一。在持续推动数据要素市场发展的进程中,数据治理成为释放数据要素价值的重要瓶颈。传统的数据治理技术受限于小模型的建模、表达与泛化能力,难以应对复杂动态的数据市场环境下来自百业千行的领域数据治理需求。大语言模型因其对现实世界的强大建模能力和良好泛化能力,为数据治理技术带来重大革新契机。然而,基于大模型的数据质量和数据合规治理研究方兴未艾,充满机遇与挑战。如何构建安全可信的大模型用于数据治理?如何让大模型助力真实复杂场景的数据清洗?如何利用大模型辅助领域数据的合规性检查?如何提升大模型对数据治理的决策规划能力?针对以上问题,本此分享讲者将做一些深入的分析和探讨,并展望以大模型为驱动核心的智能数据质量与合规治理技术的研究。
听众收益:
1. 数据清洗与数据合规的难点以及大模型带来的契机;
2. 大模型驱动的数据治理技术的整体思路与研究框架;
3. 大模型驱动的数据清洗和数据合规的可能技术方案。
个人介绍:梁家卿博士,复旦大学大数据学院青年副研究员,主要研究方向为基于知识图谱与大模型的认知智能。在国际顶级学术会议与期刊(包括TKDE,AAAI,IJCAI,ICDE等)发表论文50多篇。在应用落地方面,作为技术负责人研发并公开发布了多个知识图谱与大模型应用平台如CuteGPT、Emo-CuteGPT、CN-DBpedia、ProbasePlus、CN-Probase、“不倒翁”智能问答等,相关产品API被工业界与学术界多家单位已调用累计17亿次以上,并形成了16个专利。有成功训练百亿参数量级别模型的经验和在大规模集群上训练千亿参数量级别模型的经验。先后在国际性的“知识库构建”比赛中荣获第二名;在中国计算机学会和中国中文信息学会的主办的语言与智能技术竞赛“信息抽取”比赛中荣获第一名。主持研发的情感增强大模型 CuteGPT 在上海卓辰信息科技有限公司(帮助其情报信息知识抽取准确率达到 90%以上)、上海双地信息系统有限公司(帮助其开发了内容管理产品“小孔商业智能AI助理”)、上海光唯文化传媒有限公司(应用于其客户在新产品研发业务,新产品销售额超过千万元)等单位实现了落地应用。并且曾获ACM-ICPC区域赛金牌、TopCoder Open全球前150名、吴文俊人工智能科学技术奖科技进步奖三等奖、上海市优秀博士毕业生、上海市计算机学会优秀博士论文、华为云最佳论文复现奖、复旦大学超级博士后、上海市超级博士后、中国博士后科学基金面上资助、国家自然科学基金青年基金资助。
演讲题目:大模型的持续能力提升
演讲提纲:当前大模型在发布一个版本以后,往往需要大量的专家进行评估、数据合成和继续优化以发布下一个版本。这一模型迭代过程的时间长、人工贵、结果难以估计、无法稳定获得提升。而且,其中模型的评估和能力提升往往过于领域限定,难以推广到模型通用能力的提升。事实上,授“人”与鱼不如授“人”以渔,模型的提升需要更多的原理指导和对其自身学习能力的依赖。因此,我们的核心目标是:如何简化(自动化)大模型的持续能力提升流程?为了达到这一目标,我们从以下三个方向进行了一些研究:
1. 分析模型能力获取和增强的原理作为指导
=> 模型能力体系产生与强化机理
2. 自动收集和筛选最“有效”的语料
=> 模型继续训练中的语料处理
3. 基于模型自身的元能力进行自我迭代
=> 模型的元能力激发
个人介绍:本科/博士毕业于浙江大学,2020年加入阿里云机器学习平台 PAI,先后参与了平台的 Workflow、算法训练、SDK 的产品设计和开发,目前主要专注于平台的 MLOps 能力建设。
演讲题目:阿里云 PAI 大语言模型微调训练实践
演讲提纲:大语言微调训练是提升模型应用性能的关键手段,直接上手微调一个大语言模型并不是一件轻松的事情,本次分享主要围绕以下主题展开:
1. 模型微调训练适用场景和常用方法。
2. 微调训练实践,包括数据准备、模型和微调算法选择、微调模型评估等。
3. 通过 “PAI-QuickStart” 一站式完成模型的微调训练、评估和部署。
个人介绍:林昊,2014年毕业于电子科技大学,2016年加入招联金融,拥有十年人工智能技术产业落地经验,主要研究方向包括大模型、人机交互等。
演讲题目:金融垂直领域大模型的训练与应用探索
演讲提纲:
1. 招联智鹿金融大模型简介
2. 金融大模型的训练方法
3. 大模型的落地应用探索
4. 大模型训练与应用展望
听众收益:
1. 了解企业自研大模型遇到的问题与训练方案。
2. 了解当前招联金融在大模型技术的探索与应用。
个人介绍:复旦大学基础数学硕士,10年以上汽车行业AI从业经验,在大语言模型、运筹优化和机器学习领域有丰富的实战经验。
演讲题目:有序多址城市旅行商问题的路径规划策略与优化
演讲提纲:
1 首先会介绍运筹优化场景和有序多址城市旅行商问题
2 再探讨该问题的演进和求解策略
3 再分享优化改进方法和效果
4最后对运筹优化实战中的难点和对策分享
听众收益:
1 了解运筹优化场景和常见求解方法
2 了解求解有序多址旅行商问题的实战策略
3 了解运筹优化实战中难点与对策
个人介绍:2012年硕士毕业加入百度,一直从事推荐系统相关的架构工作。目前是百度信息流推荐系统后端架构的技术负责人,负责推荐内容架构及其存储与索引相关的架构工作。
演讲题目:大模型背景下的对话式推荐实践
听众收益:
1、推荐系统架构
2、大模型背景下的推荐系统新业务形态
个人介绍:拥有6年大数据运维经验,加入沐瞳来,一直负责沐瞳大数据运维工作,主要担任沐瞳大数据运维体系建设,在 AWS 云上运维成本优化有显著成果。
演讲题目:大数据架构优化之沐瞳出海实践业务分享
演讲介绍:介绍沐瞳大数据架构在出海业务上设计和优化,对 AWS 服务使用上的经验分享,对 AWS 云上成本优化和架构设计实践方案分享。
演讲提纲:
1. 沐瞳海外业务大数据架构
2. AWS S3 存储方案设计
3. 基于 S3 存储存储清单和访问日志做存储分析
4. 基于存储分析做 S3 分层存储策略优化及成果
听众收益:
1. 海外游戏业务大数据架构设计
2. AWS 云上管理架构方案
3. AWS S3 优化方案
个人介绍:多年百度搜索、大数据工作经验,专注于自然语言处理方向,曾获 CCKS 中文知识图谱大赛第一名。目前于阅文集团担任 AIGC 负责人职位,负责大模型、多模态、产研落地与知识管理与评估等多个团队工作。
演讲题目:AIGC 垂类落地实战
演讲提纲:
1. AI 生产 - 内容赛道面临的机会与挑战
2. AI 扮演 - 人们需要的到底是怎样的角色
3. AI 改编 - 从文字到视频,AI 理解的内容到底是什么
听众收益:
1. 内容来自于行业落地一手实践信息;
2. 公司 AIGC 转型后的落地风险与经验;
3. 大规模下 AIGC 实际应用带来的业务价值;
个人介绍:上海炎凰数据首席架构师及联合创始人,主要负责后端半结构化时序数据系统的研发。之前曾在Splunk等公司参与数据库CDC以及大规模数据采集等项目的研发。Apache Arrow Contributor。
演讲题目:JIT技术在数据系统中的应用:通过Gandiva实现数据计算加速
演讲提纲:
1. JIT即时编译技术
· 什么是JIT即时编译技术
· JIT技术的优缺点
· JIT技术的应用场景
2. 使用JIT进行数据库表达式求值
· 数据库表达式求值的一般方法
· 什么是表达式求值问题
· 常见方法如向量化/JIT/树遍历等
· 不同的数据库的解法
3. 使用Gandiva表达式编译器
· 介绍Apache Arrow
· 介绍Gandiva表达式编译器, LLVM及其工作原理
· 演示如何使用Gandiva进行表达式求值
4. 未来展望
听众收益:
1. JIT即时编译技术的基本概念以及为什么需要JIT
2. 数据库表达式求值方法
3. 如何使用Apache Arrow/Gandiva的JIT即时编译技术加速计算
个人介绍:毕业于美国卡耐基梅隆大学(CMU)计算机系,曾就职于硅谷 LinkedIn Streaming Infra 团队担任核心开发4年,回国后曾就职于腾讯 Wechat Infra,现就职于 RisingWave Labs,担任数据库内核存储团队 Tech Lead。
演讲题目:重新定义流计算:RisingWave 云原生流数据库
演讲提纲:
1. 什么是云原生流数据库
2. RisingWave 架构和设计理念
3. RisingWave 核心技术内幕
4. RisingWave 应用场景
5. 未来与展望
听众收益:
1. 如何借助 RisingWave 轻松上手流计算
2. 云原生架构下如何实现高效且低成本的实时计算
3. 如何以数据库的方式降低流计算的开发和运维成本
个人介绍:彭程,毕业于大连理工大学,现任抖音集团电商数据架构师,负责抖音电商数据治理相关工作,在数据治理、数据架构领域有一定涉猎。
演讲题目:抖音电商数据仓库治理实践
演讲提纲:
1. 概述
2. 电商现状解读
3. 电商发展阶段
4. 电商解决方案
5. 思考&展望
听众收益:
1. 如何做好大体量数据下的治与理
2. 治理回归到本质是什么
3. 治理未来的方向在哪里
个人介绍:小米小爱同学团队高级算法工程师,担任大规模语言模型的训练、推理与应用工作。
负责并研发多项语音助手场景中的深度学习算法落地工作,搭建算法框架助力小爱同学体验升级。
在语义理解、对话管理与信息检索等方向有丰富经验,相关成果发表于ACL、NAACL等刊物。
演讲题目:Agent技术在语音助手场景中的应用
演讲内容:
搭建以大模型为核心的Agent框架,从而解决语音助手场景中更加复杂多样的需求。通过Prompt设计、信息检索、与RAG等流程,实现性能出色、表现稳定的Agent能力。
演讲提纲:
1. Agent整体框架与基本原理
2. 语音助手场景下的Agent应用
3. 未来进一步优化方向
听众受益:
1. 了解Agent基本原理
2. 了解Agent在工程落地时的潜在问题与解决方案
3. 了解Agent在进一步优化时的可行方向
个人介绍:2017年硕士毕业于复旦大学计算机学院DasLab;毕业后先后在PayPal、字节跳动履职,从事大数据相关工作;2021年加入小红书数据平台部,负责实时湖仓团队的工作,聚集于OLAP、数据湖、计算引擎等相关技术的探索与实践落地
演讲题目:实时湖仓架构在小红书的探索与实践
演讲介绍:结合小红书的线上真实场景及需求,分享小红书基于OLAP及数据湖技术的架构选型、核心优化及落地效果
演讲提纲:
1. 小红书湖仓架构的演进历程
2. 核心优化及落地效果
3. 未来展望
听众收益:了解如何利用StarRocks、Iceberg等技术对数据生产及查询进行降本增效
个人介绍:曾在世界五百强企业担任大数据架构师,数据团队负责人等职务,比较擅长为企业提供数据领域的解决方案。
演讲题目:辛选集团数据中心建设之路
演讲提纲:
1. 辛选集团简介
2. 在辛选的数据价值与定位
3. 数据平台和数仓搭建
4. 数据产品和指标体系的搭建
5. 数据分析体系的搭建
6. 数据赋能直播业务案例
7. 赋能中反哺数据治理
个人介绍:2016年武汉大学概率与数理统计专业硕士毕业后入职腾讯金融科技风控与反洗钱部门,7.5年风控与反洗钱经验。主要负责支付合规与反洗钱可疑交易监测模型相关工作。
演讲题目:基于图计算的反洗钱可疑交易监测实践
演讲提纲:在移动互联网高速发展下,网络犯罪呈现高发态势,洗钱手法不断更新,且呈现出团伙性、组织性、隐蔽性等愈发明显的特征,财付通提出基于图计算的可疑交易监测方法,以能够识别出具有高价值的可疑线索。本演讲将从客户关系图谱构建、图计算方法应用、实践案例剖析等为大家讲解如何搭建基于图计算的可疑交易监测体系,来全面提升可疑交易监测识别效果。具体内容包括:
1. 可疑交易监测难点与挑战
2. 图计算体系框架
3. 图谱系统架构
4. 图计算应用实践
5. 总结与展望
听众收益:
1. 了解反洗钱可疑交易监测难点和挑战
2. 了解基于图计算的可疑交易监测体系
3. 了解关系图谱构建与图谱系统架构
4. 了解团伙挖掘与图表示学习的应用实践
个人介绍:阿里云DataWorks产品负责人,打造全链路数据开发治理平台支撑阿里巴巴集团与阿里云上众多客户的数字化转型。
演讲题目:阿里云DataWorks:新一代“Data+AI”数据开发与数据治理平台的产品演进
个人介绍:王朝坤,博士,博士生导师,2006年加入清华大学软件学院,现为长聘副教授、软件学院副院长。王朝坤博士的主要研究方向为数据库理论与系统,包括网络图等复杂非结构化数据的建模、采集、存储、索引、查询、分析与挖掘,并强调融合大数据技术解决社会安全和社交网络等关键领域中的实际问题。王朝坤博士为北京电子学会理事、北京电子学会软件专业委员会秘书长、中国计算机学会数据库专业委员会委员、中国通信学会通信安全技术委员会委员,已负责完成或在研基金类科研项目共计12项,并主持或参与多项企业委托科研项目。现有科研项目主要以图和社交网络数据管理系统为研究对象,围绕非结构化数据管理领域研究热点或大数据系统实际应用展开。曾主持完成的科研课题包括音频数据管理、潜在重要节点发现、泛数据查询处理、复杂条件社区发现、需求演化建模、制造业商务智能发展模式、大数据存储体系结构等项目。
演讲题目:大规模社交图快速生成方法探索
演讲提纲:在大数据时代,随着社交网络的日益普及,亟需大规模的社交图来评估各种社交网络分析任务的算法。因为对于各种场景,很难获得亿级规模的真实世界社交图,所以高效的、可配置的社交图生成方法变得比以往任何时候都更为重要。我们将介绍课题组近期提出的社交图的高效生成方法。
听众收益:
1. 社交图有什么特点?
2. 如何快速生成大规模社交图?
3. 社交图会演化吗?
个人介绍:字节跳动系统智能运维架构师,负责字节系统技术栈相关稳定性、成本优化产品、智能运维技术应用等工作。19年运维平台架构经验,15年DevOps实践经验,6年AIOps落地经验。
演讲题目:字节跳动系统智能运维实践
演讲提纲:
1. AIOPS 前沿与趋势
2. 大模型时代 AIOPS 新思考
3. 系统智能运维实践
3.1 传统 AIOPS 实践
3.2 大模型应用实践
4. AIOPS 研发效率提升实践
听众收益:
1. 运维大模型落地实践与挑战
2. 大模型可以给 AIOPS 带来哪些改变
3. AIOPS 场景落地如何提效?
个人介绍:现任京东健康智能算法部负责人,负责京东健康在医疗AI领域的技术创新和解决方案研发。IEEE Senior Member,毕业于浙江大学,主要研究方向在大规模语言模型和多模态学习,是医疗大模型京医千询的技术负责人和视频多模态大模型VICTOR的作者。具有10年以上人工智能的研发经历,在创新科技前沿具有丰富的实战经验并引领多项核心技术突破,覆盖大健康、电商、搜索引擎、内容推荐、互联网广告等多领域。
演讲题目:大模型趋势下的医疗人工智能
演讲提纲:
1. 对大模型和人工智能在医疗领域的重要性介绍
2. 大模型如何改变医疗诊断和治疗方法
3. 京医千询的技术实践
4. 对医疗实践和医患关系的影响与挑战
听众收益:
1. 对大模型技术的优势与挑战有深入的认识
2. 了解医疗人工智能技术的发展趋势
3. 引发听众对于跨学科合作、数据隐私保护、算法公平性等问题的思考,促进医学和技术领域的深度合作与交流
个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到3100余次,H-index达到29。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,自然语言处理专委会秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。
演讲题目:RAG 视角下的推荐系统:机遇与挑战
演讲提纲:当前推荐系统领域面临诸多挑战,如数据长尾分布、个性化推荐、多轮对话和冷启动推荐,而大语言模型的出现为推荐系统带来了新的机遇,两者融合逐渐成为下一代推荐系统的趋势。然而,单纯使用LLM用于推荐仍存在局限性,如个人信息利用不足、上下文长度受限、存在幻觉以及无法学习所有历史交互数据等问题。因此,引入知识检索增强(RAG)显得尤为必要,这有助于控制幻觉、减少对上下文的依赖、学习新知识并可以与传统推荐系统快速协同。本报告系统梳理了当前推荐系统的局限,LLM增强推荐系统的现状,RAG的技术路线、范式和其在增强推荐系统方面的应用,并阐述了在RAG视角下推荐系统的机遇和发展趋势。
听众收益:
1. 推荐系统的挑战以及目前大模型应用于推荐系统的局限性
2. RAG 的发展、关键技术和范式
3. RAG 应用于推荐系统的机遇和未来发展
演讲题目:基于多模态技术的保险智能理赔介绍
个人介绍:王宏志 哈尔滨工业大学计算学部长聘教授、博士生导师、计算机科学与工程系主任、海量数据计算研究中心主任、数据科学与大数据技术专业负责人,美国加州大学欧文分校博士后,微软亚洲研究院铸星计划访问学者,青年龙江学者,黑龙江省教学名师。其研究方向为大数据治理、大数据管理与分析、数据库系统等。在VLDB, SIGMOD等国内外重要会议和期刊发表学术论文300余篇,出版学术专著四本,其论文被SCI收录百余次,他引4000余次,授权发明专利35项。获得微软学者、中国优秀数据库工程师、IBM博士英才等称号,获得黑龙江省自然科学一等奖和教育部高等学校科技进步一等奖各一项,获黑龙江省青年科技奖、宝钢优秀教师奖、CSC-IBM奖教金。先后主持国家自然科学基金重点项目、国家科技支撑计划课题、国家博士后特别资助等10余个项目。中国计算机学会杰出会员,ACM SIGMOD中国秘书长、教育部高等学校计算机类专业教学指导委员会计算机系统专家委员会委员、中国数据库专业委员会常务委员、黑龙江省数据科学与大数据技术专业委员会主任委员、中国大数据专家委员会委员、哈尔滨工业大学计算学部校友会秘书长、ACM数据科学学科标准编写组专家、黑龙江省“头雁团队”成员。曾任哈尔滨工业大学英才学院副院长和中国计算机学会哈尔滨分部主席。个人主页:
http://homepage.hit.edu.cn/wang
演讲题目:大数据治理:大数据价值提升之路
演讲提纲:当前,释放数据要素价值成为数字经济的必由之路,但来自多源异构数据源的大数据价值释放需要确保大数据的高可用性,这对大数据清洗提出了要求,而大数据清洗带来了数据高熵、模态多样、错误共生等难题。本报告将对大数据清洗的概念和挑战进行了介绍,并展示大数据清洗技术方面的探索,最后加以总结,展望未来的工作。
听众收益:
1. 大数据的质量问题
2. 大数据清洗的核心挑战
3. 大数据清洗的解决方案
个人介绍:毕业于中国科学院大学,博士学历。曾任职于360系统部,担任离线计算组负责人。现任职于快手数据平台部数据引擎技术中心,负责离线生产引擎及数据湖研发。
演讲题目:Blaze:SparkSQL Native 算子优化在快手的大规模应用实践
演讲介绍:Spark作为当前离线生产场景的主力引擎,其性能提升对于企业数据生产链路的降本增效至关重要,用更底层的语言来开发向量化引擎提升性能则是近年来计算引擎的主流共识。Blaze是快手自研的基于rust和datafusion/arrow开发的Spark向量化执行引擎,经过持续的迭代优化,目前已经在快手内部得到大规模的推广应用并取得线上收益。本次分享将介绍Blaze的架构原理,在上线过程中遇到的各种问题及对应的深度优化措施,以及大规模上线应用的推广方案。
演讲提纲:
1. Blaze 的架构和原理简介
2. Blaze 的深度性能优化
3. Blaze 在快手的大规模应用推广
4. 当前进展及后续规划
听众收益:
1. 了解 Blaze 的架构与原理
2. 基于 Blaze 的深度性能优化
3. Blaze 项目当前进展及效果
4. 如何在快手生产环境中大规模应用实践
个人介绍:王文佳女士现任天士力国际基因网络创新中心总经理,负责天士力人工智能大数据药物平台——星斗云开发以及创新药物研发,专注中药等多靶点药物的信息整合挖掘及智能分析,发表论文影响因子150+,最高影响因子25,并拥有十余项专利等知识产权。药物知识图谱等方面获得数个国家级奖项以及多家媒体报道。平台现有创新药物管线进入临床三期。王文佳在上海交通大学毕业后在法国获得生物统计信息博士学位,师从人类基因组学先驱之一 Daniel Cohen 教授。曾在世界领先的法国AI药物公司 Pharnext 担任项目负责人,担任AI药物平台开发及市场拓展等职务。
演讲题目:星斗云:结合中药研发大模型的一站式中药数智研发平台
演讲提纲:
1. 中药研发的现状与数智化趋势
2. 华为共建数智中药研发大模型
3. 结合大模型的一站式中药数智研发平台
4. 大模型研发应用的展望
听众收益:
1. 了解中药数智化研发创新
2. 大模型在中药研发应用
3. 了解中药研发一站式计算平台
个人介绍:1688资深技术专家,现1688AI创新产品与应用负责人,专注在大模型与电商的深度结合领域。曾主导了1688运营数据化和智能化从0到1的平台建设,推动了1688电商内容化的算法及工程架构升级,孵化了平台的第一代终端智能交互技术产品。
演讲题目:AI Agent 在电商平台中的应用
演讲提纲:
1. AI Agent 对电商平台的价值
2. AI Agent 在电商的应用举例
3. AI Agent 的技术方案介绍
4. 实现 AI Agent 的关键要素
5. 部署 AI Agent 的挑战与机遇
6. 总结对 AI 发展的思考与期待
听众收益:
1. AI Agent 的典型应用场景
2. AI Agent 与传统研发范式的区别
3. AI Agent 落地的实践挑战
个人介绍:华东师范大学硕士毕业,有将近十年的机器学习应用实践经验,目前就职于携程,主要研究方向为智能化决策和大模型的应用
演讲题目:大模型在携程的探索与实践
演讲介绍:大语言模型的发展日新月异,其核心能力可以大致分为:生成、总结、提取、分类、检索与改写六大部分,我们结合实际业务场景探索了大模型在相关能力上的表现。本次分享将介绍大模型在旅游行业的落地应用,主要包含AIGC技术在内容营销领域的探索实践、多模态大模型在交互页面的应用以及开源大模型在客服场景提高人效的实践经验,会涉及到开源大模型的应用对比、大模型的微调实践以及不同推理框架的性能和效果对比总结。
演讲提纲:
1. 相关业务背景介绍
2. 结合具体场景探索大模型的核心能力
· 开源大模型的应用对比
· 大模型的微调实践
· 大模型推理框架性能以及效果
3. 相关的实践经验总结
听众收益:
1. 了解大模型的相关能力以及在各个场景的应用
2. 学习大模型的微调实践经验
3. 学习大模型的推理性能优化技术以及相关框架应用
个人介绍:我自2021年6月至今一直在eBay担任推荐算法Team Lead。在全站推荐业务中,我带领团队使用算法能力解决多个业务痛点,显著提高了eBay首页与商品详情页的GMV和广告收入。在之前的工作中,我曾在iQIYI爱奇艺公司担任高级机器学习工程师,领导了短视频推荐系统的开发,旨在提供高度个性化的视频推荐。我的学历背景包括香港大学计算机科学的本科与硕士学位,入选过院长荣誉榜(2011/12年,前10%),获得过宋庆龄奖学金。
演讲题目:eBay多模态与GNN商品嵌入技术:提升推荐系统效能与用户体验
演讲提纲:在本次演讲中,eBay的推荐系统专家将深入介绍他们创新性的多模态与图神经网络商品嵌入技术,旨在提升推荐系统的效能与用户体验。通过优化召回模块,整合多模态信息,以及运用图神经网络,演讲者将分享如何解决传统推荐系统中的挑战,提高推荐准确性,并展示这些技术在实际业务中如何根据用户痛点量身定制解决方案,为每一位用户创造更为个性化、精准的购物体验。
听众收益:
1. 如何使用算法能力撬动用户痛点的杠杆:深入讨论如何利用算法能力根据eBay业务实际特点解决用户痛点。通过演示多模态商品嵌入和GNN的应用,探索算法在推荐系统中的实际业务场景中如何精准地满足用户需求,提高购物体验,解决用户在推荐系统中可能遇到的问题,为业务实际特点量身定制解决方案。
2. 多模态召回模块优化:通过整合多模态信息,提升召回模块的准确性,解决单一模态在复杂情境下的推荐困难,为用户呈现更相关和个性化的推荐结果。
3. 图神经网络在推荐系统中的实践经验:深入探讨了GNN在构建用户-商品行为交互图上的应用,展示了GNN召回模型的在线实验结果,证明其在提升CTR和PTR方面的显著效果。
个人介绍:夏一楠,2018年硕士毕业于清华大学,2020年加入京东科技任算法工程师,负责京东金融产品风控反欺诈建模与应用。主要研究方向包括图算法,自然语言处理,异常检测。
演讲题目:大模型在金融风控领域的应用与展望
演讲提纲:
1. 金融风控领域的建模问题特点
2. 大语言模型及相关技术在金融风控领域的应用方向
3. 京东科技信贷及反欺诈大模型架构
4. 大模型技术落地应用的挑战
听众收益:
1. 了解金融风控领域建模问题及当前行业通用解决方案。
2. 了解 NLP 技术和大语言模型及其相关技术,在当前通用方案的优化点。
3. 了解当前京东科技在信贷反欺诈方向,对大模型技术的探索与应用。
个人介绍:谢飞,博士研究生,中再产险创新业务部资深承保师,百度人工智能AICA,百度人工智能技术专家,负责公司科技化转型和科技化业务落地工作。2011年加入中再产险,先后获得了上海市金融创新成果三等奖、上海金融改革发展成果一等奖、上海市金融创新先进个人、上海市青年金才等奖励,并担任上海航保协会创新专委会主任职务,设计并参与了上海航运保险指数编制、中再众安区块链再保险交易平台、上海再保险中心制度设计、中再智能条款库、“再 · 途”新能源车保险定价风控大模型、普惠型及行业示范型网络安全保险等工作。
演讲题目:AI 技术演进与商业落地:从学术探索到创业实践的全景观察
演讲提纲:结合近几年AI领域的技术变迁和细节(CNN ~ pretrain+finetuning ~ transformer ~ LLM)分别从 AI 学术、AI 产业化落地、AI 创业的不同角度谈谈其落地方式和建议。
1. AI 技术变迁的商业驱动背景;
2. AI 在铁谱图像识别方面的学术研究;
3. AI 在智能条款库和火灾识别方面的产品落地;
4. 总结与展望
听众收益:
1. 如何破解当下企业的智能化转型之痛?
2. AI 的前沿学术方向有哪些?
3. AI 学术、AI 产业化落地、AI 创业的不同细分落地方式分别是什么?
个人介绍:徐波博士,2018年毕业于复旦大学计算机科学技术学院,获计算机软件与理论专业博士学位。同年加入东华大学计算机科学与技术学院。研究方向为知识图谱、大语言模型和智能运维。代表性成果是创建了目前最大的中文开放知识图谱之一:CN-DBpedia,累计API调用次数超过16亿次。研究成果发表在IJCAI、ICDE、ICSE、CIKM、COLING、WSDM等顶级国际会议上,曾获中国数据库学术会议(NDBC 2014)优秀论文奖。入选“上海市青年科技英才扬帆计划”。主持及参与国家重点研发计划、国家自然科学基金等国家和省部级科研项目10余项。参与国家级一流本科课程建设。担任全国知识图谱与语义计算大会CCKS 2022领域主席及多个国际会议和期刊的审稿人。曾获CCKS 2020最佳审稿人。
演讲题目:基于大语言模型的运维代码理解及生成
演讲提纲:智能运维是人工智能赋能传统产业转型升级的重要应用场景,对我国数字经济发展具有重要意义。代码理解和生成是智能运维的核心任务,但当前技术在准确性和泛化性方面仍面临挑战。生成式大语言模型的兴起为解决上述难题提供了新的途径,但同时也面临着一系列新的挑战,包括领域适配困难、生成幻觉严重和推理成本高昂等。在本次演讲中,我们将探讨这些问题,并分享我们团队在运用大语言模型进行运维代码理解和生成方面的实践经验。
听众收益:
1. 大模型在运维领域的落地方式
2. 大模型与领域知识的结合方法
3. 大小模型协同的高效推理方法
个人介绍:百度主任架构师。百度信息流推荐系统负责人。在AI系统,云原生服务有十余年丰富业务架构经验。
演讲题目:AI 原生应用中的 AI Agents 探索与实践
演讲提纲:
1. AI Agents 介绍与发展
2. AI 原生应用中 AI Agents 系统探索
3. AI Agents 一线实践经验
听众收益:
1. 了解 AI Agents 系统架构设计
2. 学习大规模 AI 原生应用中 AI Agents 实践经验
3. 思考 AI Agents 系统在业界未来发展方向
个人介绍:2015年硕士毕业于浙江大学计算机学院,之后加入阿里巴巴,在AliExpress工作三年,主要负责APP运营和商家数据产品相关的数据工作,18年加入盒马,目前负责数据研发和数据服务团队,主要承担数据建模、数据服务平台、用户画像、商品标签、智能算法等相关工作。
演讲题目:零售行业商品竞争力提升的数据探索
演讲提纲:
1. 商品全链路竞争力提升的数据体系与思路,数据能力在商品流通各环节的核心方法和实践;
2. 系统化的数据管理与服务方法,打破商品全周期数据使用的壁垒,提升数据加工、流转和应用的效率;
3. 面向智能化时代数据架构设计的探索,对未来零售行业数据应用场景的设想与讨论。
听众收益:
1. 了解零售行业在品类规划、商品竞争力提升等方面的探索;
2. 理解零售公司对数据的管理和使用体系、方法与实践;
3. 探讨面向智能化时代,数据在组织、管理和应用的尝试。
个人介绍:浙江大学硕士毕业,曾就职于华为。2017年加入滴滴,一直从事数据中台建设,主要涉及数据开发、数据资产和治理以及数据服务等方向,目前主要专注于指标服务化和指标标准化建设。
演讲题目:滴滴指标标准化实践
演讲提纲:介绍滴滴指标标准化的背景,方案发展过程,以及指标标准化的方案的核心设计出发点,实现途径,以及生态建设。最后介绍指标标准化的后续规划。
听众收益:
1. 指标管理方案发展状况
2. 指标服务化的核心设计思路
3. 标准化建设的收益
个人介绍:2013年华中科技大学计算机学院硕士毕业。2014年加入美团数据组,深度参与美团Hadoop集群规模从百到十万级的架构演进。主要负责离线数仓生产、Adhoc查询、OLAP分析引擎与服务在美团业务场景的落地与演进。
演讲题目:美团OLAP引擎选型和演进实践
演讲提纲:OLAP被广泛应用在经营报表、商业分析、活动运营、风控等业务场景,本次演讲主要介绍美团OLAP场景的特点,OLAP引擎选型的思路和演进历程以及在性能优化方面的实践经验。
听众收益:了解互联网公司在生产环境下面临的不同业务场景及技术挑战,提供OLAP引擎选型思路和实践经验参考。
个人介绍:张博,云智慧CTO、中国通信学会专委会委员。张博先生拥有丰富的人工智能研究及行业领域实践经验;曾就职于微软亚洲研究院(Microsoft Research Asia),从事数据驱动的智能技术研究及算法工程化,其研发的智能算法已经在微软Excel、PowerBI等产品中落地应用;现致力于大模型技术在垂直领域特别是运维领域的商业实践,其带领研发的大模型产品已经在多家头部企业落地。张博先生毕业于清华大学,作为负责人完成工信部“新一代人工智能产业创新重点任务揭榜”项目一项;主导研发了智能运维领域首款算法SDK-Hours; 张博先生拥有国际专利4项,中国专利40余项目,发表多篇AAAI、ICLR等顶会论文。
演讲题目:基于多个头部客户案例解析大语言模型在运维领域的落地实践
演讲提纲:2024年是大语言模型技术落地元年,行业竞争必将从基础模型攻坚克难走向模型应用百花齐放。对于企业服务赛道,如何避免“拿着锤子找钉子”、避免“懂技术就是懂行业”、真正把技术突破与应用价值创造结合。本次分享嘉宾讲以“研究者”+“领域实践者”的双重身份解析在运维领域实际企业服务落地中如何实践大语言模型。
听众收益:
1. 大语言模型企业落地的挑战?
2. 对于大语言模型,除了基座模型,在应用层面有哪些值得研究的方向?
3. 端到端大语言模型落地范式是什么?
个人介绍:十多年大数据经验,曾在招行、阿里任职,现任抖音集团电商数据架构师,在数仓建设、数据平台工具等方面经验丰富。
演讲题目:抖音电商埋点与归因分析实践思考
演讲提纲:
1. 抖音电商埋点问题
2. 整体的解决方案介绍
3. 相关实践落地
听众收益:
1. 电商场景埋点对数据加工分析的影响
2. 如何建设高效的数归因分析能力
3. 埋点归因方案中的核心关键点
个人介绍:企业数智化领域10余年经验,先后就职于美团点评、阿里巴巴、菜鸟等大型互联网公司,对企业数智化转型、数智供应链、供应链金融等领域有深厚的积累沉淀。多次主导企业级数据中台和数智产品的实施,能够很好地将数智技术&产品与业务相结合,针对不同行业不同场景设计落地行之有效的数智化转型方案。目前负责菜鸟物流科技副总经理,带领团队深耕数智供应链领域,帮助企业级客户在数智时代打造领先的供应链能力。
演讲题目:数据在零售供应链领域的应用
演讲提纲:
1. 数据在供应链领域的问题和系统解决方案
2. 产品:基于数据构建供应链控制塔,解决信息流、商流、物流协同问题;
3. 业务:基于数据构建供应链金融科技,解决供应链资金流问题。
听众收益:
1. 对供应链领域的数据问题和系统解决方案加深认知
2. 了解供应链控制塔产品的构建逻辑和思路
3. 了解数据在供应链金融业务的应用
个人介绍:四川大学计算机硕士,具有多年搜索推荐场景的算法和工程实践经验,为数十家阿里云客户提供场景优化建议和效果优化。
演讲题目:推荐系统降本增效之路
演讲提纲:本演讲将阐述在降本增效的时代,如何通过工程化手段提升推荐系统建设效率,并分享真实业务案例。主要内容包括:
1. 通过推荐算法定制降低开发成本;
2. 通过组件化的模型搭建加快新的推荐模型的实验;
3. 通过模型训练优化和推理性能优化来降低离线训练和在线服务的成本;
4. 通过实验 AB 平台加快迭代速度。
NoETL,开启自动化数据管理新时代
阿里云大数据AI一体化最佳实践
大模型的行业落地:问题与对策
基于世界模型视角的通用人工智能探索
圆桌讨论:数聚垂域,智领未来
· 企业数智化过程中,如何协调新技术与旧体系之间的关系,加快体系演变?
· 如何评估数据要素的价值?有没有一套科学的数据价值评估体系?
· 大模型的发展对人才的数据处理和分析能力提出了哪些新要求?如何应对这些挑战?
· 从研发创新、业务增效等角度出发,在垂直领域数智化技术的应用现状,面临哪些挑战,以及未来的机遇在哪里?
学术出品人:梁家卿 复旦大学 青年副研究员
工业出品人:李永 阿里云人工智能平台PAI引擎负责人
阿里云 PAI 大语言模型微调训练实践
Alluxio AI 新一代AI/ML训练中台的数据I/O解决方案
大模型的持续能力提升
大模型在携程的探索与实践
大模型时代企业智能数字化办公的探索
学术出品人:卢暾 复旦大学教授、上海市数据科学重点实验室副主任
工业出品人:颜林 百度 主任架构师
基于大模型 Agent 的城市社会经济系统仿真模拟
MetaGPT:重塑自然语言编程,多智能体引领代码生成与协同的革新探索
Agent技术在语音助手场景中的应用
AI 原生应用中的 AI Agents 探索与实践
学术出品人:熊贇 复旦大学教授,上海市数据科学重点实验室副主任
工业出品人:翁力雳 eBay 算法Team Lead,Applied Researcher
大模型背景下的对话式推荐实践
推荐系统降本增效之路
RAG 视角下的推荐系统:机遇与挑战
eBay多模态与GNN商品嵌入技术:提升推荐系统效能与用户体验
高时效推荐系統实践 - 从系统提效到内容冷启动
出品人:赵健博 快手 数据引擎与存储技术团队负责人
美团OLAP引擎选型和演进实践
JIT技术在数据系统中的应用:通过Gandiva实现数据计算加速
Blaze:SparkSQL Native 算子优化在快手的大规模应用实践
重新定义流计算:RisingWave 云原生流数据库
实时湖仓架构在小红书的探索与实践
学术出品人:李直旭 复旦大学研究员、博导
工业出品人:温绍锦 阿里云资深技术专家、阿里云DataWorks技术负责人
大模型驱动的数据清洗与数据合规技术展望
第三代指标平台如何摆脱 ETL 宽表开发 做“轻”数仓
AI For Data,大模型驱动阿里云 DataWorks 数据开发治理新范式
滴滴指标标准化实践
出品人:黄帅 蔚来汽车 GPT应用技术负责人
大模型在智能电动汽车中的应用与实践
有序多址城市旅行商问题的路径规划策略与优化
汽车领域大模型建设和数字化营销应用
基于大模型的群体智能解决方案
出品人:李少春 云南白药 数字战略科学家,智慧科技总经理,CIO
大模型时代的数字医疗和数智医药转型创新
大模型趋势下的医疗人工智能
星斗云:结合中药研发大模型的一站式中药数智研发平台
基于生成式AI和预训练大模型打造分子设计平台
学术出品人:王鹏 复旦大学教授,上海市数据科学重点实验室副主任
工业出品人:叶玮彬 百度 资深研发工程师
字节跳动系统智能运维实践
基于大语言模型的运维代码理解及生成
基于多个头部客户案例解析大语言模型在运维领域的落地实践
学术出品人:何震瀛 复旦大学副教授
工业出品人:毛琦 小红书 存储和数据库负责人
抖音电商数据仓库治理实践
大数据治理:大数据价值提升之路
大规模社交图快速生成方法探索
小红书图数据库在分布式并行查询上的探索
数据库系统的自然语言交互方法探索
出品人:谭安林 抖音集团电商数据BP专家
抖音电商埋点与归因分析实践思考
零售行业商品竞争力提升的数据探索
京东零售的指标中台建设
辛选集团数据中心建设之路
抖音电商数据血缘探索和实践
数据在零售供应链领域的应用
AI Agent 在电商平台中的应用
跨境电商物流系统相关异常信息识别
出品人:雷小平 腾讯IEGG 首席数据工程架构师
B站基于数据治理运营框架的应用实践
基于存储的近实时数仓架构在字节的应用
知乎 DMP/CDP 平台的应用和实践
大数据架构优化之沐瞳出海实践业务分享
欧美 KOL 营销技术应用探索
AIGC 垂类落地实战
Soul 基于 AIGC 的实践与探索
出品人:章鹏 蚂蚁集团数字科技 数据智能负责人
基于多模态技术的保险智能理赔介绍
“天镜”大模型与多模态金融场景
核保风控领域的大模型应用
基于图计算的反洗钱可疑交易监测实践
文档智能在金融领域的应用
通义灵码智能编码助手技术解密
大模型在金融风控领域的应用与展望
AI 技术演进与商业落地:从学术探索到创业实践的全景观察
NoETL,开启自动化数据管理新时代
个人介绍:周卫林,Aloudata(大应科技)创始人 & CEO,曾任蚂蚁集团研究员(P10)、蚂蚁集团数据平台部总经理,拥有 20 余年大数据领域从业经验,是国内最早一批数据仓库先行者。他曾深度参与并主导了阿里/蚂蚁集团从传统数仓体系到数据智能体系的数据技术演进过程,全面支撑了蚂蚁集团从支付工具到数字生活平台的升级,横向推动了整个蚂蚁集团业务数据化、智能化水平的提升。除此之外,他还是多个有影响力的数据工具类产品的主要缔造者,并由此孵化出多个进入 Gartner、Forrester 领导者象限的阿里云拳头产品。
演讲题目:NoETL,开启自动化数据管理新时代
演讲提纲:通过剖析企业数智化的典型场景和发展路径,探讨企业数据管理的挑战与目标,并通过介绍 NoETL 理念和技术创新,分享数据管理自动化领域的最新进展和实践经验。
听众收益:
1. 从 CDO 和工程架构视角了解企业数据管理面临的挑战和根因分析
2. 对 NoETL 与 Data Fabric 理念的专业解读
3. 为什么数据管理要实现自动化,如何实现自动化
阿里云大数据AI一体化最佳实践
个人介绍:刘一鸣,目前负责阿里云ODPS等自研大数据产品,主攻云原生一体化数仓引擎能力的演进和商业化,在数据仓库、大数据计算、开源大数据行业有15年以上工作经验。原Kyligence 副总裁,Apache Kylin PMC。
演讲题目:阿里云大数据AI一体化最佳实践
演讲简介:Data+AI时代,大数据平台该如何建设?我们认为需要具备计算效率、开发效率、处理效率为一体的高效能力,才能保障企业AI时代下的业务创新。阿里云提供了从数据集成、清洗、建模、计算到服务的大数据+AI整套产品解决方案。 同时,阿里云自研大数据平台 MaxCompute 推出分布式计算框架 MaxFrame,100% 兼容 Pandas 等数据处理接口,打通数据管理、大规模数据分析、处理到 ML 开发全流程,打破大数据及 AI 开发使用边界,大幅提升开发效率,助力企业快速构建AI时代的基础设施。
大模型的行业落地:问题与对策
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
基于世界模型视角的通用人工智能探索
个人介绍:博士,中国人工智能领军科学家,出版十几部中英文专著,翻译多部英文计算机经典学术专著。深入研究和实践AI领域十余年,包括大语言模型、多模态AI技术、通用大模型。担任多个国内外AI领域的学术组织的主要专家,在学术圈与产业圈有一定影响力。在智慧城市、智能制造、智慧医疗、智能金融等领域实现产业化落地和产品创新。曾在百度、商汤科技、上海人工智能实验室等多家行业龙头企业的研究创新机构从事人工智能相关技术研发与创新研究并担任主要领导科学家岗位,目前在中国的金融券商龙头机构、市值超过2000亿的东方财富集团担任AI首席科学家以及人工智能研究院执行院长。作为学者撰写了多部人工智能和数字经济领域的重要学术专著(目前出版了十几部中英文人工智能领域学术专著见详细介绍)。2018年加入同济大学人工智能与区块链智能实验室,与国际芯片公司ARM共同研发人工智能芯片生态相关项目。同年,著作《AI与区块链智能》被多所高校采用为教材。2019年,受邀在中英教育合作高峰论坛发表演讲,并被授予“中英教育合作交流特邀专家”荣誉。2020年,著作《智能经济》荣获中国新闻所颁发的大数据科技传播大奖,为首部讨论人工智能如何推动产业赋能以及相关技术思想的国内学术专著,同年参与了多个国家级研究项目,如科技部的《新一代人工智能报告》(2020年/2021年度)、人民网研究院的《移动互联网蓝皮书》(2020年)、联合国的《可持续发展白皮书》(2020)。2021年,为英国首相顾问丹尼尔·苏斯金德的新书《没有工作的世界》撰写序言。2022年底作为科技部专家代表参与中法人工智能研讨会,该会议由中国科技部与法国高等教育、研究与创新部门联合组织。2022年~2023年期间,在中欧国际商学院、长江商学院、上海交大安泰管理学院、上海交大高金、上海财经大学担任特约研究员和客座讲师,在多个行业顶尖大会上进行技术分享与主题演讲,给数十家顶尖投行基金授课(包括不限于摩根、汇丰、瑞银、景林资本、富国基金、麦格里投行等),演讲大会包括上海中国国际进口博览会(2021年)、上海世界人工智能大会(WAIC 2021/2022年)、杭州全球人工智能大会(2021年度)中国计算机学会YEF年度大会(2022年)、广州STC科技大会(2023年)等。2023年成为上海交通大学清源研究院研究员从事AI相关研究,作为第一作者出版学术专著《智能的启蒙:通用人工智能与意识机器》,得到多个国内媒体的报道。领导团队参与多项国家级和行业级AI标准的制定工作,如《人工智能产品伦理风险控制指南》和《人工智能风险评估模型》,《金融业人工智能平台技术要求和测试方法》,可信AI《大模型鲁棒性评估标准》,《大规模预训练模型基准测试》等。在海外学术交流方面,与爱丁堡大学金融学教授、欧洲科学院院士侯文轩共同撰写学术专著《Digital Finance》(作为第一作者);翻译出版了斯坦福大学语言与信息研究中心创始人Brian Cantwell Smith的学术专著《The Promise Of AI》,并在2022年出版了中文版,为国内读者提供了一部深入浅出的AI领域专著;担任微软全球研究院AI4Science实验室主任Christopher Bishop的经典著作《Deep Learning》(深度学习)一书(该书获得三位人工智能教父Geoffery Hinton, Yann LeCun, Yoshua Bengio推荐),作为中方翻译核心专家组成员推进相关工作预计2025年出版; 个人专著《AI Ethics and Governance》入围施普林格.自然2023年度“中国新发展奖”。在国际组织方面,于2022年5月成为国际电工委员会IEC生物数字融合系统评估组(IEC/SMB/SEG12)的专家成员,2024年受邀担任2024年第四届IEEE计算机通信与人工智能国际会议(CCAI 2024)技术委员会委员与会议论文审稿人。
演讲题目:基于世界模型视角的通用人工智能探索
演讲提纲:
1. 讨论通用人工智能技术的发展和内在技术逻辑
2. 讨论世界模型、强化学习以及自由能原理的内核
3. 讨论通用人工智能技术的未来和创新范式的演化
听众收益:
1. 讨论通用人工智能技术的发展和内在技术逻辑,帮助大家深度理解通用 AI 的前瞻性思考
2. 讨论世界模型、强化学习以及自由能原理的内核,帮助大家理解目前对 AI 智能上限的可能性
3. 讨论通用人工智能技术的未来和创新范式的演化,帮助大家梳理产业创新的重点场景和思考
圆桌讨论:数聚垂域,智领未来
· 企业数智化过程中,如何协调新技术与旧体系之间的关系,加快体系演变?
· 如何评估数据要素的价值?有没有一套科学的数据价值评估体系?
· 大模型的发展对人才的数据处理和分析能力提出了哪些新要求?如何应对这些挑战?
· 从研发创新、业务增效等角度出发,在垂直领域数智化技术的应用现状,面临哪些挑战,以及未来的机遇在哪里?
复旦大学教授、博导,上海市数据科学重点实验室主任。长期从事大数据、 知识图谱研究。发表 CCF-A 、B 类等论文 200 余篇。出版学术专著与教材三部。 完成五十多项政府及人工智能头部企业研发项目。荣获包括华为、阿里、美团等机构授予的科研奖项二十多项。担任 Applied Intelligence 等多个国际期刊副主编或编委。
个人介绍:在大规模分布式搜索推荐系统、大数据分布式系统等方向拥有超过15年的经验,现任阿里云MaxCompute产品等自研大数据平台负责人。曾担任微软搜索与人工智能事业部Partner Group Engineer Manager,带领团队研发网页检索更新系统以及个人数据搜索系统,创建并领导推荐平台,大数据计算和深度学习平台,支撑微软Bing,Ads,MSN news, Office OneDrive等在线服务,大数据处理以及模型训练业务。毕业于清华大学计算机专业,获得伊利诺伊大学博士学位。
个人介绍:中科大硕士,曾服务于百度腾讯等互联网大厂,在大数据人工智能领域有十多年经验。
阿里云 PAI 大语言模型微调训练实践
个人介绍:本科/博士毕业于浙江大学,2020年加入阿里云机器学习平台 PAI,先后参与了平台的 Workflow、算法训练、SDK 的产品设计和开发,目前主要专注于平台的 MLOps 能力建设。
演讲题目:阿里云 PAI 大语言模型微调训练实践
演讲提纲:大语言微调训练是提升模型应用性能的关键手段,直接上手微调一个大语言模型并不是一件轻松的事情,本次分享主要围绕以下主题展开:
1. 模型微调训练适用场景和常用方法。
2. 微调训练实践,包括数据准备、模型和微调算法选择、微调模型评估等。
3. 通过 “PAI-QuickStart” 一站式完成模型的微调训练、评估和部署。
Alluxio AI 新一代AI/ML训练中台的数据I/O解决方案
个人介绍:本科毕业于上海交通大学电子系,随后取得香港中文大学信息工程博士学位,毕业后加入新加坡高级数字科学中心(美国伊利诺伊大学在新加坡的研究所)从事科研工作,在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前,傅正佳曾在新加坡科技公司Bigo Technology担任机器学习研发总监。
演讲题目:Alluxio AI|新一代AI/ML训练中台的数据I/O解决方案
演讲介绍:在以数据驱动的AI时代,高效访问存储中的大量数据对于模型训练和服务至关重要。然而,I/O 挑战往往会阻碍性能并限制 GPU 的利用率。本次分享,我们将介绍基于 Alluxio 构建的高性能数据访问层,如何克服 I/O 挑战并显著提高 GPU 利用率。通过丰富的用户案例和实验数据,您将了解在Alluxio中缓存数据集和模型的方法,将有多大幅度的性能提升。
演讲提纲:
1. 介绍常见的 I/O 挑战及其对 GPU 利用率和整体性能的影响
2. 如何将高性能数据访问层无缝集成到 ML 工作流中,以减少 I/O 开销
3. 提高AI工作负载性能的缓存策略
4. 增强数据访问和加速AI工作负载的未来方向
5. 行业应用案例分享
听众收益:通过此次分享,与会者将深入了解到由数据驱动的AI工作负载所带来的 I/O 挑战,并了解如何将 Alluxio 作为一种有效解决方案加以利用。我们将重点分享来自Meta、Uber、Shopee、知乎等用户的实践经验、探讨我们的方法对 GPU 利用率和整体性能的影响。
大模型的持续能力提升
个人介绍:梁家卿博士,复旦大学大数据学院青年副研究员,主要研究方向为基于知识图谱与大模型的认知智能。在国际顶级学术会议与期刊(包括TKDE,AAAI,IJCAI,ICDE等)发表论文50多篇。在应用落地方面,作为技术负责人研发并公开发布了多个知识图谱与大模型应用平台如CuteGPT、Emo-CuteGPT、CN-DBpedia、ProbasePlus、CN-Probase、“不倒翁”智能问答等,相关产品API被工业界与学术界多家单位已调用累计17亿次以上,并形成了16个专利。有成功训练百亿参数量级别模型的经验和在大规模集群上训练千亿参数量级别模型的经验。先后在国际性的“知识库构建”比赛中荣获第二名;在中国计算机学会和中国中文信息学会的主办的语言与智能技术竞赛“信息抽取”比赛中荣获第一名。主持研发的情感增强大模型 CuteGPT 在上海卓辰信息科技有限公司(帮助其情报信息知识抽取准确率达到 90%以上)、上海双地信息系统有限公司(帮助其开发了内容管理产品“小孔商业智能AI助理”)、上海光唯文化传媒有限公司(应用于其客户在新产品研发业务,新产品销售额超过千万元)等单位实现了落地应用。并且曾获ACM-ICPC区域赛金牌、TopCoder Open全球前150名、吴文俊人工智能科学技术奖科技进步奖三等奖、上海市优秀博士毕业生、上海市计算机学会优秀博士论文、华为云最佳论文复现奖、复旦大学超级博士后、上海市超级博士后、中国博士后科学基金面上资助、国家自然科学基金青年基金资助。
演讲题目:大模型的持续能力提升
演讲提纲:当前大模型在发布一个版本以后,往往需要大量的专家进行评估、数据合成和继续优化以发布下一个版本。这一模型迭代过程的时间长、人工贵、结果难以估计、无法稳定获得提升。而且,其中模型的评估和能力提升往往过于领域限定,难以推广到模型通用能力的提升。事实上,授“人”与鱼不如授“人”以渔,模型的提升需要更多的原理指导和对其自身学习能力的依赖。因此,我们的核心目标是:如何简化(自动化)大模型的持续能力提升流程?为了达到这一目标,我们从以下三个方向进行了一些研究:
1. 分析模型能力获取和增强的原理作为指导
=> 模型能力体系产生与强化机理
2. 自动收集和筛选最“有效”的语料
=> 模型继续训练中的语料处理
3. 基于模型自身的元能力进行自我迭代
=> 模型的元能力激发
大模型在携程的探索与实践
个人介绍:华东师范大学硕士毕业,有将近十年的机器学习应用实践经验,目前就职于携程,主要研究方向为智能化决策和大模型的应用
演讲题目:大模型在携程的探索与实践
演讲介绍:大语言模型的发展日新月异,其核心能力可以大致分为:生成、总结、提取、分类、检索与改写六大部分,我们结合实际业务场景探索了大模型在相关能力上的表现。本次分享将介绍大模型在旅游行业的落地应用,主要包含AIGC技术在内容营销领域的探索实践、多模态大模型在交互页面的应用以及开源大模型在客服场景提高人效的实践经验,会涉及到开源大模型的应用对比、大模型的微调实践以及不同推理框架的性能和效果对比总结。
演讲提纲:
1. 相关业务背景介绍
2. 结合具体场景探索大模型的核心能力
· 开源大模型的应用对比
· 大模型的微调实践
· 大模型推理框架性能以及效果
3. 相关的实践经验总结
听众收益:
1. 了解大模型的相关能力以及在各个场景的应用
2. 学习大模型的微调实践经验
3. 学习大模型的推理性能优化技术以及相关框架应用
大模型时代企业智能数字化办公的探索
个人介绍:博士毕业于亚利桑那州立大学计算机系,本科毕业于同济大学计算机系,曾就职于亚马逊美国搜索部门,阿里飞猪搜推算法部门,目前在阿里巴巴企业智能事业部。主要研究方向为大模型应用、搜索与推荐技术、图数据挖掘,在人工智能相关的顶级学术会议和期刊上发表论文30余篇。个人主页: https://turingcat.me/
演讲题目:大模型时代企业智能数字化办公的探索
演讲提纲:企业内部大量的应用、文档和工作流为企业数字化转型提供了大量的数字原油,然而由于缺乏有效的通信和信息共享仍然难以有效转化成宝贵的用于决策的燃料油。AI大模型以其惊艳的生成和推理能力,是这个时代企业跨越新数字鸿沟,消灭数字时代鲍莫尔成本病的引擎。 本次演讲将介绍我们打造员工和企业智能交互界面的尝试,利用大模型帮助员工高效地找信息(找人、找应用、找知识、找服务、办事)和找产品,达到有问必答,问题终结。我们会阐述我们的技术选型(通过检索增强的方式帮助大模型理解企业内部的知识),数据闭环(数据清洗,标注、反馈、微调、评估、回流),大模型微调(SFT和RLHF阶段的数据探索)。 具体包括:
1. 企业的数字化转型的背景介绍
2. 企业的数字化转型的问题和挑战
3. 企业智能数字化办公的技术方案(大模型整体架构、微调、评测)
4. 大模型赋能办公的展望
听众收益:
1. 了解大模型在企业内部落地的具体业务应用
2. 开拓一些新思路,用新方法如何解决传统的一些企业办公问题
3. 目前领域相关的挑战,以及大模型应用的未来的展望
基于大模型 Agent 的城市社会经济系统仿真模拟
个人介绍:清华大学电子工程系长聘副教授,教育部长江学者。长期从事城市科学与城市模拟相关研究,在Nature 子刊等高影响力综合期刊发表论文数篇,发表学术论文100余篇(CCF-A类70篇),被引超过20000次,连续两年入选科睿唯安"全球高被引科学家", 10篇论文入选ESI前1%高被引论文;申请专利35项、已授权12项。入选国家"万人计划"青年拔尖人才计划、科协青年人才"托举工程"、获IEEE通信学会亚太杰出青年学者奖、教育部科技进步一等奖、湖北省技术发明一等奖、电子学会科技进步一等奖、电子学会自然科学二等奖、吴文俊人工智能科学技术奖优秀青年学者奖。
演讲题目:基于大模型 Agent 的城市社会经济系统仿真模拟
演讲提纲:
1. 城市仿真模拟背景
2. 基于大模型 Agent 的仿真模拟的优势与特色
3. 基于大模型 Agent 的城市社会经济系统
听众收益:
1. 大语言模型 Agent 与模拟仿真
2. 城市社会经济仿真系统
3. 大语言模型 Agent 与社会科学
MetaGPT:重塑自然语言编程,多智能体引领代码生成与协同的革新探索
个人介绍:洪思睿,DeepWisdom团队NLP&AIGC方向算法负责人。前智能控制上市企业NLP团队负责人,牵头千万级行业知识图谱及多项自然语言处理技术的应用落地;在DeepWisdom负责包括法律、物流、美妆、电商等多个领域的知识问答,搜索系统、多模态应用等行业落地;开源多智能体框架MetaGPT一作;NeurIPS AutoDL 顶级竞赛世界冠军,相关工作/论文发表于TPAMI顶刊。
演讲题目:MetaGPT:重塑自然语言编程,多智能体引领代码生成与协同的革新探索
演讲提纲:介绍多智能体编程框架MetaGPT,讲述如何通过自然语言进行智能体编程,高效实现智能体协作能力和代码能力提升,探索多智能体设计&开发创新之路。
1.MetaGPT:多智能体框架介绍
2. 基于自然语言编程,探索智能体能力增强
3. 协作与自我提升:SOP嵌入与递归式能力提升的探索
听众收益:
1. 深度解读前沿多智能体框架,了解智能体设计开发实践
2. 如何增强智能体的代码能力和推理能力,支持复杂工具使用
3. 如何设计多智能体协作模式
Agent技术在语音助手场景中的应用
个人介绍:小米小爱同学团队高级算法工程师,担任大规模语言模型的训练、推理与应用工作。
负责并研发多项语音助手场景中的深度学习算法落地工作,搭建算法框架助力小爱同学体验升级。
在语义理解、对话管理与信息检索等方向有丰富经验,相关成果发表于ACL、NAACL等刊物。
演讲题目:Agent技术在语音助手场景中的应用
演讲内容:
搭建以大模型为核心的Agent框架,从而解决语音助手场景中更加复杂多样的需求。通过Prompt设计、信息检索、与RAG等流程,实现性能出色、表现稳定的Agent能力。
演讲提纲:
1. Agent整体框架与基本原理
2. 语音助手场景下的Agent应用
3. 未来进一步优化方向
听众受益:
1. 了解Agent基本原理
2. 了解Agent在工程落地时的潜在问题与解决方案
3. 了解Agent在进一步优化时的可行方向
AI 原生应用中的 AI Agents 探索与实践
个人介绍:百度主任架构师。百度信息流推荐系统负责人。在AI系统,云原生服务有十余年丰富业务架构经验。
演讲题目:AI 原生应用中的 AI Agents 探索与实践
演讲提纲:
1. AI Agents 介绍与发展
2. AI 原生应用中 AI Agents 系统探索
3. AI Agents 一线实践经验
听众收益:
1. 了解 AI Agents 系统架构设计
2. 学习大规模 AI 原生应用中 AI Agents 实践经验
3. 思考 AI Agents 系统在业界未来发展方向
大模型背景下的对话式推荐实践
个人介绍:2012年硕士毕业加入百度,一直从事推荐系统相关的架构工作。目前是百度信息流推荐系统后端架构的技术负责人,负责推荐内容架构及其存储与索引相关的架构工作。
演讲题目:大模型背景下的对话式推荐实践
听众收益:
1、推荐系统架构
2、大模型背景下的推荐系统新业务形态
推荐系统降本增效之路
个人介绍:四川大学计算机硕士,具有多年搜索推荐场景的算法和工程实践经验,为数十家阿里云客户提供场景优化建议和效果优化。
演讲题目:推荐系统降本增效之路
演讲提纲:本演讲将阐述在降本增效的时代,如何通过工程化手段提升推荐系统建设效率,并分享真实业务案例。主要内容包括:
1. 通过推荐算法定制降低开发成本;
2. 通过组件化的模型搭建加快新的推荐模型的实验;
3. 通过模型训练优化和推理性能优化来降低离线训练和在线服务的成本;
4. 通过实验 AB 平台加快迭代速度。
RAG 视角下的推荐系统:机遇与挑战
个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到3100余次,H-index达到29。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,自然语言处理专委会秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。
演讲题目:RAG 视角下的推荐系统:机遇与挑战
演讲提纲:当前推荐系统领域面临诸多挑战,如数据长尾分布、个性化推荐、多轮对话和冷启动推荐,而大语言模型的出现为推荐系统带来了新的机遇,两者融合逐渐成为下一代推荐系统的趋势。然而,单纯使用LLM用于推荐仍存在局限性,如个人信息利用不足、上下文长度受限、存在幻觉以及无法学习所有历史交互数据等问题。因此,引入知识检索增强(RAG)显得尤为必要,这有助于控制幻觉、减少对上下文的依赖、学习新知识并可以与传统推荐系统快速协同。本报告系统梳理了当前推荐系统的局限,LLM增强推荐系统的现状,RAG的技术路线、范式和其在增强推荐系统方面的应用,并阐述了在RAG视角下推荐系统的机遇和发展趋势。
听众收益:
1. 推荐系统的挑战以及目前大模型应用于推荐系统的局限性
2. RAG 的发展、关键技术和范式
3. RAG 应用于推荐系统的机遇和未来发展
eBay多模态与GNN商品嵌入技术:提升推荐系统效能与用户体验
个人介绍:我自2021年6月至今一直在eBay担任推荐算法Team Lead。在全站推荐业务中,我带领团队使用算法能力解决多个业务痛点,显著提高了eBay首页与商品详情页的GMV和广告收入。在之前的工作中,我曾在iQIYI爱奇艺公司担任高级机器学习工程师,领导了短视频推荐系统的开发,旨在提供高度个性化的视频推荐。我的学历背景包括香港大学计算机科学的本科与硕士学位,入选过院长荣誉榜(2011/12年,前10%),获得过宋庆龄奖学金。
演讲题目:eBay多模态与GNN商品嵌入技术:提升推荐系统效能与用户体验
演讲提纲:在本次演讲中,eBay的推荐系统专家将深入介绍他们创新性的多模态与图神经网络商品嵌入技术,旨在提升推荐系统的效能与用户体验。通过优化召回模块,整合多模态信息,以及运用图神经网络,演讲者将分享如何解决传统推荐系统中的挑战,提高推荐准确性,并展示这些技术在实际业务中如何根据用户痛点量身定制解决方案,为每一位用户创造更为个性化、精准的购物体验。
听众收益:
1. 如何使用算法能力撬动用户痛点的杠杆:深入讨论如何利用算法能力根据eBay业务实际特点解决用户痛点。通过演示多模态商品嵌入和GNN的应用,探索算法在推荐系统中的实际业务场景中如何精准地满足用户需求,提高购物体验,解决用户在推荐系统中可能遇到的问题,为业务实际特点量身定制解决方案。
2. 多模态召回模块优化:通过整合多模态信息,提升召回模块的准确性,解决单一模态在复杂情境下的推荐困难,为用户呈现更相关和个性化的推荐结果。
3. 图神经网络在推荐系统中的实践经验:深入探讨了GNN在构建用户-商品行为交互图上的应用,展示了GNN召回模型的在线实验结果,证明其在提升CTR和PTR方面的显著效果。
高时效推荐系統实践 - 从系统提效到内容冷启动
个人介绍:小红书推荐算法专家,在视频推荐、内容冷启动及社交推荐等领域拥有多年实战经验,担任公司多个推荐场景的负责人。
演讲题目:高时效推荐系統实践 - 从系统提效到内容冷启动
演讲提纲:本演讲将分享小红书去中心化高时效分发系统的实践和挑战,从推荐时效性提升开始,延伸至内容冷启动的多项探索和技术实践。
听众收益:
1. 高时效推荐系统的挑战和实践
2. 内容冷启动的常见方法
3. 小红书的内容冷启动实践
美团OLAP引擎选型和演进实践
个人介绍:2013年华中科技大学计算机学院硕士毕业。2014年加入美团数据组,深度参与美团Hadoop集群规模从百到十万级的架构演进。主要负责离线数仓生产、Adhoc查询、OLAP分析引擎与服务在美团业务场景的落地与演进。
演讲题目:美团OLAP引擎选型和演进实践
演讲提纲:OLAP被广泛应用在经营报表、商业分析、活动运营、风控等业务场景,本次演讲主要介绍美团OLAP场景的特点,OLAP引擎选型的思路和演进历程以及在性能优化方面的实践经验。
听众收益:了解互联网公司在生产环境下面临的不同业务场景及技术挑战,提供OLAP引擎选型思路和实践经验参考。
JIT技术在数据系统中的应用:通过Gandiva实现数据计算加速
个人介绍:上海炎凰数据首席架构师及联合创始人,主要负责后端半结构化时序数据系统的研发。之前曾在Splunk等公司参与数据库CDC以及大规模数据采集等项目的研发。Apache Arrow Contributor。
演讲题目:JIT技术在数据系统中的应用:通过Gandiva实现数据计算加速
演讲提纲:
1. JIT即时编译技术
· 什么是JIT即时编译技术
· JIT技术的优缺点
· JIT技术的应用场景
2. 使用JIT进行数据库表达式求值
· 数据库表达式求值的一般方法
· 什么是表达式求值问题
· 常见方法如向量化/JIT/树遍历等
· 不同的数据库的解法
3. 使用Gandiva表达式编译器
· 介绍Apache Arrow
· 介绍Gandiva表达式编译器, LLVM及其工作原理
· 演示如何使用Gandiva进行表达式求值
4. 未来展望
听众收益:
1. JIT即时编译技术的基本概念以及为什么需要JIT
2. 数据库表达式求值方法
3. 如何使用Apache Arrow/Gandiva的JIT即时编译技术加速计算
Blaze:SparkSQL Native 算子优化在快手的大规模应用实践
个人介绍:毕业于中国科学院大学,博士学历。曾任职于360系统部,担任离线计算组负责人。现任职于快手数据平台部数据引擎技术中心,负责离线生产引擎及数据湖研发。
演讲题目:Blaze:SparkSQL Native 算子优化在快手的大规模应用实践
演讲介绍:Spark作为当前离线生产场景的主力引擎,其性能提升对于企业数据生产链路的降本增效至关重要,用更底层的语言来开发向量化引擎提升性能则是近年来计算引擎的主流共识。Blaze是快手自研的基于rust和datafusion/arrow开发的Spark向量化执行引擎,经过持续的迭代优化,目前已经在快手内部得到大规模的推广应用并取得线上收益。本次分享将介绍Blaze的架构原理,在上线过程中遇到的各种问题及对应的深度优化措施,以及大规模上线应用的推广方案。
演讲提纲:
1. Blaze 的架构和原理简介
2. Blaze 的深度性能优化
3. Blaze 在快手的大规模应用推广
4. 当前进展及后续规划
听众收益:
1. 了解 Blaze 的架构与原理
2. 基于 Blaze 的深度性能优化
3. Blaze 项目当前进展及效果
4. 如何在快手生产环境中大规模应用实践
重新定义流计算:RisingWave 云原生流数据库
个人介绍:毕业于美国卡耐基梅隆大学(CMU)计算机系,曾就职于硅谷 LinkedIn Streaming Infra 团队担任核心开发4年,回国后曾就职于腾讯 Wechat Infra,现就职于 RisingWave Labs,担任数据库内核存储团队 Tech Lead。
演讲题目:重新定义流计算:RisingWave 云原生流数据库
演讲提纲:
1. 什么是云原生流数据库
2. RisingWave 架构和设计理念
3. RisingWave 核心技术内幕
4. RisingWave 应用场景
5. 未来与展望
听众收益:
1. 如何借助 RisingWave 轻松上手流计算
2. 云原生架构下如何实现高效且低成本的实时计算
3. 如何以数据库的方式降低流计算的开发和运维成本
实时湖仓架构在小红书的探索与实践
个人介绍:2017年硕士毕业于复旦大学计算机学院DasLab;毕业后先后在PayPal、字节跳动履职,从事大数据相关工作;2021年加入小红书数据平台部,负责实时湖仓团队的工作,聚集于OLAP、数据湖、计算引擎等相关技术的探索与实践落地
演讲题目:实时湖仓架构在小红书的探索与实践
演讲介绍:结合小红书的线上真实场景及需求,分享小红书基于OLAP及数据湖技术的架构选型、核心优化及落地效果
演讲提纲:
1. 小红书湖仓架构的演进历程
2. 核心优化及落地效果
3. 未来展望
听众收益:了解如何利用StarRocks、Iceberg等技术对数据生产及查询进行降本增效
大模型驱动的数据清洗与数据合规技术展望
个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据治理与挖掘等。在领域主流期刊和国际会议上发表论文近200篇,主持十余项国家和省部级科研项目。
演讲题目:大模型驱动的数据清洗与数据合规技术展望
演讲提纲:我国高度重视数字经济建设,数据成为重要的生产要素之一。在持续推动数据要素市场发展的进程中,数据治理成为释放数据要素价值的重要瓶颈。传统的数据治理技术受限于小模型的建模、表达与泛化能力,难以应对复杂动态的数据市场环境下来自百业千行的领域数据治理需求。大语言模型因其对现实世界的强大建模能力和良好泛化能力,为数据治理技术带来重大革新契机。然而,基于大模型的数据质量和数据合规治理研究方兴未艾,充满机遇与挑战。如何构建安全可信的大模型用于数据治理?如何让大模型助力真实复杂场景的数据清洗?如何利用大模型辅助领域数据的合规性检查?如何提升大模型对数据治理的决策规划能力?针对以上问题,本此分享讲者将做一些深入的分析和探讨,并展望以大模型为驱动核心的智能数据质量与合规治理技术的研究。
听众收益:
1. 数据清洗与数据合规的难点以及大模型带来的契机;
2. 大模型驱动的数据治理技术的整体思路与研究框架;
3. 大模型驱动的数据清洗和数据合规的可能技术方案。
第三代指标平台如何摆脱 ETL 宽表开发 做“轻”数仓
个人介绍:12 年数据业务从业经验,历任阿里集团淘宝商业分析负责人、阿里音乐商业智能中心负责人、蚂蚁集团用户增长分析与洞察产品负责人。在数据体系搭建、数据分析、用户标签建设、用户洞察、用户增长等方面,拥有丰富的数据驱动业务实践经验。
演讲题目:第三代指标平台如何摆脱 ETL 宽表开发 做“轻”数仓
演讲提纲:
1. ETL 的原罪与 NoETL 的全新思路
2. 第三代指标平台如何实现集市层 NoETL?
3. 第三代指标平台的能力与价值
4. 做“轻”数仓, 第三代指标平台案例实践
听众收益:
1. 企业管理层和业务人员:如何借助自动化指标平台实现更加灵活、高效、准确的数据洞察
2. CDO:指标“管、研、用”一体,真正兼顾敏捷分析、数据有序、成本可控、语义资产沉淀与复用
3. 数据工程师:做“轻”数仓,数据集市层 NoETL,不再疲于应对大量的报表开发
AI For Data,大模型驱动阿里云 DataWorks 数据开发治理新范式
个人介绍:阿里云DataWorks产品负责人,打造全链路数据开发治理平台支撑阿里巴巴集团与阿里云上众多客户的数字化转型。
演讲题目:阿里云DataWorks:新一代“Data+AI”数据开发与数据治理平台的产品演进
滴滴指标标准化实践
个人介绍:浙江大学硕士毕业,曾就职于华为。2017年加入滴滴,一直从事数据中台建设,主要涉及数据开发、数据资产和治理以及数据服务等方向,目前主要专注于指标服务化和指标标准化建设。
演讲题目:滴滴指标标准化实践
演讲提纲:介绍滴滴指标标准化的背景,方案发展过程,以及指标标准化的方案的核心设计出发点,实现途径,以及生态建设。最后介绍指标标准化的后续规划。
听众收益:
1. 指标管理方案发展状况
2. 指标服务化的核心设计思路
3. 标准化建设的收益
大模型在智能电动汽车中的应用与实践
个人介绍:陈炯,男,博士,清华大学电子工程系本科、博士,现任蔚来汽车技术规划部门技术专家,中国计算机学会智能汽车分会委员,中国汽车工程学会传感器分会委员,复旦大学、合肥工业大学校外研究生导师,曾任伊顿(中国)研究院资深工程师,多年来从事系统设计和前瞻研究相关工作,作为主要技术负责人完成过多项预研项目,并进行产品转化。拥有60+项专利(多项同时在美国PCT申请),在国内外杂志和期刊上发表论文17篇。在伊顿中国研究院工作期间,带领全球团队完成多项产品开发和技术攻关项目。在蔚来汽车工作期间,作为系统架构师,成功开发过蔚来第一代电动汽车充换电站,移动充电车等产品,也是蔚来自动驾驶第二代平台的核心架构师之一,现在主要进行大模型相关的系统架构设计和应用开发工作。入选 2022 年上海市产业菁英高层次人才。
演讲题目:大模型在智能电动汽车中的应用与实践
演讲提纲:
1. 智能电动汽车的发展趋势
2. 大模型赋能智能电动汽车的场景
3. 蔚来的应用与实践
听众收益:
1. 如何结合场景,深耕行业
2. 如何通过应用驱动,精准定位和解决问题
3. 如何设计统一的架构来支持应用
有序多址城市旅行商问题的路径规划策略与优化
个人介绍:复旦大学基础数学硕士,10年以上汽车行业AI从业经验,在大语言模型、运筹优化和机器学习领域有丰富的实战经验。
演讲题目:有序多址城市旅行商问题的路径规划策略与优化
演讲提纲:
1 首先会介绍运筹优化场景和有序多址城市旅行商问题
2 再探讨该问题的演进和求解策略
3 再分享优化改进方法和效果
4最后对运筹优化实战中的难点和对策分享
听众收益:
1 了解运筹优化场景和常见求解方法
2 了解求解有序多址旅行商问题的实战策略
3 了解运筹优化实战中难点与对策
汽车领域大模型建设和数字化营销应用
个人介绍:目前负责汽车之家的大模型和基础AI技术。曾任职于雅虎、百度、腾讯、爱奇艺等多家头部互联网公司。有多年的AI产品技术管理经验,曾任腾讯新闻产品技术部算法中心总监,爱奇艺智能分发部高级总监。2007年毕业于中科大-微软联合培养博士项目。曾任SIGKDD, SIGIR, AAAI, WSDM等多个国际会议的程序委员会委员。
演讲题目:汽车领域大模型建设和数字化营销应用
演讲提纲:
1. 汽车领域基座大模型建设
2. “仓颉”大模型多模态扩展
3. “仓颉”大模型应用平台框架
4. 大模型基础上的AIGC引擎
5. B端C端数字化营销案例
听众收益:
1. 了解垂类领域大模型的建设过程、难点和特点
2. 如何在垂直领域内有效落地大模型应用
3. 了解汽车数字化营销中的具体落地案例
基于大模型的群体智能解决方案
个人介绍:易慧智能技术VP,中科院软件所硕士,先后任职于微软、阿里、百度等国内外知名互联网公司,有多年的搜索引擎、人工智能相关领域的研发和管理经验。近年来专注于大模型在垂直领域的落地应用,年初联合清华大学自然语言实验室、面壁智能发布大模型驱动的汽车行业群体智能技术白皮书,带领团队研发YiAgent群体智能协作平台。
演讲题目:基于大模型的群体智能解决方案
演讲介绍:伴随着大模型(LLM)和智能体(Agent)技术在各行各业的落地应用,基于多智能体的群体智能解决方案更是为企业带来了前所未有的效率提升和价值创新。在本次分享中,我将介绍群体智能解决方案的技术实现,包括行业大模型的训练和优化、智能体的设计和开发、群体智能的协作机制等。同时还有我们在群体智能生态建设和落地应用中的一些思考和实践,以及对群体智能解决方案未来发展的展望,包括技术的进一步优化、应用的更广泛拓展、生态的更深度融合等。我相信,随着大模型技术的不断发展和群体智能解决方案的不断完善,我们将能够在更多的场景中实现智能化的管理和服务,为企业的发展提供更强大的支持。希望通过本次分享,能够帮助大家更深入地理解群体智能解决方案,也希望能够激发大家对于大模型技术和群体智能的研究和应用的兴趣。期待与大家的交流和探讨。
演讲提纲:
1. 群体智能解决方案概览:自底向上依次是行业大模型、单智能体(Agent)、群体智能协作、场景应用
2. 群体智能协作平台:详细介绍群体智能相关的技术实现
3. 群体智能生态及落地应用
4. 后续展望
听众收益:
1. 了解智能体如何设计和开发
2. 了解多个智能体如何协同完成一个复杂任务
3. 了解群体智能相关生态,寻找你在其中的定位
大模型时代的数字医疗和数智医药转型创新
个人介绍:李少春先生现任云南白药数字战略科学家、智慧科技业务单元(BU)总经理,CIO。专注于 医疗行业专业场景和前沿数字化技术的深度融合,在大健康领域拥有深厚行业实践经验。持续专注于 大数据分析、人工智能、云计算、物联网等多个领域前沿研究和创新,推动全球创新合作的战略和执 行,推动 AI 科技和生态系统创新解决方案,助力医疗和生命科学行业企业的完整价值链的数字化重 塑进程,为其提供做出关键医疗、临床、运营和创新决策所需的洞察力,使企业和组织能够利用领先 技术实现可信的数字化智慧医疗平台转型。李少春先生致力于打造智慧医疗健康创新生态。深度和临床医生、研究人员、数据科学家、 政府机构、业界思想领袖以及医疗大健康产业生态企业深入链接和合作,致力于将数据、技术和业务 整合实现数智化重塑。李少春先生多次作为行业领袖受邀在全球和国内人工智能、医药研发、医疗和 相关产业科技大会发表洞见演讲。李少春先生就读长江商学院和北大光华高管学院,荣获北京大学工 学院、E 药经理人等行业专家理事。历任 IBM 大中华区医疗和生命科学行业总经理,前 IBM 大中华区沃森健康(Watson Health)总经理,IBM 中国研究院研究技术创新总监,IBM 发明大师(超过 60 项全球专利),获 得 15 项 IBM 年度全球研究科技成就奖,其中 3 项为杰出成就奖项,屡次荣获 IBM 全球杰出业 务奖、技术奖、经理人奖。
演讲题目:大模型时代的数字医疗和数智医药转型创新
演讲提纲:数字化1.0阶段的效率提升主要依靠将线下的业务行为搬到线上,利用业务数字化工具提升业务运营的效率。数字化2.0阶段聚焦全域业务数据分析带来的效率,实现企业“上帝视野”数据驱动的管理和经营。数字化3.0阶段是超级自动化的效率实现,是把行业和产业链的外部数据和企业的内部数据链接在一起;把过去和现在的数据链接在一起;把企业执行数据和企业经营结果数据链接在一起;把消费者需求数据和产品研发生产数据链接在一起。在AI大模型的时代,企业的决策不再是靠经验和普世的规则,而是依靠全链条的数据洞察、机器学习和AI判断,结合外部的生态链和行业的洞察实现自动化,是企业超级自动化的新效率时代。大模型重新定义了人工智能的新可能,促进AI应用规模化落地,对医疗医药行业领域赋能更深,将促进未来企业管理模式和用户互动模式的进步和改变。AI工具和数字化手段,将作为重要的“工具创新”和“能力建设”途径,为企业推动数字化转型装上强大的增长引擎。
听众收益:
1. 科技数字化新范式,企业发展新机遇
2. AI 大模型时代带来的数字医疗的新机会
3. 医药企业数字化转型和中医药产业链创新
大模型趋势下的医疗人工智能
个人介绍:现任京东健康智能算法部负责人,负责京东健康在医疗AI领域的技术创新和解决方案研发。IEEE Senior Member,毕业于浙江大学,主要研究方向在大规模语言模型和多模态学习,是医疗大模型京医千询的技术负责人和视频多模态大模型VICTOR的作者。具有10年以上人工智能的研发经历,在创新科技前沿具有丰富的实战经验并引领多项核心技术突破,覆盖大健康、电商、搜索引擎、内容推荐、互联网广告等多领域。
演讲题目:大模型趋势下的医疗人工智能
演讲提纲:
1. 对大模型和人工智能在医疗领域的重要性介绍
2. 大模型如何改变医疗诊断和治疗方法
3. 京医千询的技术实践
4. 对医疗实践和医患关系的影响与挑战
听众收益:
1. 对大模型技术的优势与挑战有深入的认识
2. 了解医疗人工智能技术的发展趋势
3. 引发听众对于跨学科合作、数据隐私保护、算法公平性等问题的思考,促进医学和技术领域的深度合作与交流
星斗云:结合中药研发大模型的一站式中药数智研发平台
个人介绍:王文佳女士现任天士力国际基因网络创新中心总经理,负责天士力人工智能大数据药物平台——星斗云开发以及创新药物研发,专注中药等多靶点药物的信息整合挖掘及智能分析,发表论文影响因子150+,最高影响因子25,并拥有十余项专利等知识产权。药物知识图谱等方面获得数个国家级奖项以及多家媒体报道。平台现有创新药物管线进入临床三期。王文佳在上海交通大学毕业后在法国获得生物统计信息博士学位,师从人类基因组学先驱之一 Daniel Cohen 教授。曾在世界领先的法国AI药物公司 Pharnext 担任项目负责人,担任AI药物平台开发及市场拓展等职务。
演讲题目:星斗云:结合中药研发大模型的一站式中药数智研发平台
演讲提纲:
1. 中药研发的现状与数智化趋势
2. 华为共建数智中药研发大模型
3. 结合大模型的一站式中药数智研发平台
4. 大模型研发应用的展望
听众收益:
1. 了解中药数智化研发创新
2. 大模型在中药研发应用
3. 了解中药研发一站式计算平台
基于生成式AI和预训练大模型打造分子设计平台
个人介绍:邓亚峰,毕业于清华大学,二十年人工智能算法及产品研发经验,现任碳硅智慧创始人兼CEO。他曾任360集团副总裁、人工智能研究院院长兼搜索事业部总经理,科创版第一家人工智能上市公司格灵深瞳CTO,北京人工智能产业联盟副理事长等职务,曾获2021年中国人工智能年度十大风云人物称号、教育部技术发明奖二等奖。他带领团队在AIDD、计算机视觉、多模态大模型、机器人、智能搜索等领域做出过创新成果或先进产品,多次在国际国内主流人工智能评测中获得过第一名,累计申请发明专利140余项(已授权98项),发表论文50+篇。
演讲题目:基于生成式AI和预训练大模型打造分子设计平台
演讲提纲:介绍2021年后生命科学领域结构预测、生成式AI和预训练模型方面的最新技术进展,结合碳硅智慧实践,简介基于生成式AI和预训练模型在对接、成药性预测、分子生成优化等方面的领域前沿技术,以及基于这些技术打造的一站式数据驱动创新药研发平台,以及平台在实际场景中的验证情况。
听众收益:
1,了解生命科学前沿AI技术;
2,了解AIDD最前沿的工具平台的发展现状和未来趋势;
3,了解基于AIDD平台进行药物设计的最佳实践;
字节跳动系统智能运维实践
个人介绍:字节跳动系统智能运维架构师,负责字节系统技术栈相关稳定性、成本优化产品、智能运维技术应用等工作。19年运维平台架构经验,15年DevOps实践经验,6年AIOps落地经验。
演讲题目:字节跳动系统智能运维实践
演讲提纲:
1. AIOPS 前沿与趋势
2. 大模型时代 AIOPS 新思考
3. 系统智能运维实践
3.1 传统 AIOPS 实践
3.2 大模型应用实践
4. AIOPS 研发效率提升实践
听众收益:
1. 运维大模型落地实践与挑战
2. 大模型可以给 AIOPS 带来哪些改变
3. AIOPS 场景落地如何提效?
基于大语言模型的运维代码理解及生成
个人介绍:徐波博士,2018年毕业于复旦大学计算机科学技术学院,获计算机软件与理论专业博士学位。同年加入东华大学计算机科学与技术学院。研究方向为知识图谱、大语言模型和智能运维。代表性成果是创建了目前最大的中文开放知识图谱之一:CN-DBpedia,累计API调用次数超过16亿次。研究成果发表在IJCAI、ICDE、ICSE、CIKM、COLING、WSDM等顶级国际会议上,曾获中国数据库学术会议(NDBC 2014)优秀论文奖。入选“上海市青年科技英才扬帆计划”。主持及参与国家重点研发计划、国家自然科学基金等国家和省部级科研项目10余项。参与国家级一流本科课程建设。担任全国知识图谱与语义计算大会CCKS 2022领域主席及多个国际会议和期刊的审稿人。曾获CCKS 2020最佳审稿人。
演讲题目:基于大语言模型的运维代码理解及生成
演讲提纲:智能运维是人工智能赋能传统产业转型升级的重要应用场景,对我国数字经济发展具有重要意义。代码理解和生成是智能运维的核心任务,但当前技术在准确性和泛化性方面仍面临挑战。生成式大语言模型的兴起为解决上述难题提供了新的途径,但同时也面临着一系列新的挑战,包括领域适配困难、生成幻觉严重和推理成本高昂等。在本次演讲中,我们将探讨这些问题,并分享我们团队在运用大语言模型进行运维代码理解和生成方面的实践经验。
听众收益:
1. 大模型在运维领域的落地方式
2. 大模型与领域知识的结合方法
3. 大小模型协同的高效推理方法
基于多个头部客户案例解析大语言模型在运维领域的落地实践
个人介绍:张博,云智慧CTO、中国通信学会专委会委员。张博先生拥有丰富的人工智能研究及行业领域实践经验;曾就职于微软亚洲研究院(Microsoft Research Asia),从事数据驱动的智能技术研究及算法工程化,其研发的智能算法已经在微软Excel、PowerBI等产品中落地应用;现致力于大模型技术在垂直领域特别是运维领域的商业实践,其带领研发的大模型产品已经在多家头部企业落地。张博先生毕业于清华大学,作为负责人完成工信部“新一代人工智能产业创新重点任务揭榜”项目一项;主导研发了智能运维领域首款算法SDK-Hours; 张博先生拥有国际专利4项,中国专利40余项目,发表多篇AAAI、ICLR等顶会论文。
演讲题目:基于多个头部客户案例解析大语言模型在运维领域的落地实践
演讲提纲:2024年是大语言模型技术落地元年,行业竞争必将从基础模型攻坚克难走向模型应用百花齐放。对于企业服务赛道,如何避免“拿着锤子找钉子”、避免“懂技术就是懂行业”、真正把技术突破与应用价值创造结合。本次分享嘉宾讲以“研究者”+“领域实践者”的双重身份解析在运维领域实际企业服务落地中如何实践大语言模型。
听众收益:
1. 大语言模型企业落地的挑战?
2. 对于大语言模型,除了基座模型,在应用层面有哪些值得研究的方向?
3. 端到端大语言模型落地范式是什么?
抖音电商数据仓库治理实践
个人介绍:彭程,毕业于大连理工大学,现任抖音集团电商数据架构师,负责抖音电商数据治理相关工作,在数据治理、数据架构领域有一定涉猎。
演讲题目:抖音电商数据仓库治理实践
演讲提纲:
1. 概述
2. 电商现状解读
3. 电商发展阶段
4. 电商解决方案
5. 思考&展望
听众收益:
1. 如何做好大体量数据下的治与理
2. 治理回归到本质是什么
3. 治理未来的方向在哪里
大数据治理:大数据价值提升之路
个人介绍:王宏志 哈尔滨工业大学计算学部长聘教授、博士生导师、计算机科学与工程系主任、海量数据计算研究中心主任、数据科学与大数据技术专业负责人,美国加州大学欧文分校博士后,微软亚洲研究院铸星计划访问学者,青年龙江学者,黑龙江省教学名师。其研究方向为大数据治理、大数据管理与分析、数据库系统等。在VLDB, SIGMOD等国内外重要会议和期刊发表学术论文300余篇,出版学术专著四本,其论文被SCI收录百余次,他引4000余次,授权发明专利35项。获得微软学者、中国优秀数据库工程师、IBM博士英才等称号,获得黑龙江省自然科学一等奖和教育部高等学校科技进步一等奖各一项,获黑龙江省青年科技奖、宝钢优秀教师奖、CSC-IBM奖教金。先后主持国家自然科学基金重点项目、国家科技支撑计划课题、国家博士后特别资助等10余个项目。中国计算机学会杰出会员,ACM SIGMOD中国秘书长、教育部高等学校计算机类专业教学指导委员会计算机系统专家委员会委员、中国数据库专业委员会常务委员、黑龙江省数据科学与大数据技术专业委员会主任委员、中国大数据专家委员会委员、哈尔滨工业大学计算学部校友会秘书长、ACM数据科学学科标准编写组专家、黑龙江省“头雁团队”成员。曾任哈尔滨工业大学英才学院副院长和中国计算机学会哈尔滨分部主席。个人主页:
http://homepage.hit.edu.cn/wang
演讲题目:大数据治理:大数据价值提升之路
演讲提纲:当前,释放数据要素价值成为数字经济的必由之路,但来自多源异构数据源的大数据价值释放需要确保大数据的高可用性,这对大数据清洗提出了要求,而大数据清洗带来了数据高熵、模态多样、错误共生等难题。本报告将对大数据清洗的概念和挑战进行了介绍,并展示大数据清洗技术方面的探索,最后加以总结,展望未来的工作。
听众收益:
1. 大数据的质量问题
2. 大数据清洗的核心挑战
3. 大数据清洗的解决方案
大规模社交图快速生成方法探索
个人介绍:王朝坤,博士,博士生导师,2006年加入清华大学软件学院,现为长聘副教授、软件学院副院长。王朝坤博士的主要研究方向为数据库理论与系统,包括网络图等复杂非结构化数据的建模、采集、存储、索引、查询、分析与挖掘,并强调融合大数据技术解决社会安全和社交网络等关键领域中的实际问题。王朝坤博士为北京电子学会理事、北京电子学会软件专业委员会秘书长、中国计算机学会数据库专业委员会委员、中国通信学会通信安全技术委员会委员,已负责完成或在研基金类科研项目共计12项,并主持或参与多项企业委托科研项目。现有科研项目主要以图和社交网络数据管理系统为研究对象,围绕非结构化数据管理领域研究热点或大数据系统实际应用展开。曾主持完成的科研课题包括音频数据管理、潜在重要节点发现、泛数据查询处理、复杂条件社区发现、需求演化建模、制造业商务智能发展模式、大数据存储体系结构等项目。
演讲题目:大规模社交图快速生成方法探索
演讲提纲:在大数据时代,随着社交网络的日益普及,亟需大规模的社交图来评估各种社交网络分析任务的算法。因为对于各种场景,很难获得亿级规模的真实世界社交图,所以高效的、可配置的社交图生成方法变得比以往任何时候都更为重要。我们将介绍课题组近期提出的社交图的高效生成方法。
听众收益:
1. 社交图有什么特点?
2. 如何快速生成大规模社交图?
3. 社交图会演化吗?
小红书图数据库在分布式并行查询上的探索
个人介绍:李凝瑞(薯名:再兴),硕士毕业于华中科技大学,现就职于小红书存储&数据库组,现负责分布式数据库的架构演进,设计与研发。曾就职于百度,是自研图数据库HugeGraph的核心创始人之一,HugeGraph现已开源并贡献给Apache社区。
演讲题目:小红书图数据库在分布式并行查询上的探索
演讲提纲:图数据库概念从提出至今已有几十年,图数据库产品的大量出现也已快有10年,但很多互联网公司的在线业务上仍然只使用了图数据库的两跳及以下的查询能力,究其原因就是三跳及以上查询的时延无法满足在线业务的要求,故不得不放弃或另寻他法。小红书图数据库团队分析原查询模式上的弊端,提出了一些优化点,并着手将分布式并行查询的思想应用至图数据库上,对此进行了一些探索实践,验证了此方案是能显著提升多跳查询的响应时间的。
听众收益:
1. 为什么在线业务上需要图数据库,为什么需要低时延的多跳查询?
2. 传统图数据库中原有的查询模式存在什么问题,有哪些可以优化的点?
3. 如何将图数据库与分布式并行查询进行结合?
数据库系统的自然语言交互方法探索
个人介绍:复旦大学博士后,毕业于复旦大学软件工程专业。主要负责的工作内容:AI4DB(包括NL2SQL以及查询可解释性问题),NLP传统研究任务(包括机器翻译、语义解析等),以及大模型相关技术(包括提示工程、参数高效微调、工具学习、模型量化剪枝等)。发表论文:在国际会议期刊ICDE、KBS、WISE、WWWJ等发表论文7篇。
演讲题目:数据库系统的自然语言交互方法探索
演讲提纲:为数据库提供自然语言的查询方式能够有效地增强传统数据库的可用性。通过此查询方式,用户能够在不熟悉数据库查询语言,以及不了解底层数据存储结构的情况下,直接通过日常使用的自然语言提交查询请求,从而获取数据库中的相关数据信息。近年来,随着机器学习技术的快速发展,尤其在自然语言机器翻译技术上取得的显著进步,越来越多的翻译方法被相继提出。在此基础上,我们从数据库的角度出发,在数据库的自然语言交互方法上也进行了一系列探索。
听众收益:
1. 除了通过传统序列到序列的翻译方法解决NL2SQL问题,是否还有其他方法?
2. 如何利用更可靠的排序机制,获取更可靠的翻译结果?
2. 如何能够指导大模型更好地生成可靠的SQL语句?
抖音电商埋点与归因分析实践思考
个人介绍:十多年大数据经验,曾在招行、阿里任职,现任抖音集团电商数据架构师,在数仓建设、数据平台工具等方面经验丰富。
演讲题目:抖音电商埋点与归因分析实践思考
演讲提纲:
1. 抖音电商埋点问题
2. 整体的解决方案介绍
3. 相关实践落地
听众收益:
1. 电商场景埋点对数据加工分析的影响
2. 如何建设高效的数归因分析能力
3. 埋点归因方案中的核心关键点
零售行业商品竞争力提升的数据探索
个人介绍:2015年硕士毕业于浙江大学计算机学院,之后加入阿里巴巴,在AliExpress工作三年,主要负责APP运营和商家数据产品相关的数据工作,18年加入盒马,目前负责数据研发和数据服务团队,主要承担数据建模、数据服务平台、用户画像、商品标签、智能算法等相关工作。
演讲题目:零售行业商品竞争力提升的数据探索
演讲提纲:
1. 商品全链路竞争力提升的数据体系与思路,数据能力在商品流通各环节的核心方法和实践;
2. 系统化的数据管理与服务方法,打破商品全周期数据使用的壁垒,提升数据加工、流转和应用的效率;
3. 面向智能化时代数据架构设计的探索,对未来零售行业数据应用场景的设想与讨论。
听众收益:
1. 了解零售行业在品类规划、商品竞争力提升等方面的探索;
2. 理解零售公司对数据的管理和使用体系、方法与实践;
3. 探讨面向智能化时代,数据在组织、管理和应用的尝试。
京东零售的指标中台建设
个人介绍:京东零售数据应用工程师,架构师,北京大学硕士。在大数据处理,分析,应用,架构等有丰富的实战经验。现负责京东零售数据资产的标准制定以及指标中台的建设。
演讲题目:京东零售的指标中台建设
演讲提纲:京东零售从2022年开始指标中台的建设,来解决口径有歧义,存算不受控,开发效率低,指标难共享等问题。期间结合京东零售多种运营视角、多种组合计算、多种销售属性等特点,分别在查询层,语义层和加速层进行了创新,这个过程中基于 RBO、HBO 等多级加速引擎、基于代价与场景消费的智能物化策略、基于 One Metric 的异构融合服务、基于 One Logic 语义层的离近在线转换,显著提升业务数字化决策效率。
1. 背景介绍
a) 问题和痛点
b) 建设目标
2. 指标中台建设
a) 语义层建设-数据知识系统化,使资产放心好用、治理有依据
b) 查询层建设-统一查询语言,最佳查询策略、最优查询性能
c) 加速层建设-基于数据消费行为、系统内置规则自动加速
3. 应用实战案例
a) 通用域指标建设-离近在线转换
b) 专属域指标建设-切分资产扩维
4. 总结与展望
听众收益:
1. 了解京东零售的数据治理思路和经验
2. 了解如何基于现状,在有历史包袱的情况下搭建指标中台,以及在建设过程中遇到的问题
3. 了解如何如何从海量的数据模型与数据指标中提升检索数据的效率,降低数据存算的成本,提供更可信的数据内容和多种应用模式快速支撑业务的数据决策与分析
辛选集团数据中心建设之路
个人介绍:曾在世界五百强企业担任大数据架构师,数据团队负责人等职务,比较擅长为企业提供数据领域的解决方案。
演讲题目:辛选集团数据中心建设之路
演讲提纲:
1. 辛选集团简介
2. 在辛选的数据价值与定位
3. 数据平台和数仓搭建
4. 数据产品和指标体系的搭建
5. 数据分析体系的搭建
6. 数据赋能直播业务案例
7. 赋能中反哺数据治理
抖音电商数据血缘探索和实践
个人介绍:抖音电商数据BP血缘项目架构师、火山引擎DataLeap研发架构师。专注大数据开发,致力于通过建设高质量的数据全链路血缘资产,围绕数仓的研发提效、模型质量、运维等场景,为各个业务方(数仓、DA、工程团队、B端客户)赋能。主导了抖音电商从数据源到数据应用的全链路血缘建设,并上线了一系列如代码速读、模型切换、影响面追踪等功能。
演讲题目:抖音电商数据血缘探索和实践
演讲提纲:
一、血缘底座
这部分介绍血缘底座的建设,包括数据生产侧和消费侧血缘数据的采集、存储、分析以及血缘数据的本身的评估方法;此外还介绍宽口径/中口径字段血缘及其适用的场景。
二、基于血缘的应用
基于血缘的应用很多,重点介绍一下如下三个(分别对应质量、提效、运维场景)
1. 模型评估:介绍如何基于血缘数据评估数仓的建设质量;在治理过程中,如何高效、可靠地完成大规模的数仓模型切换。(模型优化&模型切换)
2. 字段口径探查:介绍如何基于血缘,探查某个字段的加工逻辑,支持穿透到上游ODS模型,能够减少80%的代码阅读量,并且提供一种可视化代码展示方式。(代码逻辑可视化&字段口径探查)
3. 影响面评估:① 如何利用字段血缘评估变更的影响面;② 如何及时、准确地将上游变更影响周知到关联方。
听众收益:
1. 数据全链路血缘如何采集、加工、存储?
2. 如何衡量血缘建设质量?
3. 抖音电商是如何通过数据血缘,帮助用户节省80%的sql阅读量的?
4. 抖音电商是如何在高速发展的过程中,快速完成2W+任务切换?
数据在零售供应链领域的应用
个人介绍:企业数智化领域10余年经验,先后就职于美团点评、阿里巴巴、菜鸟等大型互联网公司,对企业数智化转型、数智供应链、供应链金融等领域有深厚的积累沉淀。多次主导企业级数据中台和数智产品的实施,能够很好地将数智技术&产品与业务相结合,针对不同行业不同场景设计落地行之有效的数智化转型方案。目前负责菜鸟物流科技副总经理,带领团队深耕数智供应链领域,帮助企业级客户在数智时代打造领先的供应链能力。
演讲题目:数据在零售供应链领域的应用
演讲提纲:
1. 数据在供应链领域的问题和系统解决方案
2. 产品:基于数据构建供应链控制塔,解决信息流、商流、物流协同问题;
3. 业务:基于数据构建供应链金融科技,解决供应链资金流问题。
听众收益:
1. 对供应链领域的数据问题和系统解决方案加深认知
2. 了解供应链控制塔产品的构建逻辑和思路
3. 了解数据在供应链金融业务的应用
AI Agent 在电商平台中的应用
个人介绍:1688资深技术专家,现1688AI创新产品与应用负责人,专注在大模型与电商的深度结合领域。曾主导了1688运营数据化和智能化从0到1的平台建设,推动了1688电商内容化的算法及工程架构升级,孵化了平台的第一代终端智能交互技术产品。
演讲题目:AI Agent 在电商平台中的应用
演讲提纲:
1. AI Agent 对电商平台的价值
2. AI Agent 在电商的应用举例
3. AI Agent 的技术方案介绍
4. 实现 AI Agent 的关键要素
5. 部署 AI Agent 的挑战与机遇
6. 总结对 AI 发展的思考与期待
听众收益:
1. AI Agent 的典型应用场景
2. AI Agent 与传统研发范式的区别
3. AI Agent 落地的实践挑战
跨境电商物流系统相关异常信息识别
个人介绍:英国爱尔兰Dublin City University博士,武汉大学本科,曾经就职于IBM Watson、阿里巴巴等企业,现就职于SHOPEE虾皮科技有限公司,负责商品智能化算法以及多语言商品知识图谱相关算法服务建设。
演讲题目:跨境电商物流系统相关异常信息识别
演讲提纲:
1. 跨境电商物流系统简介
2. 异常信息在跨境电商物流中的影响
3. 应用商品知识图谱实现异常检测
4. 未来的工作
听众收益:
1. 跨境电商异常预测业务
2. 异常预测模型架构
3. 如何建立商品知识图谱来解决
B站基于数据治理运营框架的应用实践
个人介绍:从事数据一线工作多年,先后在 ebay,携程从事数仓、数据分析、数据产品工作,目前在B站实践 DAMA 数据治理,负责过数据质量、数据成本2个主题 ,参与了B站的数委会、数据治理平台、元数据数仓建设、数据资产归属等一系列数据管理能力提升的项目活动。
演讲题目:B站基于数据治理运营框架的应用实践
演讲提纲:
1. 资源风险案例分析
2. 治理运营虚拟组织建设思路
3. 嵌入式治理的实施方案
4. 基于数据治理的元数据管理流程
5. 数据质量运营框架 与 2线6问
听众收益:
1. 从一线数据运营视角观察数据治理,理解数据治理、数据管理、数据运营的关系和异同点
2. 获得一套已经在应用中的元数据模型,支持数据治理工作开展、评价得失
3. 借鉴一次 DAMA 方法的落地应用,在开展其他主题的数据管理工作时有迹可循
基于存储的近实时数仓架构在字节的应用
个人介绍:李枭冰,硕士,抖音集团电商数据架构师,专注于实时任务开发、运维、治理流程化工具化平台化自动化体系化改造。
演讲题目:基于存储的近实时数仓架构在字节的应用
演讲提纲:
1. 字节实时架构的演变
2. 基于存储的准实时架构在平台侧、引擎侧的挑战与实践创新
3. 直播、短视频业务在基于存储的实时数仓架构的实践
听众收益:
1. 字节在基于存储的实时数仓的最佳实践
2. 通过存储实时数仓架构,简化了开发,降低了资源消耗
知乎 DMP/CDP 平台的应用和实践
个人介绍:知乎舰桥平台研发 Leader,知乎舰桥平台是:面向内容运营、用户运营、活动运营、创作者运营、场景运营(热点&热榜&话题&推送等)、生态分析等业务场景搭建的一站式平台。其中包含内容&用户管理和运营平台、内部营销平台(活动引擎&搭建&分析&投放平台)、内部投放和资源管理平台、创作者管理平台、DMP平台、内容池平台、经营分析平台、场景运营平台等等,全方位赋能业务运营和业务发展。
演讲题目:知乎 DMP/CDP 平台的应用和实践
演讲提纲:数据驱动的时代正在全速向前,如何利用 Data Management Platform(DMP)和 Customer Data Platform(CDP)成为企业竞争力提升的关键。本次分享中,我们将深入探讨这两者在知乎的应用与实践。从其背后的业务逻辑出发,揭示知乎如何运用DMP/CDP驱动用户增长,提升内容定制、广告系统的精准度。同时,我们将揭示架构的设计思路,平台如何有效地落地运作,并分享在这一过程中遇到的技术挑战以及我们是如何解决它们的。最后,将扫描未来的趋势,对企业如何布局数据管理提出前瞻性的见解。无论您是产品还是研发,本次分享都将为您带来独到的洞察力和可行的建议。主要内容包括:
1. 业务背景
2. 平台的架构和设计
3. 难点和技术挑战
4. 未来趋势和展望
听众收益:
1. 通过 DMP(CDP)平台,为公司可解决哪些问题?
2. 平台的建设和落地中遇到的难点和挑战?
3. 不同业务场景下的问题如何解决?
大数据架构优化之沐瞳出海实践业务分享
个人介绍:拥有6年大数据运维经验,加入沐瞳来,一直负责沐瞳大数据运维工作,主要担任沐瞳大数据运维体系建设,在 AWS 云上运维成本优化有显著成果。
演讲题目:大数据架构优化之沐瞳出海实践业务分享
演讲介绍:介绍沐瞳大数据架构在出海业务上设计和优化,对 AWS 服务使用上的经验分享,对 AWS 云上成本优化和架构设计实践方案分享。
演讲提纲:
1. 沐瞳海外业务大数据架构
2. AWS S3 存储方案设计
3. 基于 S3 存储存储清单和访问日志做存储分析
4. 基于存储分析做 S3 分层存储策略优化及成果
听众收益:
1. 海外游戏业务大数据架构设计
2. AWS 云上管理架构方案
3. AWS S3 优化方案
欧美 KOL 营销技术应用探索
个人介绍:10年游戏海外市场发行及营销。2014年入职于德国慕尼黑上市电视媒体公司ProsiebenSat1游戏发行部门,负责中国区发行选品,分析和建模。2016年入职于德国柏林整合营销机构ComboStrike,负责中国办公室从0到1搭建,整合营销提案及执行。目前在腾讯游戏IEGG,探索海外游戏营销中台服务增长点。
演讲题目:欧美 KOL 营销技术应用探索
演讲提纲:
1. 文化差异:国内主流freemium和海外pc主机premium的差异:市场,玩家,产品,触媒习惯
2. 欧美游戏市场宣发和数据的运用(已落地实践部分)
3. 腾讯数据运用拓展方向探索:
① KOL业务为例:基本工作流程,效率提升点,产业结构,探索方向
② 游戏标签,内容标签,品牌安全,舆情,后链路 > 数据结构 > 推介算法的探索
听众收益:
1. 海外游戏营销的特征:国内免费手游为主,海外买断制pc/主机游戏是怎么推广的?和免费制手游推广有什么区别?
2. 腾讯如何探索搭建适合海外二方studio(腾讯投资)的业务?以正在探索的KOL板块为例。
AIGC 垂类落地实战
个人介绍:多年百度搜索、大数据工作经验,专注于自然语言处理方向,曾获 CCKS 中文知识图谱大赛第一名。目前于阅文集团担任 AIGC 负责人职位,负责大模型、多模态、产研落地与知识管理与评估等多个团队工作。
演讲题目:AIGC 垂类落地实战
演讲提纲:
1. AI 生产 - 内容赛道面临的机会与挑战
2. AI 扮演 - 人们需要的到底是怎样的角色
3. AI 改编 - 从文字到视频,AI 理解的内容到底是什么
听众收益:
1. 内容来自于行业落地一手实践信息;
2. 公司 AIGC 转型后的落地风险与经验;
3. 大规模下 AIGC 实际应用带来的业务价值;
Soul 基于 AIGC 的实践与探索
个人介绍:中国科学技术大学硕士毕业,曾就职于华为,2020年加入 Soul,组建视觉算法团队,主要负责视觉生成,多模态理解,虚拟数字人相关工作。
演讲题目:Soul 基于 AIGC 的实践与探索
演讲提纲:
1. 新时代的 AIGC 浪潮发展
2. Soul 在 AIGC 的各领域探索与实践
3. 领域垂类的优势构建与思考
4. 未来技术方向的发展与探讨
听众收益:
1. 社交领域的 AIGC 落地经验
2. 如何结合当前业务需求与技术变革
基于多模态技术的保险智能理赔介绍
演讲题目:基于多模态技术的保险智能理赔介绍
“天镜”大模型与多模态金融场景
个人介绍:邓伟洪,马上消费金融AI研究院副院长,作为主要研究人员参与 OpenCV等开源项目的研发工作,长期致力于多模态大模型和计算机视觉系统的理论研究和实用化落地,在 CVPR、TPAMI 等顶级会议和期刊上发表100多篇文章,谷歌学术引用15000多次,曾获北京市优秀博士学位论文奖、北京市科技新星项目、国家级青年人才项目,2023年入选斯坦福“全球前2%顶尖科学家”和科睿唯安“全球高被引科学家”榜单。
演讲题目:“天镜”大模型与多模态金融场景
演讲提纲:多模态技术可以将不同类型的数据(如文本、图像/视频、语音等)进行整合,并利用大模型对数据进行理解和生成,在金融场景有广泛的应用。本报告将介绍马上消费金融的“天镜”大模型的关键技术与实践应用,同时展望未来多模态的广阔应用。例如,可以利用图像和语音识别技术对金融场景情况等进行监测和评估,从而提前预警潜在的风险。结合文本分析和情感分析等技术对市场情绪进行预测,帮助投资者做出更准确的决策。利用语音识别和自然语言处理技术对交易的语音通话进行实时监测和分析,从中提取出有用的信息,辅助决策和发现潜在的违规行为。
听众收益:
1. 多模态大模型的关键技术与应用
2. “天镜”金融大模型的关键技术与实战应用
3. 多模态大模型的金融应用场景
核保风控领域的大模型应用
个人介绍:18年加入平安,目前负责平安产险数据智能应用落地及相关工作。
演讲题目:核保风控领域的大模型应用
基于图计算的反洗钱可疑交易监测实践
个人介绍:2016年武汉大学概率与数理统计专业硕士毕业后入职腾讯金融科技风控与反洗钱部门,7.5年风控与反洗钱经验。主要负责支付合规与反洗钱可疑交易监测模型相关工作。
演讲题目:基于图计算的反洗钱可疑交易监测实践
演讲提纲:在移动互联网高速发展下,网络犯罪呈现高发态势,洗钱手法不断更新,且呈现出团伙性、组织性、隐蔽性等愈发明显的特征,财付通提出基于图计算的可疑交易监测方法,以能够识别出具有高价值的可疑线索。本演讲将从客户关系图谱构建、图计算方法应用、实践案例剖析等为大家讲解如何搭建基于图计算的可疑交易监测体系,来全面提升可疑交易监测识别效果。具体内容包括:
1. 可疑交易监测难点与挑战
2. 图计算体系框架
3. 图谱系统架构
4. 图计算应用实践
5. 总结与展望
听众收益:
1. 了解反洗钱可疑交易监测难点和挑战
2. 了解基于图计算的可疑交易监测体系
3. 了解关系图谱构建与图谱系统架构
4. 了解团伙挖掘与图表示学习的应用实践
文档智能在金融领域的应用
通义灵码智能编码助手技术解密
个人介绍:阿里云云效、通义灵码产品技术负责人,致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。
演讲题目:通义灵码智能编码助手技术解密
演讲提纲:随着大模型技术的成熟,以及大模型在代码生成中的优秀表现,让以智能化为核心的软件研发3.0时代很快就会到来。其核心是围绕大模型去构建新一代软件研发智能化工具,最终创造出“AI原生研发模式”,从而让研发效能出现质变。通义灵码就是基于大模型技术打造的新一代智能编码工具,其核心就是未来软件研发工具的“大脑”。本次分享将解密通义灵码核心技术,讲述其背后的思考与创新。具体包括:
1. AI成为软件研发的必选项
· AIGC从可选项逐步变成研发工作的必选项
· 企业软件研发的挑战及智能化的机会
· 智能化软件研发发展趋势
2. 通义灵码核心技术解密
· 极致的开发者体验
· 极致的技术优化
· 极致的模型能力
3. 企业落地研发智能的策略与路径
· 企业构建研发智能化的策略
· 通义灵码企业个性化方案
· AI 赋能软件开发全生命周期场景探索
听众收益:
1. 了解软件研发智能化趋势与机会
2. 了解通义灵码核心技术与最新代码大模型能力
3. 了解企业落地智能研发的策略与路径
大模型在金融风控领域的应用与展望
个人介绍:夏一楠,2018年硕士毕业于清华大学,2020年加入京东科技任算法工程师,负责京东金融产品风控反欺诈建模与应用。主要研究方向包括图算法,自然语言处理,异常检测。
演讲题目:大模型在金融风控领域的应用与展望
演讲提纲:
1. 金融风控领域的建模问题特点
2. 大语言模型及相关技术在金融风控领域的应用方向
3. 京东科技信贷及反欺诈大模型架构
4. 大模型技术落地应用的挑战
听众收益:
1. 了解金融风控领域建模问题及当前行业通用解决方案。
2. 了解 NLP 技术和大语言模型及其相关技术,在当前通用方案的优化点。
3. 了解当前京东科技在信贷反欺诈方向,对大模型技术的探索与应用。
AI 技术演进与商业落地:从学术探索到创业实践的全景观察
个人介绍:谢飞,博士研究生,中再产险创新业务部资深承保师,百度人工智能AICA,百度人工智能技术专家,负责公司科技化转型和科技化业务落地工作。2011年加入中再产险,先后获得了上海市金融创新成果三等奖、上海金融改革发展成果一等奖、上海市金融创新先进个人、上海市青年金才等奖励,并担任上海航保协会创新专委会主任职务,设计并参与了上海航运保险指数编制、中再众安区块链再保险交易平台、上海再保险中心制度设计、中再智能条款库、“再 · 途”新能源车保险定价风控大模型、普惠型及行业示范型网络安全保险等工作。
演讲题目:AI 技术演进与商业落地:从学术探索到创业实践的全景观察
演讲提纲:结合近几年AI领域的技术变迁和细节(CNN ~ pretrain+finetuning ~ transformer ~ LLM)分别从 AI 学术、AI 产业化落地、AI 创业的不同角度谈谈其落地方式和建议。
1. AI 技术变迁的商业驱动背景;
2. AI 在铁谱图像识别方面的学术研究;
3. AI 在智能条款库和火灾识别方面的产品落地;
4. 总结与展望
听众收益:
1. 如何破解当下企业的智能化转型之痛?
2. AI 的前沿学术方向有哪些?
3. AI 学术、AI 产业化落地、AI 创业的不同细分落地方式分别是什么?
上海市长宁区延安西路1116号,上海龙之梦大酒店