【线下·深圳】极致效能OLAP论坛免费门票

免费报名中

6893 人关注

时间 2023-11-25 09:00 ~ 12:20

地址广东深圳市深圳机场凯悦酒店

活动由 DataFun 主办

大会倒计时：

天

时

分

秒

免费报名中

6893 人关注

微信分享

使用微信扫一扫分享到朋友圈

活动分享

使用微信扫一扫进入小程序分享活动

活动详情

即日起免费报名【极致效能OLAP论坛】，并于【11月25日上午】签到，可得：

🎁价值💰2000元的当日所有平行论坛门票

🎁价值💰365元的DataFunPro会员年卡1张

🎁大数据/AI方向技术书籍1本（仅限前50名签到用户）

11月25日(本周六)9:00-18:00，诚邀您来「深圳机场凯悦酒店」参加 DataFun 2023年举办的最后1场线下大会，微信、vivo等技术专家将分享：

🔥OLAP业内新动态与行业实践，例如：ClickHouse 2024年新版本揭秘、微信WeOLAP新场景优化实践

🔥新一代数据架构的实践与思考，例如：OPPO下一代大数据AI一体架构实践

🔥数据治理的发展趋势与创新，例如：DataOps 加大模型促进数据工程创新

🔥数据产品设计实践与营销，例如：B站业务用增数据的建设

🔥云原生大数据迭代升级，例如：永辉超市云原生数据中台的探索与实践

活动议程速览

【线下·深圳】极致效能OLAP论坛免费门票

活动议题详情

2023-11-25

09:00 -12:00

新一代数据架构论坛

2023-11-25

09:00-09:45

货拉拉大数据下一代基础架构实践与思考

听众收益：

1. 面对资源波峰低谷，如何在成本和资源效率间平衡

2. 除了 x86 服务器，我们还有别的选择么

3. 面向云原生浪潮，大数据架构如何演进

嘉宾

何洋

货拉拉大数据专家

2023-11-25

09:45-10:30

知乎大数据跨机房实践

演讲提纲：

介绍知乎大数据跨机房方案，如何在多个机房之间迁移数据，调度计算作业并保障稳定性。

听众收益：

1. 如何设计并实现 Hadoop 跨机房方案

2. 如何在多集群之间进行快速的数据迁移

3. 如何在多集群架构下保障稳定性

嘉宾

贾承昆

知乎数据平台负责人

2023-11-25

10:30-11:15

OPPO下一代大数据AI一体架构实践

演讲提纲：

技术架构：

1. 云原生的计算架构：云上极致弹性计算架构助力大幅降本

2. 大数据AI一体化数据湖架构:秒级实时、元数据管理、自动索引构建、非结构化数据管理

3. 应用落地：

（1）多数据源一键实时入湖，多维度数据秒级查询可见，代替部分实时场景对kafka依赖，流批一体，实现大幅降本增效；

（2）基于数据湖的实时特征平台建设，基于实时湖仓+Flink，实现流批一体特征工程数据开发，PB级特征近实时更新

（3）大模型非结构化文本训练数据入湖，加速大语言模型训练

（4）数据湖在混合云场景应用

听众收益：

了解新一代大数据AI一体架构如何在公有云上降本增效，大数据和AI如何在数据层一体化，不仅了解数据湖本身的技术架构，同时将了解在实时湖仓、搜推算法、大模型训练、混合云上不同场景的应用落地经验。

嘉宾

付庆午

OPPO 数据智能中心大数据架构师

2023-11-25

11:15-12:00

vivo 超大数据规模下分布式消息中间件架构演进实践

演讲提纲：

1. 十万亿级消息中间件架构演进实践

2. 消息中间件监控告警实践

3. 分布式消息中间件Pulsar核心架构升级

4. 分布式消息中间件Pulsar新特性

听众收益：

1. 了解 vivo 分布式消息中间件平台及监控告警体系建设；

2. 了解日均十万亿级的消息处理分布式消息中间件平台在高可用性、增效降本等场景下的技术方案思考和相关难点问题的解决思路，以及下一代云原生分布式消息中间件Pulsar在超大数据规模下的架构优势。

嘉宾

罗明波

vivo 互联网大数据专家

2023-11-25

09:00 -12:20

极致效能OLAP论坛

2023-11-25

09:00-09:40

ClickHouse 2024新功能与研发方向思考

演讲提纲：

ClickHouse是业内公认最快的OLAP数据引擎，同时clickHouse也在面对来自包括中国区在内的全球的优秀产品的竞争，这也激励了我们更加努力地发展社区，完善我们的产品。我们非常愿意分享我们产品的新功能新特性以及未来的roadmap，我们也希望听到来自中国社区和用户的期望。

嘉宾

Alexry Milovdov

ClickHouse CTO

谢志豪

ClickHouse 技术支持工程师

2023-11-25

09:40-10:20

使用 JIT 技术实现高效的数据库表达式求值

演讲提纲：

1. 介绍数据库表达式求值的一般方法

（1）什么是表达式求值问题

（2）常见方法如向量化/JIT/树遍历等

（3）不同的数据库的解法

2. JIT即时编译技术

（1）什么是JIT即时编译技术

（2）JIT技术的优缺点

3. 使用Gandiva表达式编译器

（1）介绍Apache Arrow

（2）介绍Gandiva表达式编译器, LLVM及其工作

听众收益：

1. 如何对数据库表达式求值

2. JIT即时编译技术的基本概念以及为什么需要JIT

3. 如何使用Apache Arrow/Gandiva的JIT即时编译技术加速计算

嘉宾

吴立

炎凰数据研发工程师

2023-11-25

10:20-11:00

Bit-sliced-index：基于 Roaringbitmap 的人群 OLAP 分析、在线服务的 one more thing?

演讲提纲：

第一部分：

1. 灵犀互娱面向游戏用户的数据难题

2. 元数据驱动数据架构设计

第二部分：

此次分享将介绍现代 DMP 平台中的数据存储与计算面临的特点与挑战，以及为灵犀互娱针对海量数据的建模与存储计算优化策略。具体包括：

1. 灵犀互娱业务数据应用现状及挑战

2. 基于 Roaring Bitmap 与 Bit-Index Slice 的数据存储、计算原理介绍

3. 案例分享

听众收益：

第一部分：

1. 人群和指标的高效联动分析

2. 高性能人群服务如何设计

第二部分：

1. 海量数据建模、存储与计算解决方案

2. 如何构建高效的海量数据平台架构快速进行数据分析

嘉宾

黄海林

灵犀互娱技术专家

唐凯麟

灵犀互娱高级研发工程师

2023-11-25

11:00-11:40

WeOLAP：微信 OLAP 新场景优化实践

演讲提纲：

1. ClickHouse 在微信的新应用场景

2. 如何进行查询性能观测

3. 湖仓读取场景优化

4. 实验场景优化

5. 向量数据库应用 & embedding 检索优化

嘉宾

孙弘毅

微信大数据研发高级工程师

2023-11-25

11:40-12:20

ClickHouse 在 vivo 的应用实践

演讲提纲：

1. vivo OLAP 的发展历程与选型

2. ClickHouse 的稳定性实践

3. ClickHouse 查询优化实践

4. ClickHouse 实践案例

听众收益：

1. 了解 ClickHouse 常见的稳定性问题及解决方案

2. 了解 ClickHouse 的查询优化方面的实践技巧

3. ClickHouse 如何赋能业务，带来降本增效

嘉宾

袁文兵

vivo 互联网大数据架构师

2023-11-25

09:00 -12:00

云原生大数据迭代论坛

2023-11-25

09:00-09:45

混合云原生大数据底盘

演讲提纲：

1. 背景与趋势

2. 顺丰混合云原生数据架构升级

3. 顺丰大数据架构应用案例

听众收益：

1. 多云融合的大数据基础设施如何做到低成本

2. Hadoop 与云原生架构如何做融合

3. 跨机房离线任务如何保障计算效率

嘉宾

曾昭正

顺丰科技大数据高级研发工程师

2023-11-25

09:45-10:30

零售行业永辉超市云原生数据中台的探索与实践

演讲提纲：

1. 永辉数据中台的经路历程

2. 以数据赋能零售业务的探索与实践

3. 数据治理思维驱动数据中台稳定高效

4. 未来展望

听众收益：

1. 了解零售业数据中台私有云建设的探索与实践

2. 了解数据治理在数据中台中的思维体现

3. 了解数据如何赋能复杂的零售业务变化

4. 对零售业技术的未来的探索与实践

嘉宾

马吉辉

永辉超市大数据架构师

2023-11-25

10:30-11:15

物化视图在 MaxCompute 中的探索与实践

演讲提纲：

物化视图是将查询预先计算并存储的一张特殊的物理表，当执行相关查询时，可以复用预计算结果，提高查询性能，是降本增效的妙招；本次演讲将从物化视图创建、物化视图维护、物化视图应用和物化视图推荐及自动物化视图4个方面介绍物化视图在 MaxCompute 中的探索和实践。

嘉宾

雷春蔚

阿里云 MaxCompute SQL 引擎技术专家，Apache Calcite PMC

2023-11-25

11:15-12:00

火山引擎 ByteHouse 的云原生探索与实践

演讲提纲：

近年来，随着云基础设施的成熟和数仓技术的发展，云原生数仓凭借按量付费、按需弹性的特点越来越受到客户的青睐。字节跳动在云数仓领域有十多年技术经验积累，并基于开源 ClickHouse 推出的云原生数据仓库 ByteHouse。本次分享将从云数仓历史和前沿出发，介绍 ByteHouse 云数仓的整体架构和亮点，以及存算分离的关键设计与实践。主要包括以下内容:

1. 数仓架构演进历史

2. 云数仓演进中的技术难点和问题

3. ByteHouse 云数仓架构设计以及存算分离的关键技术

4. ByteHouse 存算分离的实践与优化

听众收益：

1. 了解云原生数仓的发展与核心价值

2. ByteHouse 云数仓的架构设计与技术亮点

3. 云原生数仓的挑战和展望

嘉宾

任强

火山引擎 ByteHouse 技术专家

2023-11-25

14:00 -17:20

数据治理发展趋势论坛

2023-11-25

14:00-14:45

蚂蚁新一代数字智能化治理平台 AutoFinOps 实践与探索

演讲提纲：

科技驱动一直是蚂蚁的核心发展理念，也是蚂蚁安身立命之本。蚂蚁过去的发展，源于能够始终抓住技术变革机遇，用技术创造价值。蚂蚁集团在面对EB级数据规模、错综复杂的业务以及数字时代新型安全风险挑战，数据治理除了传统的运动式治理、元数据驱动治理、一站式治理平台、自上而下的治理规范制度约束等解决方案外，也在不断尝试技术创新和架构升级等手段破局和提效，提供更加高效、便捷、丝滑的自动化、智能化解决方案，本次分享带你深入了解蚂蚁如何通过治理数字智能化快速实现“无感降本”，特别是智能归因、AutoFinOps、错峰计算等技术应用和实践，期待你的聆听，也期待与你一起交流。具体内容包括：

1. 数据治理的困难与挑战

2. 数据治理的顶层设计和架构

3. 数据治理自动化和智能化的最佳实践

4. 思考总结与未来展望

听众收益：

1. 了解蚂蚁数据治理的设计思路

2. 深度解读蚂蚁“无感降本”技术如何高效实现

3. 探讨数据治理领域未来趋势

嘉宾

林天权

蚂蚁集团高级数据技术专家

2023-11-25

14:45-15:30

DataOps 加大模型促进数据工程创新

演讲提纲：

在数字化时代，数据管理和分析至关重要，而传统数据管理和分析存在诸多的挑战，在此背景下通过分析 DataOps 大模型的特点，提出 DataOps 的基础上结合大模型能力，实现数据工程的敏捷和智能化，促进数据分析的快速交付和数据民主。本次分享的主要内容包括：

1. 传统数据管理面临的挑战

2. DataOps 与大模型结合激活数据工程潜力

3. 数造科技 DataOps 与大模型的产品落地实践

4. 未来展望

听众收益：

1. DataOps 的工作流程

2. 大模型 Text2SQL 的能力

3. DataOps + 大模型如何进一步提效数据工程

嘉宾

杨明皓

数造科技高级大数据技术专家

2023-11-25

15:50-16:35

快手数据成本白盒化治理实践

听众收益：

1. 深入到大数据存储计算引擎和数据仓库，对其进行白盒化拆解，在治理思路、治理经验等方面有不少可借鉴之处

2. 讲述快手实践，如何成功降低千万级存储和计算成本

嘉宾

冯赞锋

快手大数据架构师

2023-11-25

16:35-17:20

阿里云 DataWorks 湖仓融合数据治理与大模型应用探索

演讲提纲：

1. 湖仓融合：现代企业数据架构演进

2. 湖仓融合数据开发与治理应用实践

3. DataWorks Copilot 结合大模型应用探索

嘉宾

田奇铣

阿里云高级产品专家、阿里云DataWorks产品负责人

2023-11-25

14:00 -16:30

数据产品设计实践论坛

2023-11-25

14:00-14:45

京东物流一站式敏捷BI产品规划与落地实践

演讲提纲：

1. 京东物流业务数据应用现状及挑战。

2. 一站式敏捷BI产品的规划与迭代升级路径。

3. 业务应用实践案例

听众收益：

1. 理解敏捷BI产品规划和设计要点

2. 学习如何提升BI类数据产品的性能和用户体验

3. 学习BI产品助力业务自助式实现数据分析的实践路径。

嘉宾

焦文健

京东大数据产品总监

2023-11-25

14:45-15:30

线下营销的数智化应用分享

演讲提纲：

1. 线下营销盲点分析

2. 利用数智能力实现线下营销人群的精准定位、精准触达、效果评估、资产二次运营的实践方法论分享

3. 案例分享

听众收益：

1. 如何实现线下精准营销？

2. 如何评估户外品牌广告的效果？

3. 如何沉淀户外营销的资产？

嘉宾

董沅

阿里巴巴瓴羊数字营销产品经理

2023-11-25

15:50-16:35

电商与内容型业务用增数据的基建异同

演讲提纲：

在不同的业务类型、组织形态、发展阶段等要素下，用增数据如何建设好。

听众收益：

用增数据建设在诸多不同要素下的数据实践差异：

1. 业务类型：电商业务v.s.内容社区业务

2. 组织形态：自上而下型v.s.自下而上型

3. 发展阶段：成熟期v.s.生长期

嘉宾

熊瑾

bilibili 数据产品经理

货拉拉大数据下一代基础架构实践与思考

何洋

货拉拉大数据专家

个人介绍：何洋，本科毕业于中南大学，先后就职于唯品会、饿了么、拼多多，负责过万级规模大数据集群，目前就职于货拉拉，主要从事大数据安全、计算资源调度、大数据平台和 GPT 应用相关工作。

演讲题目：货拉拉大数据下一代基础架构实践与思考

演讲提纲：

1. 背景与挑战

2. 基础架构实践

3. 总结与思考

4. 未来展望

听众收益：

1. 面对资源波峰低谷，如何在成本和资源效率间平衡

2. 除了 x86 服务器，我们还有别的选择么

3. 面向云原生浪潮，大数据架构如何演进

知乎大数据跨机房实践

贾承昆

知乎数据平台负责人

个人介绍：贾承昆。曾就职于阿里云、猿辅导、知乎等公司。有多年数据架构方向的工作经验。负责知乎大数据的基础架构和数据平台相关的工作。

演讲题目：知乎大数据跨机房实践

演讲提纲：介绍知乎大数据跨机房方案，如何在多个机房之间迁移数据，调度计算作业并保障稳定性。

听众收益：

1. 如何设计并实现 Hadoop 跨机房方案

2. 如何在多集群之间进行快速的数据迁移

3. 如何在多集群架构下保障稳定性

OPPO下一代大数据AI一体架构实践

付庆午

OPPO 数据智能中心大数据架构师

个人介绍：目前在OPPO数据架构组负责架构演进研发，Spark 开源RSS项目Shuttle发起人，曾供职去哪儿网大数据，阿里云MC团队。

演讲题目：OPPO下一代大数据AI一体架构实践

演讲提纲：

技术架构：

1、云原生的计算架构：

云上极致弹性计算架构助力大幅降本

2、大数据AI一体化数据湖架构：

秒级实时、元数据管理、自动索引构建、非结构化数据管理

应用落地：

1、多数据源一键实时入湖，多维度数据秒级查询可见，代替部分实时场景对kafka依赖，流批一体，实现大幅降本增效

2、基于数据湖的实时特征平台建设，基于实时湖仓+Flink，实现流批一体特征工程数据开发，PB级特征近实时更新

3、大模型非结构化文本训练数据入湖，加速大语言模型训练

4、数据湖在混合云场景应用

听众收益：了解新一代大数据AI一体架构如何在公有云上降本增效，大数据和AI如何在数据层一体化，不仅了解数据湖本身的技术架构，同时将了解在实时湖仓、搜推算法、大模型训练、混合云上不同场景的应用落地经验。

vivo 超大数据规模下分布式消息中间件架构演进实践

罗明波

vivo 互联网大数据专家

个人介绍：曾先后就职于TCL、vivo等公司，拥有9年互联网领域和大数据领域实践经验，长期从事互联网高并发、高性能、海量数据接入、海量消息处理等领域的相关工作。对于互联网、物联网、大数据领域服务稳定性、架构升级、增效将本等场景有较为丰富的方案设计及落地经验。目前就职于vivo公司担任vivo互联网大数据专家，负责超大数据规模下分布式消息中间件的架构升级、可用性保障、增效降本及分布式消息中间件容器化等方面工作。

演讲题目：vivo 超大数据规模下分布式消息中间件架构演进实践

演讲提纲：

1. 十万亿级消息中间件架构演进实践

2. 超大数据规模下Pulsar核心架构优势

3. 超大数据规模下消息中间件高可用保障体系及可观测

4. 未来规划

听众收益：

1. 了解vivo 日均十万亿级的消息规模下分布式消息中间件平台在高可用性、增效降本等场景下的技术方案思考和相关难点问题的解决思路，以及下一代云原生分布式消息中间件Pulsar在超大数据规模下的架构优势

2. 了解vivo 超大数据规模下消息中间件高可用保障体系及可观测实践

3. 了解vivo 超大数据规模下消息中间件未来规划

ClickHouse 2024新功能与研发方向思考

Alexry Milovdov

ClickHouse CTO

Alexey 毕业于莫斯科国立大学，拥有数学学位。他的兴趣领域包括数据处理算法和技术，他热爱数据和高性能。拥有13年的设计、开发和操作数据密集型应用程序的经验。他于2009年开始着手ClickHouse初始模型的策划和开发，并于2016年将其释放为开源项目。在ClickHouse之前，他开发了全球第二大网络分析系统的数据处理引擎。

谢志豪

ClickHouse 技术支持工程师

Derek 谢志豪是 ClickHouse 的技术支持工程师。主要工作范围包括帮助大型客户解决重大技术问题，优化 Clickhouse 集群，提升使用体验。Derek 毕业于新加坡国立大学 (NUS) 获得信息系统学位，在 ClickHouse 工作之前一直从事数据平台的优化和管理工作。

使用 JIT 技术实现高效的数据库表达式求值

吴立

炎凰数据研发工程师

硕士，毕业于上海交通大学，在上海炎凰数据主要负责时序数据库的开发。之前在Splunk工作，主要参与数据采集相关的开发工作。

Bit-sliced-index：基于 Roaringbitmap 的人群 OLAP 分析、在线服务的 one more thing?

黄海林

灵犀互娱技术专家

黄海林，灵犀互动数据服务 leader，Roaringbitmap Java 版 BSI 作者。

唐凯麟

灵犀互娱高级研发工程师

唐凯麟，计算机科学与技术硕士，专注于大数据系统和数据平台的技术研发工作，现在主要负责阿里巴巴-灵犀互娱数据平台开发。

WeOLAP：微信 OLAP 新场景优化实践

孙弘毅

微信大数据研发高级工程师

硕士毕业于南京大学计算机系，具有多年大数据和分布式系统研发经验，对 Spark、Flink、Kafka、Pulsar 等大数据组件和消息中间件有深入的理解，目前在微信 WeOLAP 团队参与以 Clickhouse 为基座的海量数据亚秒级分析系统研发。

ClickHouse 在 vivo 的应用实践

袁文兵

vivo 互联网大数据架构师

计算机科学与技术硕士，曾任职于腾讯，现在 vivo 负责大数据研发工作，OLAP 项目负责人，专注于大数据系统和 OLAP 数据库的技术研发工作，具有8年大数据从业经验。

混合云原生大数据底盘

曾昭正

顺丰科技大数据高级研发工程师

个人介绍：10年以上大数据底盘研发经验，2017年加入顺丰科技，负责dataPaaS相关工作，主要涉及大数据混合云弹性扩缩容、云原生实时数湖等业界创新型技术在顺丰的探索和落地。

演讲题目：混合云原生大数据底盘

演讲提纲：

1、背景与趋势

2、顺丰混合云原生数据架构升级

3、顺丰大数据架构应用案例

听众收益：

1. 多云融合的大数据基础设施如何做到低成本

2. Hadoop 与云原生架构如何做融合

3. 跨机房离线任务如何保障计算效率

零售行业永辉超市云原生数据中台的探索与实践

马吉辉

永辉超市大数据架构师

个人介绍：马吉辉，永辉超市大数据架构师，数据中台OLAP架构负责人，永辉CLICKHOUSE布道者，毕业于南京大学计算机系，2019年加入永辉云创数据智能产品研发部，从0到1构建永辉线上大数据计算体系，离线、准实时、实时数仓架构，2020年主导并参与了永辉数智化转型之路，构建永辉数据中台，数据中心"蓄水池"，高效赋能业务增长。多年大数据从业经验，对数据基础架构服务、数据资产化、数据应用具有深刻的洞见。目前专注于数据治理，自助取数分析-人人都是数据分析师的体系建设落地。基于永辉"极光"平台实现业务输出。

演讲题目：零售行业永辉超市云原生数据中台的探索与实践

演讲提纲：

1. 永辉数据中台的经路历程

2. 以数据赋能零售业务的探索与实践

3. 数据治理思维驱动数据中台稳定高效

4. 未来展望

听众收益：

1. 了解零售业数据中台私有云建设的探索与实践

2. 了解数据治理在数据中台中的思维体现

3. 了解数据如何赋能复杂的零售业务变化

4. 对零售业技术的未来的探索与实践

物化视图在 MaxCompute 中的探索与实践

雷春蔚

阿里云 MaxCompute SQL 引擎技术专家，Apache Calcite PMC

个人介绍：雷春蔚，Apache Calcite PMC，具有多年大数据从业经验，主攻 SQL 引擎性能优化，先后负责了阿里云 MaxCompute 物化视图、dynamic filter、索引等核心功能的设计和开发。

演讲题目：物化视图在 MaxCompute 中的探索与实践

演讲提纲：物化视图是将查询预先计算并存储的一张特殊的物理表，当执行相关查询时，可以复用预计算结果，提高查询性能，是降本增效的妙招；本次演讲将从物化视图创建、物化视图维护、物化视图应用和物化视图推荐及自动物化视图4个方面介绍物化视图在 MaxCompute 中的探索和实践。

火山引擎 ByteHouse 的云原生探索与实践

任强

火山引擎 ByteHouse 技术专家

个人介绍：任强，2020年7月加入火山引擎 ByteHouse 团队，一直从事实时导入相关研发工作，目前负责实时导入模块。

演讲题目：火山引擎 ByteHouse 的云原生探索与实践

演讲提纲：近年来，随着云基础设施的成熟和数仓技术的发展，云原生数仓凭借按量付费、按需弹性的特点越来越受到客户的青睐。字节跳动在云数仓领域有十多年技术经验积累，并基于开源 ClickHouse 推出的云原生数据仓库 ByteHouse。本次分享将从云数仓历史和前沿出发，介绍 ByteHouse 云数仓的整体架构和亮点，以及存算分离的关键设计与实践。主要包括以下内容：

1. 数仓架构演进历史

2. 云数仓演进中的技术难点和问题

3. ByteHouse 云数仓架构设计以及存算分离的关键技术

4. ByteHouse 存算分离的实践与优化

听众收益：

1. 了解云原生数仓的发展与核心价值

2. ByteHouse 云数仓的架构设计与技术亮点

3. 云原生数仓的挑战和展望

蚂蚁新一代数字智能化治理平台 AutoFinOps 实践与探索

林天权

蚂蚁集团高级数据技术专家

个人介绍：林天权（花名：画龙），现任蚂蚁集团高级数据技术专家，有10多年大数据研发、架构升级和数据治理经验，14年开始加入蚂蚁，深度参与蚂蚁大数据的发展和升级演进，曾作为实时数据负责人主导蚂蚁双十一媒体实时大屏、蚂蚁全域实时采集链路和蚂蚁实时数据研发平台研发，以及PB级adhoc查询加速服务和大安全一键数据服务化平台研发与升级，现任蚂蚁安全大数据技术团队数据架构及治理负责人，推进技术创新，打造EB级AutoFinOps核心能力，升级蚂蚁新一代数据架构，用数据创造价值。

演讲题目：蚂蚁新一代数字智能化治理平台 AutoFinOps 实践与探索

演讲提纲：科技驱动一直是蚂蚁的核心发展理念，也是蚂蚁安身立命之本。蚂蚁过去的发展，源于能够始终抓住技术变革机遇，用技术创造价值。蚂蚁集团在面对EB级数据规模、错综复杂的业务以及数字时代新型安全风险挑战，数据治理除了传统的运动式治理、元数据驱动治理、一站式治理平台、自上而下的治理规范制度约束等解决方案外，也在不断尝试技术创新和架构升级等手段破局和提效，提供更加高效、便捷、丝滑的自动化、智能化解决方案，本次分享带你深入了解蚂蚁如何通过治理数字智能化快速实现“无感降本”，特别是智能归因、AutoFinOps、错峰计算等技术应用和实践，期待你的聆听，也期待与你一起交流。具体内容包括：

1. 数据治理的困难与挑战

2. 数据治理的顶层设计和架构

3. 数据治理自动化和智能化的最佳实践

4. 思考总结与未来展望

听众收益：
1. 了解蚂蚁数据治理的设计思路

2. 深度解读蚂蚁“无感降本”技术如何高效实现

3. 探讨数据治理领域未来趋势

DataOps 加大模型促进数据工程创新

杨明皓

数造科技高级大数据技术专家

个人介绍：英国谢菲尔德大学计算机硕士，海南数造科技高级技术专家。10年+金融行业实践经验，10年+大数据、知识图谱与自然语言研发经验。

演讲题目：DataOps 加大模型促进数据工程创新

演讲提纲：在数字化时代，数据管理和分析至关重要，而传统数据管理和分析存在诸多的挑战，在此背景下通过分析 DataOps 大模型的特点，提出 DataOps 的基础上结合大模型能力，实现数据工程的敏捷和智能化，促进数据分析的快速交付和数据民主。本次分享的主要内容包括：

1. 传统数据管理面临的挑战

2. DataOps 与大模型结合激活数据工程潜力

3. 数造科技 DataOps 与大模型的产品落地实践

4. 未来展望

听众收益：

1. DataOps 的工作流程

2. 大模型 Text2SQL 的能力

3. DataOps + 大模型如何进一步提效数据工程

快手数据成本白盒化治理实践

冯赞锋

快手大数据架构师

个人介绍：先后就职于百度、创新工厂-豌豆荚、快手三家公司，主要擅长大数据中台构建、数据治理，在搜索、爬虫、后端服务开发等方向也有一定积累，目前在快手主要负责数据治理架构设计和开发工作。

演讲题目：快手数据成本白盒化治理实践

演讲提纲：

1.1 背景介绍

· 数据治理介绍：快手数据治理整体介绍

· 本次分享核心：通过引擎与数仓白盒化拆解，提升治理深度，实现降本增效

1.2 收益评估方法

· 压缩率

· 存储数据量

· 资源消耗（CPU核*天）

· 作业运行时长

· 作业失败率

1.3 引擎白盒化

· HBO

· JVM升级

· 压缩算法替换

· 计算过程拆解

1.4 数仓白盒化

· 基于 Similar SubExpression 的公共模型构建和优化

· 数仓自动化治理实践

1.5 个人思考

· 严谨：事前收益测算 -> 事中灰逐步度验证，解决异常CASE -> 事后整体效果评估

· 深入：对引擎、工具、数仓均有深入理解

· 行动：躬身入局，模糊各个团队的边界

1.6 未来规划

· 压缩效率持续提升

· 实时计算Flink白盒化

· 数仓架构优化

听众收益：
1、深入到大数据存储计算引擎和数据仓库，对其进行白盒化拆解，在治理思路、治理经验等方面有不少可借鉴之处

2、讲述快手实践，如何成功降低千万级存储和计算成本

阿里云 DataWorks 湖仓融合数据治理与大模型应用探索

田奇铣

阿里云高级产品专家、阿里云DataWorks产品负责人

个人介绍：阿里云DataWorks产品负责人，打造全链路数据开发治理平台支撑阿里巴巴集团与阿里云上众多客户的数字化转型。

演讲题目：阿里云DataWorks：新一代“Data+AI”数据开发与数据治理平台的产品演进

京东物流一站式敏捷BI产品规划与落地实践

焦文健

京东大数据产品总监

个人介绍：京东大数据产品总监，中国人民大学MBA，十年以上大数据从业经验，具有数据中台化、数据业务化、数据智能化的落地实践经验。

演讲题目：京东物流一站式敏捷BI产品规划与落地实践

演讲提纲：

- 京东物流业务数据应用现状及挑战。

- 一站式敏捷BI产品的规划与迭代升级路径。

- 业务应用实践案例。

听众收益：

- 理解敏捷BI产品规划和设计要点

- 学习如何提升BI类数据产品的性能和用户体验

- 学习BI产品助力业务自助式实现数据分析的实践路径

线下营销的数智化应用分享

董沅

阿里巴巴瓴羊数字营销产品经理

个人介绍：主攻大数据AI方向，深耕行业应用产品多年，现负责阿里巴巴线下营销产品设计研发。

演讲题目：线下营销的数智化应用分享

演讲提纲：
1、线下营销盲点分析
2、利用数智能力实现线下营销人群的精准定位、精准触达、效果评估、资产二次运营的实践方法论分享
3、案例分享

听众收益：
1、如何实现线下精准营销？
2、如何评估户外品牌广告的效果？
3、如何沉淀户外营销的资产？

电商与内容型业务用增数据的基建异同

熊瑾

bilibili 数据产品经理

个人介绍：曾负责网易数帆的数据开发平台、阿里数据中台的用增/私域/集团标签等数据项目。目前在bilibili负责数据产品。

演讲题目：电商与内容型业务用增数据的基建异同

演讲提纲：在不同的业务类型、组织形态、发展阶段等要素下，用增数据如何建设好。

听众收益：用增数据建设在诸多不同要素下的数据实践差异：
1. 业务类型：电商业务v.s.内容社区业务
2. 组织形态：自上而下型v.s.自下而上型
3. 发展阶段：成熟期v.s.生长期

11月25日AI平行论坛

【线下·深圳】 DEEPNOVA大模型论坛免费门票

11月25日

深圳