使用微信扫一扫分享到朋友圈
使用微信扫一扫进入小程序分享活动
2022 年 11 月美国科技公司 OpenAI 推出的生成式对话语言模型 ChatGPT 掀起了人工智能领域新一轮的热潮,打破了传统弱人工智能与强人工智能之间的边界,被誉为通往通用人工智能(AGI)的重要路径。与此同时,围绕这一全新技术范式的新研究如雨后春笋一般不断涌现。本报告将围绕大语言模型中的知识如何学习以及构成的最新研究,围绕从参数角度对大语言模型进行分析的工作进行介绍,并对大语言模型在知识问答方面的实践经验进行介绍。
近年来深度学习的最新进展使得各种类型的数据都能被映射为高维向量。目前最先进的向量搜索库主要关注如何在内存中进行快速高召回率的搜索。然而,在极大规模的向量搜索场景中存 在一些挑战。例如,数百亿个向量与有限的内存结合在一起会导致容量问题。同时,扩展性也是一个问题,增加服务机器的数量会增加查询延迟和计算成本。并且向量索引的更新也是一个难题,目前向量索引的更新主要依赖周期性的索引重建,而索引重建的开销非常大,尤其是大规模向量索引的重建甚至远远超过其对外提供搜索服务的开销。此外,高维向量索引不具备单调性,而单调性是传统索引的一个关键属性。缺乏单调性使得现有的向量系统不得不依赖于保持单调性的临时索引,用于目标向量的 TopK 最近邻,以便实现近似相似性搜索和关系运算的复杂查询。这导致了性能的下降,因为很难预测最优的 K 值。在本次演讲中,我们介绍了 SPANN,一个分布式基于磁盘的 ANNS 系统,已经集成到 Bing 中,可以实现数百亿规模的向量搜索,并以毫秒级的响应时间。同时,涵盖我们最近在索引更新上的新进展。此外,我们还介绍 VBASE,一个向量数据库系统,它能有效处理基于一种称为放松单调性的共同属性的复杂查询。这种方法将两个看似不兼容的系统统一起来,提供了比现有最先进的向量系统高出三个数量级的性能。
演讲大纲:
1. 概率:信息检索的基石
2. 基于词频的搜索方法:TFIDF
3. 基于深度学习模型的搜索方法:BERT
4. 概率融合:混合查询的价值
5. 向量数据库 Milvus:混沌的导航者
6. 概率永不停止:生成式样检索的未来
随着大模型的兴起,向量数据库逐渐成为AI领域的关键存储基础设施。由于目前的大模型都是预训练模型,对于训练截止日之后发生的事情一无所知。第一是没有实时的数据,第二是缺乏私域数据或者企业数据,向量数据库可以通过存储最新信息或者企业数据有效弥补了这些不足。但是对于一些企业来说,向量数据库背后到底有哪些核心技术、如何选择一款合适的向量数据库、有没有典型的应用落地案例可以参考,缺乏比较全面的认识。本次分享将聚焦腾讯云向量数据库技术创新和实践,为大家带来这一领域的最新技术动态、应用实践,以及未来趋势。
演讲大纲:
1. 向量数据库是什么,为什么需要向量数据库
2. 腾讯云向量数据库的架构和创新
3. 腾讯云向量数据库AI Native能力
4. 腾讯云向量数据库最佳实践
5. 未来面临的挑战
大语言模型具备强大的自然语言处理能力,但其在“事实性”、“实时性”等方面存在天然缺陷,很难直接被用于客服、答疑等需要精准回答的领域知识型问答场景。当前主流方案是借助外部知识库,通过向量检索增强,辅助大模型生成准确回答。整个流程是一套相对复杂的系统工程。本次分享将基于阿里云人工智能平台,拆解流程中各核心模块,展示「向量数据库+通义千问」构建对话系统的最佳实践,并为大家带来阿里云线上多场景落地的实战调优经验。
演讲大纲:
1. LLM向量检索增强方案概述
2. 阿里云向量数据库技术与创新
3. 向量数据库+通义千问最佳实践
4. 基于阿里云人工智能平台的优化
近两年对 AI 技术架构影响最大的就是大模型,由此也促进了大模型原生应用的蓬勃发展。在大模型产生、迭代和演进的过程中,它对底层的基础设施提出了新的挑战。
向量数据库应运而生,它为大模型的应用提供了高效的存储和查询机制。它能解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。通过使用向量数据库,大模型原生应用也可以更快速地检索和匹配相似的向量,从而提高了应用的准确性和效率。本次演讲将为大家带来百度智能云 BES 向量数据库在大规模应用场景的探索和实践。
演讲大纲:
1. 向量数据库应用场景
2. BES 构建向量数据库的技术挑战与实现
3. BES 向量数据库场景示例与最佳实践
4. BES 向量数据库应用案例
向量数据库作为大模型应用的“记忆体”,必须提供海量的存储能力和基于向量相似度的快速检索能力。DingoDB 是一个开源的多模向量数据库,支持丰富的向量索引类型,实现了向量数据与其他结构化数据的联合存储、分析和查询,并提供了与其他系统如 LangChain 对接的丰富接口。本次分享将分析 DingoDB 的技术架构和优势,展示其与九章元识大模型在知识管家系统中的最佳实践。
演讲大纲
1. DingoDB 多模向量数据库
2. DingoDB 多模向量数据库技术架构与优势
3. DingoDB 多模向量数据库与大模型的最佳应用实践
大模型直接落地应用于产业界时,由于缺乏领域专业知识,无法理解行业knowhow,对产业帮助非常有限。另外,行业私域数据通常隐私性极强,很难开放给大模型学习,而微调则存在门槛高,通用知识遗忘的难题,且成本很高。相对于微调,搜索增强(RAG)是一种成本低廉,能让大模型在私域发挥价值的技术解决方案。AwaDB是一款AI原生的搜索增强型向量数据库,采用了语义向量融合文本索引检索的技术实现方式,大幅提升私域数据的检索排序效果,最终让大模型更好地生成理解行业知识,帮助产业界更好地落地应用场景。本次分享围绕AwaDB的核心架构和技术创新展开,带你看看如何打造一款向量数据库。
演讲提纲:
1. AwaDB 背景及特点
2. AwaDB 整体架构
3. AwaDB 核心能力
4. AwaDB 技术创新点
5. AwaDB 未来演进路线
6. 结合 RAG 的最新实践
文本表示是自然语言处理领域(NLP)的一项核心任务,其旨在将人类使用的自然语言转化为计算机可理解并处理的形式。近期,大模型的出现激发出大量类似 Langchain 的开发工具、同步引爆了 Embedding 和向量数据库的热潮。如何基于预训练语言模型构建高质量的文本表示模型也成为大家关注的热点,本次分享将重点分享阿里巴巴开源通用文本表示向量 GTE 系列模型的探索、思路与经验。
演讲提纲:
1. 什么是文本表示
2. 文本表示的应用场景
3. 预训练驱动的统一文本表示
4. GTE 系列模型 & API
5. 总结与展望
深度学习大模型在实际应用中面临众多挑战,其中 RAG(Retrieval-Augmented Generation)为其最具前景的落地策略之一。不同于 LLM 微调,RAG 能够更为有效地应对如模型幻觉、私域知识的注入等诸多问题。然而,RAG 的效果与其召回阶段的表现息息相关。广为采用的召回策略多倚赖于向量表示模型及相应的向量数据库,利用这些模型来捕获并表示文本片段的深层语义。但开发者面临的瓶颈在于,现有的向量表示模型仅支持 512 个 token 的输入,这无疑制约了其表示能力。而 jina-embedding-v2 则为开发者带来了突破,支持长达 8000 个 token 的输入,使得从字到篇章的不同语义层级都得以充分表示,进而显著提升召回效果。在本次分享中,我们将深入探讨 jina-embedding-v2 的技术核心,并分享 Jina AI 在训练大规模向量表示模型的宝贵经验。
演讲大纲:
1. RAG应用中目前主流的向量表示模型的问题
2. jina-embedding-v2的解决方案和在长文本召回方面的效果对比
3. jina-embedding-v2的模型架构设计与输入长度拓展
4. jina-embedding-v2的数据准备
5. jina-embedding-v2的训练方法
6. jina-embedding-v2训练过程中的经验
知识库为企业决策提供了可靠、高效的信息支持,结合大语言模型强大的语言理解和生成能力,知识库可以更好地为用户提供智能化和高效化的信息服务。向量数据库作为中间载体,在赋予大模型“长期记忆"的同时,其召回精度直接影响大模型输出结果的准确率。星环科技分布式向量数据库 Transwarp Hippo 在金融大模型的落地过程中,通过一系列的优化措施提升了召回的精度,并从成本,数据的接入等多个视角去解决客户和开发者的应用过程中遇到的问题。
演讲大纲:
1. 金融大模型的背景与愿景
2. 金融大模型-知识库-向量数据库
3. 向量数据库 hippo 在落地过程中的实践与思考
4. 未来展望
随着大语言模型兴起,企业知识库也迎来了新的搭建方式,但同时也面临着解决垂直领域知识的准确性和实时性以及减轻模型“幻觉”的问题,向量数据库在此过程起起到了关键作用,也重新定义了企业知识库的管理方式。那么在 Fine-turning 和 RAG 企业该如何选择?向量数据库到底可以提供什么帮助?企业自有知识资产如何完美嵌入到向量数据库中?如何再优化企业的数据召回的准确度?本次分享就如何基于向量数据库搭建企业级知识库提供丰富实践知识,包含数据清洗嵌入到召回优化以及对企业知识库未来的展望。
演讲大纲:
1. 搭建企业知识库的困境与挑战
2. 知识管理新方式:向量数据库
3. 如何提高数据召回的准确率
4. 未来企业知识库展望
一起手动实现一个基于向量数据库图片搜索引擎。
演讲大纲:
1. 图片搜索引擎简洁和应用场景
2. 动手前的试玩
3. 基础技术架构设计
4. 在线 & 动手实战
5. 总结和未来新技术展望
向量数据库在大模型出现之前已经有一些应用场景,比如文本、图片、视频以及多模态的搜索。随着生成式AI的火热,向量数据库已经成为智能对话机器人里构建私域知识库的利器。本次分享会展示向量数据库的两个使用案例:商品推荐和基于 RAG 的 Chatbot 构建。
演讲提纲:
1. 向量数据库的适用场景、分类及选型
2. 向量数据库在商品推荐领域的案例
3. 向量数据库在 RAG 构建 Chatbot 领域案例
4. 总结与展望
🔈 这是一场重在行业技术交流的论坛,嘉宾分享均是技术干货,不夹带产品广告。(如想了解相关产品或项目,欢迎移步展位区)~
向量数据库一方面解决了大模型在 “事实性” 和 “实时性” 等方面的天然缺陷,另一方面也重新定义了企业知识库的管理方式。如今越来越多的企业开始借助向量数据库的能力来迈入大模型时代。
在大模型盛行的当下,掌握向量数据库和向量型的核心技术、了解产业最佳实践、使用向量数据库搭建企业知识库等能力愈发重要。
为了助力广大企业和技术从业者紧跟技术发展潮流,全面了解向量数据库技术,广泛学习产业界最佳实践,掌握向量数据库未来发展趋势,机器之心专门策划了以「大模型时代的向量数据库」为主题的 AI 技术论坛。
论坛全日程正式发布,11.24-11.25,来北京·海淀文津国际酒店,一起来面对面聊聊向量数据库吧!
论坛亮点
本场论坛除了在内容上的精心打磨外,我们也为现场参与的观众设计了一系列线下体验活动。来看看论坛都有哪些亮点。
1. 与众多知名技术专家面对面交流
2. 聚焦技术突破,拓宽技术视野
3. 洞悉向量数据库的前世今生
4. 向量数据库系列知识图谱发布,现场领取实体版本
5. 20+ 展台开放,一览产业格局,提供限量独家福利
6. 加入高质量技术交流群,深度探讨技术与实践
7. 精选学习资料及会后视频合集打包
8. 晚场交流活动,聊聊技术和职业规划
现在报名可享双 11 超级优惠
论坛报名通道已经开启,双 11 超级优惠截止 11.17,快来报名吧!
1. 单张门票 2199 元/张(含 2 天五星级酒店自助午餐 + 茶歇)
2. 20 张限量超级优惠门票,1999 元/张(含 2 天五星级酒店自助午餐 + 茶歇)
3. 另外,团购折上折,门票满 5 送 1
扫描图中二维码可直达论坛官网。即日起至 11 月 10 日 23:55 时,购票参会即可享门票 75 折早鸟福利,票价立减 1000 元。
机器之心 AI 技术论坛第一期「Llama 2 大模型算法与应用实践」的参会者,请单独添加小助手 Alice 的微信,直达专属优惠链接。
技术交流社群
为了方便技术交流,我们也特意建立了向量数据库技术交流群,欢迎关心向量数据库和知识库的技术从业者扫码加入对话,深入交流技术细节和行业观察。
关于本次活动商务合作、团购、发票、内容等相关问题,欢迎联系本场活动小助手 Alice 进行咨询。(微信:15650753618;邮件:jiayaning@jiqizhixin.com)