概述 LlamaIndex(原名 GPT Index)是一个开源的数据框架,专门用于构建大语言模型(LLM)应用。它解决了 LLM 的一个核心局限性:LLM 在训练后就无法访问私有数据。LlamaIndex 通过检索增强生成(RAG)技术,将用户的私有数据与 LLM 的生成能力无缝连接。与langc
Context Manager 多模态数据的处理 现在大模型系统的对话窗口和处理数据会产生大量的上下文,后续的qa往往会用到其中一部分上下文,所以建立有效的context engine是十分必要的。 NLP 用时问戳标记上下文 一种常见的设计是在每条信息上附加时间戳,以保留其生成的顺序。这种方法由于
code cli
context engineering
ACM
算法
算法竞赛
vllm
AMD算子挑战赛
github
inference
LLM
CUDA入门到入土
cuda/Triton
MLsys24
paper
blog
默认分类