aimgowin
本站致力于IT相关技术的分享
11
20
15
构建基于 Laravel、Weaviate 和 Styled-components 的向量检索流式响应系统 构建基于 Laravel、Weaviate 和 Styled-components 的向量检索流式响应系统
最初的 RAG (检索增强生成) 系统原型是一个阻塞式的请求-响应模型。用户提交一个问题,前端显示一个加载动画,后端去查询向量数据库,构建提示词,然后等待大语言模型(LLM)返回完整的答案。整个过程耗时5到15秒不等,最终呈现给用户的是一大
2023-11-15
10
27
27
27
27
构建支持AI模型的实时特征管道 Ktor Flink与Prometheus的生产实践 构建支持AI模型的实时特征管道 Ktor Flink与Prometheus的生产实践
为机器学习模型提供毫秒级新鲜度的特征,是许多实时AI应用(如在线推荐、实时风控)成功的关键。然而,构建一个兼具高吞吐、低延迟和高可用性的实时特征管道,是一项复杂的系统工程挑战。我们需要处理源源不断的数据流,进行有状态的计算,将结果存储在低延
2023-10-27
1 / 5