阿里云百炼推出全新RAG框架,可解决90%以上幻觉问题

@晓东 出处:二牛网 2024-11-19 21:17

11月19日消息,阿里云百炼推出全新RAG框架,全面提升大模型的准确性和可靠性,可解决90%以上幻觉问题,更好地满足企业级大模型应用场景的需求。 

RAG是大模型落地的重要技术,它可以将检索到的知识和大模型结合,以此优化大模型的生成效果。然而传统RAG方案容易检索到与问题相似,但与问题描述不符的难负样本,从而导致大模型易出现幻觉,例如面对“iPhone 16的参数规格”与“iPhone 16Pro的参数规格”这类极为相似的问题时,大模型容易给出错误答案。 

为此,阿里云百炼在传统RAG框架之上,在业界首创双层幻觉信息过滤框架。在这一全新框架下,大模型在生成回答前,能先对候选信息进行一次全面的深度分析和判断,自动识别并剔除“难负样本”,确保所有用于生成的信息高度相关且可靠。具体来说,该框架可通过重排序模型进行第一轮过滤,可过滤70%的通用难负样本,第二层大模型会进一步过滤剩余30%涵盖更复杂业务定制规则的样本。通过双层幻觉信息过滤框架,可解决90%以上大模型幻觉问题,并且相比单层信息过滤方案,效率大幅提升。

 

阿里云百炼推出全新RAG框架,可解决90%以上幻觉问题

阿里云百炼通过双层幻觉信息过滤框架,可解决90%以上大模型幻觉问题

 

阿里云百炼资深算法专家谢朋峻表示:“全新的RAG框架极大地提升了大模型的生成效果,为大模型在复杂场景下的应用开辟了新的可能性,我们希望这一新方案能进一步推动了人工智能技术的发展和应用。” 

目前,阿里云百炼可为企业和开发者提供三种模型服务:用户可直接调用大模型进行推理,例如Qwen、Llama、ChatGLM等主流开源和闭源模型;用户还可对大模型进行微调和训练,阿里云百炼提供从数据管理、模型调优、评测到部署的全链路模型服务,用户可弹性按需调用算力,无需关心底层架构;此外,阿里云百炼还支持企业打造RAG应用,用户可在百炼上轻松创建知识库,并一键开启RAG,通过Assistant API联合输出。 

据介绍,阿里云百炼已上线超100款国内外主流大模型,已服务一汽、金山、哈啰集团、国家天文台等超30万企业客户。