在RAG中选择Embedding Model时,主要考虑的是以下7大因素:
1.模型能否精准地捕捉文本语义,准确性直接影响到向量相似度计算的可靠性。(语义准确性)
2.模型的推理速度能否满足业务的实时性要求,显存和内存的占用能否适配当下的硬件资源。(模型的效率)
3.是否专门针对某个垂直领域做过预训练或者微调,原生支持特定术语和逻辑。(领域适配)
4.是否支持业务所需的语言,以及具备跨语言对齐能力。(多语言支持)
5.模型的参数量和训练数据规模是否匹配语料的复杂度。(数据规模匹配)
6.是否开源、是否有活跃的社区在维护,API的调用是否灵活。(开放性与生态)
7.训练和推理的硬件投入成本以及使用成本。(成本)