Embedding 负责低成本高效率粗筛,LLM 负责高成本深度的最终逻辑推理,这才是最合理的 AI 架构。
向量是给机器用来算距离的坐标,元数据是给大模型拿去阅读的课本,两者缺一不可。
Embedding 理解为人类自然语言与计算机数学空间的桥梁,AI 领域很多底层逻辑就不再神秘。
传统数据库是精确匹配查关键字,向量数据库是模糊匹配查多维空间里的近邻。
专业模型做底层推荐排序,大模型只充当超级特征提取器,真正做到专业的人干专业的事。
向量是给机器做相关度距离的坐标,元数据给大模型阅读的课本
纸上的来终觉浅,觉知此事要躬行
AI 是如何理解人类世界的: embedding
在小宇宙查看该单集文稿