00:00
Hello喽,大家好,欢迎收听我们这一期播客啊,然后今天咱们聊一聊如何通过生成式引擎优化来帮助内容创作者提升内容在生成式引擎里面的可见性啊。
00:11
听起来很有意思,对,那我们就直接开始吧,直接进入我们的这个主题啊,来聊一聊到底这个东西是怎么回事儿。
00:16
咱们先聊一聊就是什么是生成式引擎,然后他对于内容创作者到底带来了什么样的挑战。
00:23
嗯,就是生成式引擎,它其实是依托于非常大的语言模型,然后来整合信息,并且总结信息,直接回答用户的问题,嗯哼,所以他的这个回答的质量会更高,也会更加的个性化,那这样的话就会吸引更多的用户来使用生成式搜索引擎,那传统的这种网站啊,或者是内容创造者,他们的流量就会受到影响。
00:49
对,相当于说生成式引擎的出现,直接就改变了。
00:53
用户获取信息的方式,对,没错。
00:57
然后更麻烦的在于内容创作者,他们几乎没有办法控制自己的内容什么时候会被展示,以及以什么样的形式展示,因为这些生成式引擎它都是一个黑盒,而且它变化非常的快,所以这就让很多内容创造者非常的焦虑。
01:15
什么是生成式引擎优化?
01:16
它可以帮我们做什么?
01:17
它的效果到底怎么样?
01:18
就是Guo。
01:19
它其实是一种新的方法,嗯,它可以帮助内容创作者在生成式引擎的这个回应当中提升自己内容的可见性。
01:30
嗯哼,它是一个非常灵活的黑盒优化框架,那我们可以通过它来定义和优化我们的可见性的指标。
01:40
比如说我们可以让他更多的展示我们想要展示的一些内容。
01:45
听起来确实是一个非常对症下药的一个解决方案,对。
01:49
而且我们还开发了geo bench这样一个大规模的基准,它里面包含了非常多的用户的查询以及相关的网络资源。
01:58
然后我们通过实验也证明了geo可以让可见性提升最高40%。
02:05
而且它在不同的领域都有非常好的效果,所以这是一个非常既给生成引擎的开发者,也给内容创作者开辟了一个全新的机会的一个东西。
02:16
那生成式引擎它到底是怎么形成的?
02:19
然后它跟传统的搜索引擎优化又有什么不一样的地方呢?
02:22
嗯。
02:23
,由多个生成模型和一个搜索引擎协同工作来形成的一个系统,那它会接受用户的一个查询,然后首先会有一些生成模型对这个查询进行一些分解呀,或者是说重写,再通过搜索引擎去找到相关的来源,再通过一些模型去生成这些来源的摘要。就是生成式引擎,它其实是呃
02:51
最后再生成一个最终的响应,而且这个响应里面还会包含内嵌的引文,来确保它的这个信息的可追溯性。
03:00
那它跟传统的搜索引擎优化最大的不同就在于传统的SEO它可能更关注于关键词的匹配,但是生成式引擎它是基于语言模型的,它对于文本的理解会更加的深入,所以它的优化的方式也会更加的复杂。
03:17
对,相当于说生成式引擎是一个多模型协作的一个非常复杂的系统,对,没错。
03:23
所以我们在做GU的时候,我们也是提出了一些全新的印象指标,比如说我们会有一些字数相关的位置调整的这样的一些指标,然后也有一些主观印象的指标,那我们也提出了一些不需要知道生成式引擎内部算法的一些优化的策略,比如说我们可以去改进我们的权威性,我们可以去增加一些统计数据,我们可以去优化我们的流畅性等等。
03:51
那。
03:51
这些都可以非常有效的去提升我们的可见性。
03:54
你们在做这个生成式引擎优化的实验的时候,你们是怎么来设置这个实验环境的?
03:58
然后你们用了哪些评估指标?
04:00
嗯,我们的生成引擎其实我们是用了一个两阶段的设计,嗯哼,就是首先我们会从谷歌搜索引擎里面去获取前5个来源,然后我们会使用GPT super point five turbo来生成答案,我们会用五个不同的温度值来生成答案,取平均来减少我们的统计偏差。
04:19
同时我们还使用了perplexity AI来进行一个额外的评估,来确保我们这个方法是可以通用的。
04:26
对,相当于说实验环境还是比较贴近真实场景的,对,是的。
04:30
然后为了去评估这个,我们还创建了go bench这样一个基准数据集,它里面包含了1万个查询,这些查询是来自于9个不同的来源,它也是按照训练、验证、测试8:1:1的比例来进行划分的。
04:45
同时我们还对它进行了非常详细的标注,比如说它的领域是什么,它的意图是什么?
04:51
啊,等等,我们的评估指标就是我们刚才说的那两个印象指标,一个是位置调整字数,一个是主观印象,我们也会去看它的一些子指标,我们会把所有的分数都进行归一化,这样的话。
05:02
我们可以更公平的去比较这个生成式引擎优化的实验结果到底怎么样,然后它能够给我们带来哪些比较重要的启发呢?
05:10
嗯。
05:10
我们的实验结果就是我们的这些GU方法,在我们的GU bench上面,所有的指标都全面的超越了我们的这个基准方法,嗯,那特别是在引用来源添加配额和统计添加这几个方法上面,我们的这个位置调整次数提升了30%~40%,然后主观印象提升了15%~30%。
05:34
一些文体上的优化,比如说流畅性、易读性也有15%~30%的提升,对,所以这些都是非常高效的一些优化的方向。
05:44
对,相当于说这些优化方法确实可以给网站的可见性带来非常实质性的帮助,对。
05:49
没错,然后我们还发现就是权威。
05:51
地性和关键词填充其实效果并不是特别的好,所以这也告诉我们就是生成式引擎,它并不一定需要你去特别的堆砌一些关键词,或者说用一些非常高大上的词汇,他更看重的是你内容的真实的价值。
06:09
对另外一个我们还发现就是对于排名比较低的网站,Geo的效果会更好。
06:15
比如说我们的引用来源这个方法可以让排名第5的网站的可见性提升超过百分之百。
06:20
不同的G优方法在不同的领域到底表现怎么样,然后为什么我们要去组合这些绩优策略,它到底可以给我们带来哪些好处?
06:28
嗯。
06:28
我们发现就是比如说在辩论和历史这两个领域下面,权威性这个方法的提升是特别明显的。
06:34
然后引用来源这个方法对于事实性的问题是特别有帮助的。
06:38
统计添加这个方法法在法律、政府这种领域下面是特别有帮助的,对于人物、社会这种领域下面也是添加引文是特别有帮助的。
06:48
对,所以这其实给我们的一个启发就是我们可以根据不同的领域来选择不同的优化的策略,对。
06:57
相当于说不同的场景下面其实最佳的时间是不一样的,对。
07:00
没错。
07:00
然后我们还发现就是如果你把不同的GU策略组合起来的话,会有更好的效果,比如说我们把流畅性优化和统计添加组合起来的话,我们会比单个方法的最好的结果还要好5.5%以上。
07:13
我们还发现就是引用来源这个方法如果跟其他的方法组合的话,也会有非常明显的提升,它单独使用的时候并不是特别的好,但是它跟其他方法组合的时候,可以让平均的性能提升到31.4%,所以这也是一个非常好的可以给内容创作者去使用的一个方式。
07:31
在真实的生成引擎上面去做实验,Geo方法的表现到底怎么样,然后它到底意味着什么呢?
07:37
我们在perplexity AI上面做的实验,然后我们发现就是。
07:41
同样的也是添加引文,这个方法是表现最好的,它可以提升22%的位置,调整字数,引用来源和统计添加分别在两个指标上面有比较好的表现,一个是提升9%,一个是提升37%。
07:54
我们的关键词填充这个传统的方法就表现的非常不好,它比我们的机线还要低10%,对。
08:00
相当于说这些结果其实跟你们之前在实验环境里面得到的结果是非常一致的,对。
08:05
没错,所以这个就非常有力的证明了GU方法的有效性和通用性。
08:10
对。
08:10
所以这是一个非常对于内容创作者来说非常好的一个消息,就是他们终于有一些方法可以在生成式引擎下面去优化自己的内容了,而且这些方法是非常简单而且高效的。
08:23
那GU跟其他的一些相关的技术比起来,它到底有什么独特的地方的?
08:27
通过搜索引擎去拿一些来源,然后再去生成答案,但这些方法都是比较零散的GE。嗯,就是在基于证据的答案生成这方面之前的一些方法,要么就是用强化学习让模型去浏览网络,要么就是
08:41
都是第一个把这些东西都统一起来的一个框架,同时它也是第一个提出了非对抗性的策略来优化任意的网站的内容的这样的一个方法,所以它的通用性会更强。
08:55
对,相当于说GU是一个更系统化的一个解决方案,对。
08:59
没错。
09:00
然后在检索增强语言模型这方面,之前的研究主要还是在解决语言模型的内存有限的问题,嗯哼,生成引擎它是一个更复杂的框架,它不光是要生成答案,它还要对答案进行归因,它还要支持多模式的输入和输出。
09:16
在搜索引擎优化这方面,传统的SEO技术它都是基于关键词匹配的,它也没有办法去应对生成式模型的这种复杂的绘画式的、多模式的这样的一个环境,所以这也是geo会存在的一个非常重要的意义。
09:31
EU它到底有哪些核心的贡献,然后它的局限性又在哪里呢?
09:35
嗯。
09:36
Guu的核心贡献我觉得有这么几点吧,第一个就是我们提出了生成式引擎优化,这样。
09:41
一个全新的范式,它可以让内容创造者在生成式引擎下面更好的去优化自己的内容。
09:49
然后第二个就是我们定义了新的影响指标,同时我们还发布了GE bench这样一个大规模的基准,它可以支持对生成式引擎的这种可见性的优化方法进行评估。
10:02
第三个就是我们的这些优化方法可以非常有效的提升生成式引擎响应中的的源的可见性,最高可以提升40%,同时我们也证明了这种领域自适应的重要性以及策略组合的潜力。
10:17
对。
10:17
相当于说geo确实在很多方面都推进了这个领域的发展,对,没错。
10:22
也没有办法完全覆盖所有的真实世界的场景,同时我们也没有去评估GU对于搜索排名的影响。然后它的局限性我觉得也是很明显的,就是随着全球的搜索引擎不断的发展,GU可能也需要不断的去调整我们的GU bench里面的查询可能
10:42
另外一个就是随着语言模型的上下文长度越来越长,可能未来的生成模型可以直接读取更多的来源,那这个时候可能搜索排名的意义就会下降。
10:52
全面的了解。行吧,反正今天咱们就是聊聊了聊这个深城市引擎优化的背景、方法、效果,然后也聊聊了聊它的一些未来可能的发展方向啊,对,希望能够给大家对于这个比较新的领域有一个比较
11:06
OK了,以上就是这期播客的全部内容啦,然后咱们下期再见吧,拜拜,拜拜。
马懂百科ModelPedia马上就懂的图文音视百科全书。