Loading...

Perplexity AI发布PPLX在线语言模型,挑战谷歌搜索引擎地位

Perplexity AI是一家由前谷歌AI研究员Andy Konwinski、Aravind Srinivas、Denis Yarats和Johnny Ho创立的初创公司,通过结合网络索引和最新信息与会话式AI聊天机器人界面,有望颠覆其前东家谷歌在网络搜索领域的领先地位。其聊天机器人Perplexity Copilot,直到最近一直使用OpenAI的GPT-4和Anthropic的Claude 2作为后台「智能」,付费用户可以在这两者之间切换。

Perplexity AI发布了大型语言模型(LLMs)——pplx-7b-online和pplx-70b-online,这些模型是基于Mistral和Meta的开源mistral-7b和llama2-70b模型进行微调和增强的版本。这些模型的参数分别高达7亿和70亿,表明它们具有强大的功能和「智能」。Perplexity AI发布PPLX在线语言模型,挑战谷歌搜索引擎地位

Perplexity AI的新在线LLMs之所以重要,以及它们与ChatGPT等LLMs的不同之处在于,它们不仅可供其他组织通过Perplexity的API(应用程序编程接口)使用和构建自己的应用程序,而且还旨在提供「有用的、事实和最新的信息」。这是大多数其他领先的LLMs,包括OpenAI的GPT-3.5和GPT-4(为ChatGPT提供动力)难以做到的。

Perplexity首席执行官Aravind Srinivas在X上发布消息称,新的PPX LLMs是「首个实时LLM API,它们基于网络搜索数据,没有知识截止日期!」GPT-3.5和4的存储知识截止日期直到最近一直限于2021年9月,直到今年早些时候才有所提升。尽管如此,这与内置了当前事件和最新消息的知识相比还有很大差距,尽管通过OpenAI合作伙伴微软必应搜索恢复ChatGPT的Web浏览功能在一定程度上缓解了这一点,该功能于2023年9月底恢复。

通过LLM聊天机器人提供最新知识的竞赛也在升温。埃隆·马斯克(Elon Musk)夸口他的公司xAI的新聊天机器人Grok将具备这一能力,这要归功于它与姐妹公司X(前推特)的直接整合,以及该平台用户发布的所有实时信息。Grok已经向选定用户提供了有限的测试版,并将在本周推出供任何人使用,前提是用户支付X Premium订阅。

其他LLM提供商,如加拿大多伦多的企业级Cohere,旨在通过结合Web浏览功能和检索增强生成(RAG),将更多最新知识纳入其LLMs,这使模型能够借助管理员提供的外部信息来源,如公司文件。

在新的PPLX在线LLMs的情况下,Perplexity开发了自己的方法来获取最新信息。正如公司在其博客文章中所写:「我们的内部搜索、索引和爬虫基础设施使我们能够用最相关、最新和最有价值的信息来增强LLMs。我们的搜索索引庞大,定期更新,并使用复杂的排名算法来确保优先考虑高质量、非SEO化的网站。我们向pplx在线模型提供的网站摘录,我们称之为『片段』,使其能够用最新的信息做出回应。」

在提供最新信息方面,Perplexity是否优于OpenAI和Meta?为了证明其新LLMs的有效性,Perplexity聘请了一些人力承包商根据三个标准评估问题的回答:有用性、事实性(Perplexity也称之为准确性)和新鲜度(后者指信息的最新程度)。承包商被要求比较两个模型的回应,其中一些是Perplexity的新PPLX在线LLMs,另一些则是Meta的Llama 2或OpenAI的GPT-3.5 Turbo,选择他们更喜欢的两者之间的回应。然后,Perplexity利用称为Elo评分的方法从人力承包商的回应中推断出,其模型在「新鲜度」和「事实性」方面的表现优于OpenAI和Meta的原始模型。在「有用性」方面,即咨询顾问认为LLM回应的实用性,GPT-3.5仍然优于PPLX和原始的Llama 2。

ai工具箱
ai导航
免费aigc导航
aigc工具
免费ai工具

© 版权声明

相关文章