周三,xAI展示了这款最新的大型语言模型Grok-2。根据独立AI基准机构的测试,这款模型已经跻身前五大AI聊天机器人之列,仅落后于谷歌的Gemini和OpenAI的ChatGPT等模型。
沃顿商学院教授、AI专家Ethan Mollick在X上发帖称:“现在有五款GPT-4级别的AI模型:GPT-4o、Claude 3.5、Gemini 1.5、Llama 3.1和现在的Grok-2。”
Mollick还称:“所有的测试实验室都表示,AI模型还有继续大幅改进的空间,但目前我们还没有看到任何模型真正超越GPT-4。”
xAI表示,Grok-2是AI模型向前迈出的重要一步,在广泛的任务中,无论是寻求答案、协同写作,还是解决编码任务,都更加直观、可控和通用。
根据AI模型评测机构LMSYS的排名,Grok-2的表现被认为优于Meta和Anthropic的最强模型。
xAI表示,在内部评估该模型的性能时,其重点是确保系统遵循用户指示,并提供准确、真实的信息。
在此之前,Grok-2的上一代产品被专家批评为“AI幻觉”,即将虚假信息陈述为事实,这也一直视为企业采用AI系统的障碍。
Grok-2将率先面向马斯克旗下社交媒体平台X的付费用户提供。此外,xAI还计划本月向开发人员发布该模型,以便他们构建企业应用程序。
xAI成立于去年3月,在大量投资的支持下,迅速提高了其技术能力。今《33彩票-33cc-手机魂app下就》年,xAI以180亿美元的估值完成了一轮60亿美元的融资。
责任编辑:刘明亮