IBM 与 Groq 签署合作协议,提供快速 AI 推理选项

IBM 将 Groq 技术与 watsonx 和 Granite 集成,用于 AI 推理应用。
2025-10-23 17:12:57  |   作者:开源爱好者  |   来源:

IBM 与 Groq 签署合作协议,提供快速 AI 推理选项

IBM 将 Groq 技术与 watsonx 和 Granite 集成,用于 AI 推理应用。
2025-10-23 17:12:57
作者:开源爱好者
来源:

IBM 与 Groq 合作,为企业客户提供一种可靠且具有成本效益的方式,加速 AI 推理应用。

具体而言,IBM 正在将 Groq 的推理平台 GroqCloud 以及其定制的语言处理单元(LPU)硬件架构,集成到 IBM 的 watsonx Orchestrate 中。watsonx Orchestrate 帮助客户构建、部署和管理 AI 代理及工作流,以自动化业务操作。IBM watsonx Orchestrate 提供了超过 500 种工具和来自 IBM 及第三方贡献者的可定制领域特定代理。Groq 声称,其 GroqCloud 提供的推理速度比传统 GPU 系统快 5 倍以上,同时更具成本效益。

4075762-0-24775200-1761053524-shutterstock_2284126663-100943536-orig-100962531-orig-100962848-orig.jpg

此外,IBM 和 Groq 计划集成并增强 Red Hat 的开源大语言模型(vLLM)框架,该框架包括其自有的推理服务器,能够在 Groq 的 LPU 架构上运行,并让 IBM Granite 模型在 GroqCloud 上运行。

这一合作中的技术将使客户能够以熟悉的方式使用 watsonx 的功能,并在加速推理的同时使用其首选工具。IBM 表示:“这次集成将解决 AI 开发者的关键需求,包括推理调度、负载平衡和硬件加速,最终简化推理过程。”

对于运行生产 AI 工作负载的企业,特别是代理型 AI、实时决策系统(如客户服务机器人、欺诈检测和物联网监控),推理速度可能成为瓶颈,IBM 表示。其目标是帮助客户在代理型工作流中提高生产力和成本效益。IBM 进一步指出:“这对医疗、金融、政府、零售和制造等领域尤为关键,这些行业在实施 AI 时面临速度、成本和可靠性的挑战。”

IBM 软件和首席商业官 Rob Thomas 在一份声明中表示:“许多大型企业在实验阶段有多种 AI 推理选择,但当他们希望进入生产阶段时,必须确保复杂的工作流能够成功部署,以确保高质量的体验。”

IBM 在 AI 领域的最新进展

最近,IBM 与初创公司 Anthropic 合作——该公司由前 OpenAI 专家创立,并获得了亚马逊和谷歌的支持,目的是将 Anthropic 的大语言模型 Claude 集成到 IBM 的软件产品组合中。IBM 表示,Claude LLM 能够理解和生成自然语言,并提供治理、安全性、可审计性和可扩展性。Claude 将被集成到 IBM 的 select 软件产品中,首个集成的产品是 IBM 的 AI 优先集成开发环境(IDE),该环境为企业软件开发生命周期中的任务生成提供了先进的功能,包括软件现代化。IBM 表示,IDE 目前处于私有预览阶段。

IBM 旨在扩大其 AI 软件生态系统,涵盖更多的大语言模型开发者和技术,为客户提供多种服务选项。