Mistral发布Pixtral Large多模态AI模型：登顶复杂数学推理，图表/文档推理超过GPT-4o

Mistral AI 公司昨日（11 月 18 日）发布公告，宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数，基于 Mistral Large 2，主要用于处理文本和图片。

Pixtral Large 现已在 Mistral 研究许可证和商业许可证下提供，适用于研究、教育以及商业用途。

Pixtral Large 是 Mistral AI 多模态家族中的第二个模型。IT之家援引官方新闻稿，该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色，尤其在 MathVista 中达到了 69.4% 的准确率，超越了所有竞争对手。

在 ChartQA 和 DocVQA 测试中，Pixtral Large 同样表现优异，超越了 GPT-4o 和 Gemini-1.5 Pro。

该模型配备了 123B 的多模态解码器和 1B 的视觉编码器，支持 128K 的上下文窗口，能够处理至少 30 张高分辨率图像。Pixtral Large 不仅在视觉数据上表现出色，同时在复杂推理和图表理解方面也具备强大能力。

作者：故渊来源：IT之家