Claude 3发布，GPT-4 和 Gemini 又被按在地上搓

Claude 3 模型家族深夜悄悄发布，文本长度提高到200k，具有处理和分析图像数据的视觉能力，并在推理、数学和编码等方面表现出色，模型推理更快更强更安全。Claude 3 共有三个版本，分别是 Haiku, Sonnet, 和Opus，三个版本表现依次增强：

官方给出了和 GPT-4 以及 Gemini 的基准测试对比图，可以看出 Claude 3 超大杯Opus性能全面碾压 GPT-4 和 Gemini。而Haiku, Sonnet则位于GPT-3.5和GPT-4之间：

在 Claude 3 给出的长达42页的技术报告里对该模型有更详细的技术解读以及多维度测试：

多模态输入能力：Claude 3模型能够处理文本和图像输入，这使得它们可以在更丰富的上下文中提供帮助，例如上传图表、图形和照片。
工具使用（Function Calling）：模型能够无缝集成到专业应用和自定义工作流中，这提高了其在实际应用中的灵活性和实用性。
训练方法：模型采用了多种训练方法，包括无监督学习和宪法人工智能（Constitutional AI），以确保模型的输出符合人类价值观。
硬件和框架：模型训练使用了Amazon Web Services (AWS)和Google Cloud Platform (GCP)的硬件，以及PyTorch、JAX和Triton等核心框架。
安全和社会责任：Anthropic公司遵循负责任的扩展政策（Responsible Scaling Policy），并在模型开发过程中考虑了潜在的社会影响和灾难性风险。
性能评估：模型在多个基准测试中表现出色，包括GPQA、MMLU、MMMU等，并且在非英语语言的流畅性上有所提高。

Ref