YeeKal
ai

Claude 3发布,GPT-4 和 Gemini 又被按在地上搓

YeeKal
"#ai"

Claude 3 模型家族深夜悄悄发布,文本长度提高到200k,具有处理和分析图像数据的视觉能力,并在推理、数学和编码等方面表现出色,模型推理更快更强更安全。Claude 3 共有三个版本,分别是 Haiku, Sonnet, 和Opus,三个版本表现依次增强:

官方给出了和 GPT-4 以及 Gemini 的基准测试对比图,可以看出 Claude 3 超大杯Opus性能全面碾压 GPT-4 和 Gemini。而Haiku, Sonnet则位于GPT-3.5和GPT-4之间:

在 Claude 3 给出的长达42页的技术报告里对该模型有更详细的技术解读以及多维度测试:

  • 多模态输入能力:Claude 3模型能够处理文本和图像输入,这使得它们可以在更丰富的上下文中提供帮助,例如上传图表、图形和照片。
  • 工具使用(Function Calling):模型能够无缝集成到专业应用和自定义工作流中,这提高了其在实际应用中的灵活性和实用性。
  • 训练方法:模型采用了多种训练方法,包括无监督学习和宪法人工智能(Constitutional AI),以确保模型的输出符合人类价值观。
  • 硬件和框架:模型训练使用了Amazon Web Services (AWS)和Google Cloud Platform (GCP)的硬件,以及PyTorch、JAX和Triton等核心框架。
  • 安全和社会责任:Anthropic公司遵循负责任的扩展政策(Responsible Scaling Policy),并在模型开发过程中考虑了潜在的社会影响和灾难性风险。
  • 性能评估:模型在多个基准测试中表现出色,包括GPQA、MMLU、MMMU等,并且在非英语语言的流畅性上有所提高。

Ref