Croissant 1.1 新功能:可扩展、代理就绪的 ML 数据集标准
MLCommons 发布 Croissant 1.1,这是社区共建的机器学习数据集元数据格式最新版本。在 Croissant 1.0 标准化机器可读结构基础上,1.1 版新增机器可操作来源追踪、全方位词汇互操作性、结构化使用政策以及复杂多维数据集增强建模。这些功能专为 AI '代理时代' 设计,支持链式保管审计、W3C PROV-O 模型、DUO 和 ODRL 政策集成。目前已有 70 万数据集采用 Croissant 元数据,主要框架如 TensorFlow、PyTorch 和仓库如 Hugging Face 已原生支持,推动数据自治发现与合规使用。(128 字)