跳转到主要内容
使用评估集来衡量对您最重要字符串的翻译质量。

选择文件格式

您可以将评估集存储为 JSON、JSONC 或 CSV。
  • 当您需要嵌套结构和明确的元数据时,使用 JSON 或 JSONC
  • 当您需要快速编辑带有列的电子表格时,请使用 CSV id, source, targetLocale, context, reference, tags, bucket,和 group
  • 在CSV中,用分号分隔多个标签 (ui;short;icu)

选择代表性覆盖范围

包含多种字符串类型,以便您能够检测不同内容形式中的回归。
  • 简短的用户界面字符串:按钮、标签、菜单项和简洁的错误文本
  • 长-表单字符串:入职步骤、帮助文本、法律文本和交易信息
  • ICU 和复杂格式:复数规则、性别变体、选择语句,以及日期或数字格式占位符
  • 占位符和变量:类似的标记 {name}, %s,或 {{count}} 必须保持不变

保持上下文与每个案例紧密相关

对于每个案例,存储一个稳定的ID并包含足够的上下文供审核人员使用。
  • 添加目标语言和源文本
  • 包括截图、功能名称或意图说明 context
  • 添加可选项 reference 当您已有可靠的翻译时使用的文本
  • 用标签和可选的桶或组标记案例,这样你可以按区域分割报告。

随着时间保持质量

将评估集视为生产测试数据。
  • 当界面或产品文案变更时,审查并更新集合
  • 删除不再对应活动功能的过时案例
  • 保持简单、中等和困难字符串的平衡
  • 重复运行相同的集合,以公平地比较模型或提示的变化。