🤔 使用建议和回复#

其他数据集#

注意

本节中涵盖的记录类对应于三个数据集：DatasetForTextClassification、DatasetForTokenClassification 和 DatasetForText2Text。这些将在 Argilla 2.0 中弃用，并由完全可配置的 FeedbackDataset 类取代。不确定使用哪个数据集？请查看我们关于选择数据集的部分。

添加 `suggestions`#

建议指的是可以添加到记录中的建议回复（例如，模型预测），以加快标注过程。这些可以在创建记录期间或稍后阶段添加。我们允许每个记录有多个建议。

文本分类

在这种情况下，我们期望一个 List[Tuple[str, float]] 作为预测，其中元组的第一个元素是标签，第二个元素是置信度分数。

import argilla as rg

rec = rg.TextClassificationRecord(
    text=...,
    prediction=[("label_1", 0.75), ("label_2", 0.25)],
)

single_textclass_record

文本分类（多标签）

在这种情况下，我们期望一个 List[Tuple[str, float]] 作为预测，其中元组的第二个元素是预测的置信度分数。在多标签的情况下，记录的 multi_label 属性应设置为 True。

import argilla as rg

rec = rg.TextClassificationRecord(
    text=...,
    prediction=[("label_1", 0.75), ("label_2", 0.75)],
    multi_label=True
)

multi_textclass_record

Token 分类

在这种情况下，我们期望一个 List[Tuple[str, int, int, float]] 作为预测，其中元组的第二个和第三个元素是文本中 token 的开始和结束索引。

import argilla as rg

rec = rg.TokenClassificationRecord(
    text=...,
    tokens=...,
    prediction=[("label_1", 0, 7, 0.75), ("label_2", 26, 33, 0.8)],
)

tokclass_record

Text2Text

在这种情况下，我们期望一个 List[str] 作为预测。

import argilla as rg

rec = rg.Text2TextRecord(
    text=...,
    prediction=["He has 3*4 trees. So he has 12*5=60 apples."],
)

text2text_record

添加 `responses`#

如果您的数据集包含一些注释，您可以在创建记录时将其添加到记录中。确保回复遵循与 Argilla 输出相同的格式，并满足模式要求。

文本分类

在这种情况下，我们期望一个 str 作为注释。

import argilla as rg

rec = rg.TextClassificationRecord(
    text=...,
    annotation="label_1",
)

single_textclass_record

文本分类（多标签）

在这种情况下，我们期望一个 List[str] 作为注释。在多标签的情况下，记录的 multi_label 属性应设置为 True。

import argilla as rg

rec = rg.TextClassificationRecord(
    text=...,
    annotation=["label_1", "label_2"],
    multi_label=True
)

multi_textclass_record

Token 分类

在这种情况下，我们期望一个 List[Tuple[str, int, int]] 作为注释，其中元组的第二个和第三个元素是文本中 token 的开始和结束索引。

import argilla as rg

rec = rg.TokenClassificationRecord(
    text=...,
    tokens=...,
    annotation=[("label_1", 0, 7), ("label_2", 26, 33)],
)

tokclass_record

Text2Text

在这种情况下，我们期望一个 str 作为注释。

import argilla as rg

rec = rg.Text2TextRecord(
    text=...,
    annotation="He has 3*4 trees. So he has 12*5=60 apples.",
)

text2text_record

🤔 使用建议和回复#

反馈数据集#

格式化 `suggestions`#

添加 `suggestions`#

格式化 `responses`#

添加 `responses`#

其他数据集#

添加 `suggestions`#

添加 `responses`#

🤔 使用建议和回复#

反馈数据集#

格式化 suggestions#

添加 suggestions#

格式化 responses#

添加 responses#

其他数据集#

添加 suggestions#

添加 responses#

格式化 `suggestions`#

添加 `suggestions`#

格式化 `responses`#

添加 `responses`#

添加 `suggestions`#

添加 `responses`#