教程#

无论您是初学者还是经验丰富的用户,这些教程都将引导您了解我们的功能和特性,使您能够轻松理解和实施它们。

反馈数据集

注意

本节中介绍的数据集类是 FeedbackDataset。这个完全可配置的数据集将取代 Argilla 2.0 中的 DatasetForTextClassificationDatasetForTokenClassificationDatasetForText2Text。不确定使用哪个数据集?请查看我们关于选择数据集的部分。

初学者

如果您是 Argilla 的新手,并且想要浏览低门槛的 notebook 以重现特定功能,那么这些教程非常适合您。 它们可以逐步学习,但您也可以使用我们已为您准备好的 Argilla 兼容数据集来完成各个示例,这些数据集可以从 Hugging Face Hub 下载。

workflow

配置用户和工作区

了解如何配置 UsersWorkspaces

创建 FeedbackDataset

了解如何配置 FeedbackDataset 并向其添加 FeedbackRecords

将记录分配给您的团队

了解如何轻松地将记录分配给您的团队。

向 FeedbackDataset 添加元数据

了解如何向 FeedbackDataset 添加元数据属性。

向 FeedbackDataset 添加向量

了解如何向 FeedbackDataset 添加向量和向量设置。

向 FeedbackDataset 添加响应和建议

了解如何向 FeedbackDataset 添加建议和响应。

筛选和查询您的 FeedbackDataset

了解如何筛选和查询您的 FeedbackDataset

使用 ArgillaTrainer 训练您的模型

了解如何使用 ArgillaTrainer 训练您的模型。

使用指标评估您的模型

了解如何使用指标模块评估您的模型。

高级

在这里您可以找到更高级的应用示例,以帮助您开始策划数据集和收集反馈,从而微调 LLM 和其他语言模型。

Ⓜ️ 微调 LLM 作为聊天助手:在 Mistral 7B 上进行监督微调

了解如何使用 ArgillaTrainer 和 TRL 通过监督微调将 Mistral 7B 微调为聊天助手。

🪄 使用人工反馈为 RAG 微调和评估 GPT-3.5

了解如何使用 LlamaIndex 通过人工反馈为 RAG 应用程序微调和评估 gpt3.5-turbo 模型。

🎛️ 使用 ArgillaTrainer 微调 SetFit 模型

了解如何使用 ArgillaTrainer 使用 Setfit 微调您的反馈数据集。

🏆 训练 RLHF 的奖励模型

了解如何收集比较或人类偏好数据,并使用 trl 库训练奖励模型。

❓ 使用 transformers 和 Argilla 训练 QnA 模型

了解如何使用 ArgillaTrainer 通过 transformers 和注释数据微调 QnA 模型

🌠 通过训练检索和重排序模型来微调 RAG 管道

了解如何通过优化的检索和重排序模型来提升 RAG 性能,从而提高 AI 准确性。

✨ 使用 SetFit 添加零样本文本分类建议

了解如何使用 SetFit 向您的反馈数据集添加建议。

🧸 使用 LLM 通过 spacy-llm 进行文本分类和摘要

了解如何使用 spacy-llm 向您的反馈数据集添加文本分类和摘要的建议。

🎡 使用 LLM 创建合成数据和注释

了解如何使用 OpenAI、LangChain、Transformers 和 Outlines 创建合成数据和注释。

🖼️ 策划用于监督微调的指令数据集

了解如何设置项目以策划可用于微调指令跟随模型的公共数据集。

📑 充分利用 Markdown:视频、音频和图像

了解如何使用 Argilla TextFields 将多模态(视频、音频和图像)应用于您的 FeedbackDataset。

👀 监控 LLM 中的伦理和偏差:Giskard 和 DPO

了解如何使用 Giskard 检测 LLM 中的偏差和伦理问题,并使用 DPO 进行微调。

🎮 监控数据和模型漂移的真实世界示例

了解如何在真实场景中使用不同工具监控数据和模型漂移。

💭 增强的情感分析:使用 Setfit 的基于跨度的极性方法

了解如何训练 ABSA 模型并使用 Argilla 进行评估。

🙌 使用 FastFit 模型预测分析注释指标

了解如何训练 FastFit 模型并计算众所周知的注释指标。

其他数据集

注意

本节中介绍的记录类对应于三个数据集:DatasetForTextClassificationDatasetForTokenClassificationDatasetForText2Text。这些将在 Argilla 2.0 中弃用,并由完全可配置的 FeedbackDataset 类取代。不确定使用哪个数据集?请查看我们关于选择数据集的部分。

正在寻找更多教程?查看我们的notebooks 文件夹

🤯 使用 SetFit 进行少样本分类

了解如何使用 setfit 库执行少样本分类。

👂 使用 small-text 和 SetFit 进行少样本文本分类与主动学习

了解如何使用 setfitsmall-text 库执行少样本文本分类与主动学习。

💨 使用语义搜索和 Sentence Transformers 标注数据

了解如何使用 sentence-transformers 库通过语义搜索标注数据。

🧹 使用 cleanlab 查找和清理标签错误

了解如何使用 cleanlab 库查找和清理标签错误。

🐭 使用 skweak 通过弱监督规则训练 NER 模型

了解如何使用 snorkel 库为 NER 执行弱监督。

👮 使用语义搜索进行文本分类的弱监督

了解如何使用 sentence-transformerssnorkel 通过语义搜索对文本分类进行弱监督。

🔗 使用 LLM 通过 spacy-llm 进行少样本 Token 分类建议

了解如何使用 spacy-llm 库进行少样本 token 分类。