Contents - Argilla v1 文档 - Argilla 协作工具 Menu - Argilla v1 文档 - Argilla 协作工具 Expand - Argilla v1 文档 - Argilla 协作工具 Light mode - Argilla v1 文档 - Argilla 协作工具 Dark mode - Argilla v1 文档 - Argilla 协作工具 Auto light/dark mode - Argilla v1 文档 - Argilla 协作工具
Light Logo Dark Logo
Light Logo Dark Logo
加入Discord

开始使用

  • 什么是 Argilla?
  • 🚀 快速入门
    • 安装
    • 工作流反馈数据集
    • 其他数据集的工作流
  • 🎼 速查表
  • 🔧 安装
    • Python
    • Docker
    • Docker 快速入门
    • Docker-compose
    • 云提供商和 Kubernetes
    • Hugging Face Spaces
    • Google Colab
  • ⚙️ 配置
    • Elasticsearch
    • 服务器配置
    • 用户管理
    • 工作区和数据集管理
    • 数据库迁移
    • 图像支持

概念指南

  • Argilla 概念
  • LLM 的数据收集
    • 收集 RLHF 数据
    • 收集演示数据
    • 收集比较数据

实践指南

  • 🗺️ 实践指南概述
  • 🧐 选择数据集类型
  • 🧑‍💻 创建和更新数据集
    • ⏺️ 添加和更新记录
    • 💾 使用元数据
    • 🎫 使用向量
    • 🤔 使用建议和响应
  • 🗂️ 将记录分配给您的团队
  • 🔎 过滤和查询数据集
  • ✍️ 注释数据集
  • 🌊 使用机器反馈工作流程简化注释
    • 🧑‍🏫 主动学习
    • 👮 弱监督
    • 🔦 语义搜索
    • ⏲️ 作业调度和回调
    • 📇 添加文本描述符作为元数据
  • 📊 收集响应和指标
  • 📥 导出数据集
  • 🦾 微调 LLM 和其他语言模型

教程和集成

  • 教程
  • 集成
    • langchain:监控应用程序、链和代理以及工具中的 LLM
    • unstructured:用于 LLM 的大规模文档处理
    • fastapi:使用 ArgillaLogHTTPMiddleware 监控 NLP 模型
    • textdescriptives:添加基本描述性特征作为元数据
    • sentence-transformers:向数据集添加语义向量
    • llamaindex:使用 LlamaIndex 构建 LLM 应用程序,并使用 Argilla 监控数据。

参考

  • Python
    • 客户端
    • 指标
    • 标注
    • 训练
    • 监控
    • 监听器
    • 用户
    • 工作区
    • 标注指标
  • CLI
  • Argilla UI
    • 页面
    • 功能
  • Notebooks
    • 🔐 使用 DVC 备份和版本控制 Argilla Datasets
    • 🚀 在您的浏览器中使用 Transformer 在主动学习循环和免费 GPU 中运行 Argilla
    • 💾 监控 FastAPI 模型端点
    • 🧸 将 LLM 与 spacy-llm 结合使用,以获得文本分类和摘要建议
    • 🗺️ 使用 disaggregators 向数据集添加偏差-平等特征
    • 💡 使用 GPT-3 构建和评估零样本情感分类器
    • 💨 使用语义搜索和 Sentence Transformers 标注数据
    • 📸 批量标注多模态数据
    • 🧱 使用 Sentence Transformers 增强弱监督规则
    • 🔫 使用 SetFit 进行零样本和少样本分类
    • 🗂 多标签文本分类与弱监督
    • 📰 使用弱监督训练文本分类器
    • 🗂️ 将记录分配给您的注释团队
    • 🩹 从 Token 或文本分类数据集中删除标签
    • 🔫 使用 Flair 评估零样本 NER
    • 🐭 使用 skweak 训练 NER 模型
    • 💫 探索和分析 spaCy NER 预测
    • 🔗 将 LLM 与 spacy-llm 结合使用,以获得少样本 Token 分类建议
    • 🧐 使用 cleanlab 查找标签错误
    • 🥇 比较文本分类模型
    • 🕵️‍♀️ 使用可解释性方法分析预测
    • 🧼 使用模型的损失清理标签
    • 🤔 初学者使用 BERT 微调 NER 模型
    • 文本分类主动学习与 classy-classification
    • 🤔 文本分类主动学习与 ModAL
    • 🤯 少样本分类与 SetFit
    • 🤗 使用 SetFit 训练情感分类器
    • 👂 文本分类:使用 small-text 的主动学习
    • 🏷️ 使用您自己的数据微调情感分类器
    • 🕸️ 使用 Unstructured 和 Transformers 训练摘要模型
  • 遥测

社区

  • Discord
  • Github
  • 开发者文档
  • 贡献者文档
  • 从 Rubrix 迁移
返回顶部
加入Discord

modAL#

这些教程向您展示 Argilla 如何与 modAL 结合使用。
modAL 是一个用于 Python3 的主动学习框架,其设计考虑了模块化、灵活性和可扩展性。

🔁 使用 modAL 进行主动学习

MLOps 步骤:训练
NLP 任务:文本分类
库:modAL
技术:主动学习

版权所有 © 2025, Argilla.io
使用 Sphinx 和 @pradyunsg 的 Furo 构建
在此注册以参加
我们的社区聚会