Contents - Argilla v1 文档 - Argilla 协作工具 Menu - Argilla v1 文档 - Argilla 协作工具 Expand - Argilla v1 文档 - Argilla 协作工具 Light mode - Argilla v1 文档 - Argilla 协作工具 Dark mode - Argilla v1 文档 - Argilla 协作工具 Auto light/dark mode - Argilla v1 文档 - Argilla 协作工具
Light Logo Dark Logo
Light Logo Dark Logo
加入Discord

开始入门

  • 什么是 Argilla?
  • 🚀 快速入门
    • 安装
    • 工作流反馈数据集
    • 其他数据集的工作流
  • 🎼 速查表
  • 🔧 安装
    • Python
    • Docker
    • Docker 快速入门
    • Docker-compose
    • 云提供商和 Kubernetes
    • Hugging Face Spaces
    • Google Colab
  • ⚙️ 配置
    • Elasticsearch
    • 服务器配置
    • 用户管理
    • 工作区和数据集管理
    • 数据库迁移
    • 图像支持

概念指南

  • Argilla 概念
  • 用于 LLM 的数据收集
    • 收集 RLHF 数据
    • 收集演示数据
    • 收集比较数据

实用指南

  • 🗺️ 实用指南概览
  • 🧐 选择数据集类型
  • 🧑‍💻 创建和更新数据集
    • ⏺️ 添加和更新记录
    • 💾 使用元数据
    • 🎫 使用向量
    • 🤔 使用建议和回复
  • 🗂️ 将记录分配给你的团队
  • 🔎 筛选和查询数据集
  • ✍️ 注释数据集
  • 🌊 使用机器反馈工作流程简化注释
    • 🧑‍🏫 主动学习
    • 👮 弱监督
    • 🔦 语义搜索
    • ⏲️ 作业调度和回调
    • 📇 将文本描述符添加为元数据
  • 📊 收集回复和指标
  • 📥 导出数据集
  • 🦾 微调 LLM 和其他语言模型

教程和集成

  • 教程
  • 集成
    • langchain:监控应用、链和代理以及工具中的 LLM
    • unstructured:用于 LLM 的大规模文档处理
    • fastapi:使用 ArgillaLogHTTPMiddleware 监控 NLP 模型
    • textdescriptives:添加基本描述性特征作为元数据
    • sentence-transformers:向你的数据集添加语义向量
    • llamaindex:使用 LlamaIndex 构建 LLM 应用程序,并使用 Argilla 监控数据。

参考

  • Python
    • 客户端
    • 指标
    • 标注
    • 训练
    • 监控
    • 监听器
    • 用户
    • 工作区
    • 注释指标
  • CLI
  • Argilla UI
    • 页面
    • 功能
  • Notebooks
    • 🔐 使用 DVC 备份和版本控制 Argilla Datasets
    • 🚀 在浏览器中使用 Transformer 在主动学习循环和免费 GPU 中运行 Argilla
    • 💾 监控 FastAPI 模型端点
    • 🧸 使用 LLM 进行文本分类和摘要建议,搭配 spacy-llm
    • 🗺️ 使用 disaggregators 向数据集添加偏差-平等特征
    • 💡 使用 GPT-3 构建和评估零样本情感分类器
    • 💨 使用语义搜索和 Sentence Transformers 标注数据
    • 📸 批量标注多模态数据
    • 🧱 使用 Sentence Transformers 增强弱监督规则
    • 🔫 使用 SetFit 进行零样本和少样本分类
    • 🗂 多标签文本分类与弱监督
    • 📰 使用弱监督训练文本分类器
    • 🗂️ 将记录分配给你的注释团队
    • 🩹 从 Token 或文本分类数据集中删除标签
    • 🔫 使用 Flair 评估零样本 NER
    • 🐭 使用 skweak 训练 NER 模型
    • 💫 探索和分析 spaCy NER 预测
    • 🔗 使用 LLM 进行少样本 Token 分类建议,搭配 spacy-llm
    • 🧐 使用 cleanlab 查找标签错误
    • 🥇 比较文本分类模型
    • 🕵️‍♀️ 使用可解释性方法分析预测
    • 🧼 使用模型的损失清理标签
    • 🤔 初学者使用 BERT 微调 NER 模型
    • 文本分类主动学习与 classy-classification
    • 🤔 文本分类主动学习与 ModAL
    • 🤯 少样本分类与 SetFit
    • 🤗 使用 SetFit 训练情感分类器
    • 👂 文本分类:使用 small-text 的主动学习
    • 🏷️ 使用你自己的数据微调情感分类器
    • 🕸️ 使用 Unstructured 和 Transformers 训练摘要模型
  • 遥测

社区

  • Discord
  • Github
  • 开发者文档
  • 贡献者文档
  • 从 Rubrix 迁移
返回顶部
加入Discord

🔦 语义搜索#

这些教程向你展示如何将语义搜索与 Argilla 一起使用。

📸 批量标注多模态数据

MLOps 步骤:标注
NLP 任务:文本分类(图像)
库:Argilla, sentence-transformers
技术:语义搜索

💨 使用 Sentence Transformer 嵌入加速数据标注

MLOps 步骤:标注
NLP 任务:文本分类
库:Argilla, sentence-transformers
技术:语义搜索

版权所有 © 2025, Argilla.io
使用 Sphinx 和 @pradyunsg 的 Furo 制作
在此处注册
我们的社区聚会