在 Colab 中打开  在 GitHub 上查看 Notebook

安装#

欢迎!如果您刚刚发现 Argilla,这是开始入门的最佳位置。Argilla 由以下部分组成:

  • Argilla 客户端:一个强大的 Python 库,用于将数据读写到 Argilla 中,使用您喜欢的所有库(transformers、spaCy、datasets 以及任何其他库)。

  • Argilla 服务器和 UI:用于数据注释和管理的 API 和 UI。

要开始入门,您需要:

  1. 启动 Argilla 服务器和 UI。

  2. 选择一个教程,并开始使用 Jupyter Notebook 或 Google Colab 体验 Argilla。

让我们开始运行 Argilla 吧!

运行 Argilla 快速入门#

对于小型项目和快速实验,有两种推荐的方式:

👩🏽‍🚀 Hugging Face Spaces 上的 Argilla#

如果您有 Hugging Face 帐户,并且想从 Colab 或远程 Notebook 运行 Argilla 工作流程,则可以在 Spaces 上部署 Argilla

deploy on spaces

Hugging Face Spaces 现在具有持久存储,Argilla 1.11.0 及更高版本支持此功能,但您需要通过 Hugging Face Spaces 设置手动激活它。否则,除非您升级到付费空间,否则在 48 小时不活动后,空间将被关闭,并且您将丢失所有数据。为了避免丢失数据,我们强烈建议使用 Hugging Face 提供的持久存储层。如果一切顺利,您将看到您的在线 Argilla UI 登录页面。您可以使用用户名 admin 和密码 12345678 登录。要将数据发送到您的 Argilla 实例,您需要直接 URL。如果您使用的是公共空间,可以通过单击“嵌入此 Space”选项(右上角)找到它。如果您使用的是私有空间,则应按以下方式构建直接 URL:https://[您的所有者名称]-[您的空间名称].hf.space

f66ea802e965481c9954f511668bbeca

您现在已准备好开始使用 Argilla!作为下一步,我们建议查找教程。找到教程后,您可以 (1) 使用 Colab 中打开 按钮,使用免费 GPU 运行 Argilla 工作流程,或者 (2) 使用每个教程页面右上角的 查看 源代码 链接下载 Notebook,并使用 VS Code、Jupyter Lab 或任何其他 Jupyter IDE 运行它。

注意

如果您想配置 UI 密码和 API 密钥等设置,您可以按照本指南。如果您想快速体验 Argilla,这是一个完全可选的步骤,但对于小型项目,建议这样做,因为您可以控制谁可以浏览、上传和删除数据集。

🐳 使用 Docker 的 Argilla 快速入门#

如果您想在您自己的计算机上本地运行 Argilla,这是启动并运行 Argilla UI 的最简单方法。使用此选项,您将获得一些示例数据集以使用 Argilla UI 探索,以及一个本地运行的 Argilla UI,您可以使用它来使用 VS Code 或 Jupyter Lab 等工具运行您自己的 Argilla 数据工作流程。

注意

您需要在您的机器上安装 Docker。我们建议安装 Docker Desktop

要运行 Argilla 快速入门容器,您需要从终端运行此命令:

docker run -d --name quickstart -p 6900:6900 argilla/argilla-quickstart:latest

Apple Silicon 问题

Apple Silicon M1/M2 用户在此部署中可能会遇到问题。要解决此问题,请使用 --platform linux/arm64 参数。如果这不起作用,部署单独的镜像或通过 docker-compose 将会有效。

如果一切顺利,您可以访问 https://127.0.0.1:6900 并使用用户名 admin 和密码 12345678 登录。您将看到几个已经预加载的示例数据集。这意味着您已准备好开始使用 Argilla!

作为下一步,我们建议查找教程,使用每个教程页面右上角的 查看 源代码 链接下载 Notebook,并使用 VS Code、Jupyter Lab 或任何其他 Jupyter IDE 运行它。

有关设置 Argilla 快速入门容器的更多详细信息,请按照本指南

其他部署选项和配置#

Argilla 具有高度可配置性,并且易于部署在不同的环境中。如果您正在寻找更高级的部署选项并希望拥有更适合生产环境的设置,您可以阅读部署配置指南。

默认工作流#

如果您想了解 Argilla 中的默认工作流,请查看基本指南