遥测#

Argilla 使用遥测技术来报告匿名使用情况和错误信息。作为开源软件,这类信息对于改进和了解产品的使用方式非常重要。

如何选择退出#

你可以在启动服务器之前使用 ENV 变量 ARGILLA_ENABLE_TELEMETRY 选择退出遥测报告。将此变量设置为 0 将完全禁用遥测报告。

如果你是 Linux/MacOS 用户,你应该运行

export ARGILLA_ENABLE_TELEMETRY=0

如果你是 Windows 用户,你应该运行

set ARGILLA_ENABLE_TELEMETRY=0

要再次选择加入,你可以将变量设置为 1

为什么要报告遥测#

匿名遥测信息使我们能够不断改进产品并检测重复出现的问题,从而更好地为所有用户服务。我们收集关于一般使用情况和错误的汇总信息。我们不收集关于用户数据记录、数据集或元数据信息的任何信息。

敏感数据#

我们不收集任何与你存储在 Argilla 中的源数据相关的信息片段。我们不会识别个人用户。你的数据在任何时候都不会离开你的服务器

  • 不收集数据集记录。

  • 不收集数据集名称或元数据。

报告的信息#

报告以下使用情况和错误信息

  • 引发的错误代码以及与错误相关的实体类型(如果有)(数据集、工作区等)

  • user-agentaccept-language http 标头

  • 批量操作的任务名称和记录数

  • 匿名生成的用户 uuid

  • 运行服务器的 Argilla 版本

  • Python 版本,例如 3.8.13

  • 系统/操作系统名称,例如 LinuxDarwinWindows

  • 系统的发布版本,例如 Darwin Kernel Version 21.5.0: Tue Apr 26 21:08:22 PDT 2022; root:xnu-8020

  • 机器类型,例如 AMD64

  • 底层平台规范,包含尽可能多的有用信息。(例如 macOS-10.16-x86_64-i386-64bit

  • 部署类型:quickstartserver

  • Docker 化部署标志:TrueFalse

这是通过注册以下 API 方法的信息来执行的

  • GET /api/me

  • POST /api/dataset/{name}/{task}:bulk

  • POST /api/users

  • 引发的服务器 API 错误

此外,我们报告 Python 库的集成使用情况

  • ArgillaTrainer 框架使用情况和 NLP 任务类型。

我们还通过 tutorial_running 报告教程的使用情况

  • 教程使用计数及其名称。

为了透明起见,你可以在此处检查执行此操作的源代码。

如果你有任何疑问,请随时加入我们的 Discord 频道 或打开 GitHub issue。我们非常乐意讨论如何改进这一点。