Volver al blog
§Cumplimiento9 de mayo de 2026 · 5 min de lectura

Régimen jurídico de la captura de comandas por voz
Protección de datos y entorno laboral en hostelería.

«No se puede grabar a empleados» es cierto a medias — y lo que falta es lo que hace viable la captura de comandas por voz. Guía corta, con los artículos pegados, sobre dónde está la línea, por qué call centers y logística la cruzan desde hace décadas, y las seis decisiones de diseño que dejan el sistema dentro del cumplimiento.

TL;DRLo que cambia entre grabar y capturar

Si solo lees este recuadro, ya tienes lo importante para que tu asesor no te apague la idea con un *«no se puede»* automático. Cada punto es una pieza del marco que ya está asentado en doctrina y precedentes — no una interpretación creativa.

  • Art. 89 LOPDGDD regula vigilancia, no herramienta operativa. El TPV registra todo y nadie discute. La voz como interfaz va por el mismo marco — no por el de la cámara escondida.

  • No se almacena audio: solo la comanda transcrita (Art. 5.1.c RGPD). Sin conservación de voz, el régimen se aplica al texto, no a un dato biométrico.

  • Procesamiento on-device, no cloud (Art. 28 y Cap. V RGPD). Sin transferencia ni encargado de tratamiento, dos capítulos del RGPD dejan de aplicar.

  • Activación voluntaria, no escucha continua (Art. 5.1.b RGPD). El camarero opera el sistema con voz; no es el sistema escuchándole.

  • Voice-pick lleva décadas en logística sin sanción. El patrón ya está consolidado. No abre debate nuevo — aplica uno viejo a un sector nuevo.

  • Cuatro documentos cubren el cumplimiento. RAT, información al trabajador, consulta al comité, cartelería al cliente. Una jornada bien hecha.

«No se puede grabar a empleados» es la frase con la que muchas conversaciones de hostelería se acaban antes de empezar. Es cierta a medias: la mitad que falta es justo la que hace viable la captura de comandas por voz.

Esta entrada no es asesoramiento jurídico — para implantar el sistema en tu local consulta con un letrado. Sí es una guía honesta, con los artículos pegados, sobre qué dice la ley y por qué call centers, logística y sanidad llevan décadas tratando voz en el trabajo sin polémica regulatoria.

  1. iEl cache mental · lo que se repite mal

    «No se puede grabar a empleados» es titular sin letra pequeña.

    Norma. Art. 89.3 LOPDGDD: la grabación de sonidos en el lugar de trabajo «se admitirá únicamente cuando resulten relevantes los riesgos para la seguridad de las instalaciones, bienes y personas». Suena a prohibición general; no lo es.

    Subsunción. El supuesto regulado es vigilancia instalada por el empresario sobre un trabajador pasivo — micro escondido, escucha continua. No incluye herramientas que el trabajador opera con voz (TPV, walkie, voice-pick, dictado, comanda).

    Consecuencia. Aplicar Art. 89.3 a cualquier voz en el trabajo extiende la norma fuera de su tenor literal. Una herramienta operada por el trabajador se rige por el régimen general del RGPD, no por la lex specialis de vigilancia laboral.

  2. iiLa distinción que lo cambia todo

    Vigilar y registrar no son lo mismo. El TPV registra y nadie protesta.

    Norma. RGPD, Art. 6.1.f: tratamiento lícito por interés legítimo del responsable, ponderado con los derechos del afectado. Es el régimen general que cubre cualquier herramienta digital operada por el trabajador.

    Subsunción. El TPV registra quién, cuándo y qué y nadie discute su licitud: trazabilidad operativa pura. La voz como interfaz funciona idéntico — el camarero activa (botón o palabra clave), dice «mesa siete, dos cañas», el sistema registra texto estructurado. No hay un micro oyendo su vida; hay un teclado que se opera con voz.

    Consecuencia. Una sola pregunta separa los dos marcos: ¿el sistema escucha al trabajador (Art. 89 LOPDGDD) o el trabajador opera con voz un sistema (Art. 6.1.f RGPD)? Si es lo segundo, la lex specialis no se activa.

  3. iiiLas seis decisiones de diseño

    Cómo se construye el sistema para quedarse dentro de la ley.

    Seis decisiones que, juntas, vacían el riesgo regulatorio. Cada una se ata a un artículo concreto:

    Una · No se almacena audio. El stream se transcribe y se descarta; queda solo texto: «2 cañas, mesa 7, 22:14». Cumple el principio de minimización (Art. 5.1.c RGPD): sin conservación de voz, el dato personal protegido sale del análisis.

    Dos · Procesamiento on-device. La transcripción corre en el iPad del camarero (Whisper.cpp, Apple Speech Framework). El audio no sale del dispositivo: no hay encargado de tratamiento (Art. 28 RGPD) ni transferencia internacional (Cap. V RGPD). Dos capítulos enteros del Reglamento dejan de aplicar.

    Tres · Activación voluntaria. El micro se enciende con pulsación o palabra clave, captura segundos y se apaga. Sin escucha continua se cumple el principio de limitación de la finalidad (Art. 5.1.b RGPD).

    Cuatro · Finalidad operativa documentada. En el RAT (Art. 30 RGPD) el tratamiento se describe como «agilizar el flujo del pedido y reducir errores», no como control del rendimiento. La finalidad declarada delimita la calificación jurídica: operativa → régimen general; vigilancia → Art. 89 LOPDGDD.

    Cinco · Beneficio verificable para el trabajador. Menos teclear con manos sucias, menos errores con cocina, servicio más rápido (más mesas, más propinas). Una herramienta que beneficia al operador supera con holgura el test de proporcionalidad (idoneidad, necesidad, ponderación) que rige toda injerencia en el ámbito laboral.

    Seis · Información previa, expresa y específica. Al trabajador (Art. 13 RGPD) y a la representación legal (Art. 64.5.f ET). Para audio el estándar es más exigente que para imagen: no basta cartel genérico de videovigilancia, hace falta información específica del tratamiento de voz.

  4. ivLos precedentes que ya están en marcha

    No es nuevo. Lleva décadas funcionando en otros sectores.

    Voice-picking en logística. Operarios con auriculares y micro recibiendo y confirmando órdenes por voz. Décadas de implantación masiva en retail y logística españolas, sin sanción documentada de la autoridad de control. Funcionalmente idéntico a la barra: el operario habla con un sistema para hacer su trabajo más rápido.

    Grabación en call centers. Régimen normalizado desde los noventa. La doctrina mayoritaria de la AEPD lo confirma: con aviso al cliente, información expresa al trabajador, finalidad documentada y plazos razonables, es lícito.

    Dictado en sanidad y derecho. Médicos, abogados y jueces dictan al sistema; el sistema transcribe y desecha; queda el escrito. Tratamiento masivo de voz en entornos sensibles, sin polémica regulatoria.

    Mismo patrón en los tres: el profesional opera con voz un sistema, el sistema transcribe y desecha, el resultado escrito queda registrado. La voz en hostelería no abre debate jurídico nuevo — aplica un patrón consolidado a un sector que se ha digitalizado más tarde.

  5. vLo que la ley sí te exige

    No es difícil cumplir. Cuatro documentos.

    El operador del local (no el desarrollador del software) debe tener cuatro cosas hechas — las mismas que ya tiene cualquier empresa con cámaras o fichaje, aplicadas a la voz:

    Una · RAT actualizado (Art. 30 RGPD) con entrada para «captura por voz de comandas»: finalidad operativa, base jurídica (Art. 6.1.f RGPD o ejecución de contrato), categorías de datos (transcripción, sin audio conservado), plazos, destinatarios. Plantilla pública de la AEPD.

    Dos · Información previa al trabajador por escrito (Art. 13 RGPD): qué se trata, para qué, base jurídica, conservación, derechos. Previa, expresa, clara y concisa — no vale el cartel genérico de videovigilancia.

    Tres · Información a la representación legal (Art. 64.5.f ET). En locales sin representación el trámite no aplica; conviene dejar acta del briefing al equipo.

    Cuatro · Cartelería al cliente en zona de servicio: «En este local los pedidos pueden procesarse mediante sistemas de voz para mejorar el servicio». Mismo aviso que ya usan los call centers, adaptado al espacio físico.

    Cuatro documentos, una jornada de trabajo. A partir de ahí el sistema opera con la misma seguridad jurídica que el TPV.

  6. viLa línea que sí no cruzas

    Por honestidad: lo que no se puede hacer ni con todo el papeleo.

    Cuatro líneas que ninguna decisión de diseño rescata:

    Una · Zonas de descanso, vestuarios, comedores y aseos. Prohibición absoluta del Art. 89.4 LOPDGDD, sin excepción. El sistema solo opera en zona de servicio; apagado en cualquier otro sitio.

    Dos · Vigilancia encubierta. La doctrina mayoritaria del TEDH admite excepciones únicamente con sospecha previa razonable y acreditada de irregularidad grave, y de interpretación restrictiva. Si lo necesitas para uso normal, no lo necesitas.

    Tres · Cambio de finalidad. Si el RAT declara «operativa de servicio» y luego usas las comandas para penalizar al camarero más lento, has roto el principio de limitación de la finalidad (Art. 5.1.b RGPD) y eso sí abre sanción. Lo que registras como herramienta operativa, lo usas como herramienta operativa.

    Cuatro · Conservación excesiva. Las comandas estructuradas pueden conservarse el plazo fiscal aplicable. El audio bruto, cero: el principio de minimización (Art. 5.1.c RGPD) obliga a tratar y conservar lo mínimo. Si tu sistema necesita guardar audio, la pregunta correcta es por qué — no qué papel firmar.

Cierre

La ley protege al trabajador. No prohíbe darle herramientas.

El Art. 89 LOPDGDD existe para que un empresario no pueda meter un micro en el almacén a escuchar a sus trabajadores. Confundir esa prohibición con cualquier tratamiento de voz en el trabajo es leer la norma fuera de su tenor literal y desperdiciar un patrón ya consolidado en otros sectores.

La pregunta correcta no es «¿se puede grabar?» sino «¿esto es vigilancia o herramienta que el trabajador opera?». Si es lo segundo, estás del lado de la ley que permite, no del que prohíbe.

Krasvi App

Voz como interfaz, no como sensor de control.

Krasvi App es la capa de voz para tu sala que se integra con el TPV que ya tienes. Audio procesado on-device, sin almacenamiento del audio bruto, activación voluntaria del camarero y pack de cumplimiento listo para tu gestoría.

Fuentes
  • Ley Orgánica 3/2018, de 5 de diciembre (LOPDGDD) — artículo 89 (videovigilancia y grabación de sonidos en el lugar de trabajo).
  • Reglamento (UE) 2016/679 — RGPD, artículos 5 (principios), 6 (licitud), 13 (información), 28 (encargado de tratamiento), 30 (RAT) y Capítulo V (transferencias internacionales).
  • Real Decreto Legislativo 2/2015 — Estatuto de los Trabajadores, artículo 64.5.f (información a la representación legal sobre implantación de sistemas).
  • Doctrina constitucional reiterada sobre videovigilancia laboral: deber de información previa y test de proporcionalidad (idoneidad, necesidad, ponderación).
  • Doctrina mayoritaria del TEDH sobre vigilancia laboral: proporcionalidad y deber de información, con interpretación restrictiva de la vigilancia encubierta.
  • Doctrina mayoritaria de la AEPD sobre grabación de audio en el trabajo y régimen de call centers: licitud condicionada a información previa, finalidad documentada y conservación mínima.