Transcripción automática frente a transcripción manual. Tiempo, esfuerzo y costo
July 18, 2022 | 6 minutes read
¿Qué es la transcripción manual?
La transcripción manual se define como ‘el proceso de representar un texto oral, ya sea que provenga de archivos de audio o video, en un formato de texto escrito’. Un ejemplo común de transcripción manual es el uso de un taquígrafo en un tribunal. En ese entorno, el taquígrafo detalla todo lo que ocurre con una precisión y eficacia difíciles de igualar. Los transcriptores humanos están entrenados no sólo para descifrar las secuencias de audio o video, sino también para teclear y grabar de la manera más eficaz posible. Recurrir a los servicios de un transcriptor manual tiene sus pros y sus contras.
¿Cuáles son los pros y los contras de la transcripción manual?
La ventaja más obvia de la transcripción manual es el nivel de precisión que se puede alcanzar. Como muchos transcriptores humanos han dedicado años a su oficio, han alcanzado un nivel de habilidad y experiencia que es extremadamente difícil de igualar mediante el uso de un programa o una máquina. Por lo tanto, existen aún ciertas situaciones en las que un transcriptor humano es la opción idónea. Aparte del ejemplo de un taquígrafo, muchos entornos académicos pueden requerir del uso de un transcriptor, ya que los estudiantes o profesores pudieran querer rememorar el contenido de una conferencia o presentación. Debido a la complejidad del lenguaje que puede utilizarse en dichas conferencias o presentaciones, un programa de transcripción automática tendría, sin duda, dificultades para captarlo todo.
Por otro lado, los contras de la transcripción manual son el costo y el tiempo que se tarda en completar un trabajo. Por ejemplo, un transcriptor humano experto y consumado puede tardar en transcribir hasta diez horas por cada hora de un archivo de audio o video. Esto se debe a que las variables de los archivos de audio y video difieren entre sí. Por ejemplo, si un transcriptor está escuchando un archivo con un solo orador que está hablando en un idioma o acento que le es familiar sobre un tema sencillo que no requeriría mayor investigación, el proceso puede fluir rápido y sin problemas. Sin embargo, si en este escenario se cambiara una sola variable, digamos que el tema es muy denso y complejo o que aparece más de un orador a la vez, entonces el transcriptor tendría que tomarse más tiempo.
En cuanto al costo, las tarifas de los transcriptores suelen oscilar entre 1 y 2.50 dólares por minuto de audio. Por lo tanto, un transcriptor humano simplemente no es económicamente viable en ciertos contextos empresariales. Por ejemplo, un bufete de abogados que quiera transcribir entre 30 y 40 horas de grabaciones de audio relacionadas con un caso tendría que pagar una cantidad enorme para que un transcriptor medio completara el trabajo. Además, lo más probable es que este proceso tardara semanas, sino meses en completarse.
¿Qué es la transcripción automática?
La transcripción automática recurre a los servicios de un programa informático para realizar el proceso de transcripción. Estos programas permiten a los usuarios cargar archivos de audio y utilizar la tecnología de inteligencia artificial y las capacidades de aprendizaje automático para completar el trabajo. Los programas de transcripción automática son únicos porque permiten a individuos, que no cuentan con el dinero necesario para pagar a un transcriptor, acceder a métodos de transcripción. Al igual que ocurre con la transcripción manual, optar por un método de transcripción automática tiene sus pros y sus contras.
¿Cuáles son los pros y los contras de la transcripción automática?
La principal ventaja de la transcripción automática es que el proceso ahorra una cantidad significativa de tiempo y dinero. Por ejemplo, CaseGuard Studio puede utilizarse para transcribir automáticamente horas de archivos de audio en cuestión de minutos. Esta velocidad nunca podría ser alcanzada por un transcriptor humano, que invariablemente sería más detallista y metódico en su trabajo que una máquina. Por lo tanto, hay ciertas situaciones en el mundo de los negocios en las que contratar a una persona para que realice una transcripción manual de un archivo de audio no es lo más eficaz.
Por ejemplo, a medida que los creadores de contenidos para las redes sociales crecen en alcance y popularidad, sus videos son inevitablemente compartidos con personas de otros países que no hablan el mismo idioma que ellos. Para comprender el contenido de estos videos es necesario transcribirlos primero. Sin embargo, debido a la frecuencia con la que los creadores de contenidos suben su trabajo a plataformas populares como YouTube y Twitter sería poco práctico que un solo transcriptor realizara todo el trabajo necesario para transcribir de forma eficiente los videos.
Por otro lado, el principal inconveniente de utilizar un programa de transcripción automática es que no se alcanza una precisión del 100%. Como las máquinas tienen dificultades para captar el contexto cuando analizan y transcriben archivos de audio, los programas de transcripción automática inevitablemente pasarán por alto ciertas palabras y frases. La inexactitud aumenta si las palabras y frases son particularmente complicadas o de naturaleza técnica. Por ejemplo, un programa de transcripción automática tendría dificultades para transcribir con precisión una conferencia de tres horas sobre anatomía humana, dictada en una universidad importante. Como probablemente esta conferencia contendría una gran cantidad de jerga y terminología académica, el programa cometería errores que tendrían que ser corregidos manualmente.
Un segundo inconveniente de la transcripción automática es que las máquinas tienen dificultades para reconocer el lenguaje hablado con acentos y los dialectos que difieren de las variantes aceptadas de un idioma. Además, como el inglés se considera difícil de descifrar en comparación con otros idiomas, hay algunas conversaciones en inglés en las que la transcripción automática nunca será una opción viable. Las investigaciones han revelado que los programas de reconocimiento del habla son mucho menos precisos cuando procesan variantes coloquiales y no reconocidas del inglés.
A continuación se muestra un ejemplo de transcripción automática utilizando el programa CaseGuard Studio.
Combinación de transcripción manual y automática
En muchos casos una combinación de estos dos métodos obtiene los mejores y más completos resultados. Un transcriptor humano, por ejemplo, podría optar por un programa de transcripción automática para comenzar el trabajo y utilizar sus conocimientos y experiencia para enmendar cualquier error y mejorar la calidad general de la obra final. En conclusión, la decisión de optar por la transcripción manual o la automática depende de las necesidades específicas de su empresa u organización.