¿Cómo transcribir un video automáticamente?
Aunque los transcriptores humanos siguen siendo la forma más utilizada para transcribir un archivo de audio, actualmente existen programas de edición de audio y video como CaseGuard Studio que realizan el mismo proceso automáticamente en cuestión de minutos. Además, estos programas permiten la transcripción en multitud de idiomas como el inglés, el español, el farsi, el hebreo, el japonés y treinta y uno más, lo que garantiza que los usuarios de todo el mundo puedan transcribir sus archivos de video y audio sin esfuerzo. Además, estos programas subrayan cualquier palabra que haya tenido problemas durante el proceso de transcripción y proporcionan un nivel de confianza para todas las palabras transcritas. De este modo, los usuarios pueden estar seguros de que obtuvieron el mayor nivel de precisión antes de exportar el proyecto.
Para comenzar el proceso de transcripción automática, primero hay que partir de un archivo de video o de audio adecuado y seleccionar el idioma en el que se desea transcribir. Como muestra utilizaremos la llamada telefónica de un ciudadano a un operador del 911, ya que dicha conversación es breve y en ella intervienen sólo dos personas. Después de activar la funcionalidad de transcripción automática, el software comienza el proceso de transcripción y muestra una barra de progreso en la que se visualiza el porcentaje del trabajo realizado hasta el momento.
Una vez que el software haya terminado de transcribir la conversación, el usuario tiene la oportunidad de revisar la conversación manualmente para corregir cualquier posible error. Las palabras que el sistema no haya detectado aparecerán subrayadas para que el usuario pueda reconocerlas fácilmente. Además, se proporciona un nivel de confianza para cada palabra de la transcripción, de modo que sea fácil identificar cuán preciso fue en general el proceso. Asimismo, hay varias opciones que permiten a los clientes personalizar aún más sus transcripciones, como cambiar el tamaño de la fuente, mostrar y ocultar las palabras con un bajo nivel de confianza y mostrar sólo las palabras completas.
Además del panel de transcripción, muchos programas de transcripción cuentan con una pestaña de análisis. Esta pestaña de análisis profundiza aún más en la calidad de la transcripción, proporcionando más información sobre la misma. Como muchos algoritmos de aprendizaje automático tienen dificultades para captar el contexto de las frases que se procesan, esta funcionalidad es muy útil no sólo para asegurar que el sistema transcribió con precisión las palabras, sino que las clasificó acorde al idioma en el que se emitieron. En el ejemplo de la llamada al 911 utilizado anteriormente, el ciudadano que llama se nombra Kent. Aunque, en teoría, Kent podría ser el nombre de una ciudad o municipio, el sistema hace un buen trabajo al reconocer que Kent es, de hecho, el nombre de una persona en el contexto de la conversación que se está transcribiendo.
Para dar otro ejemplo del alcance y la amplitud de estas funcionalidades analíticas, el software hace la misma categorización con los números. Quiere decir esto que los teléfonos, las direcciones y las cantidades pueden contener los mismos números, aunque para tres usos completamente diferentes. En el ejemplo de la llamada al 911, el software es capaz de recoger la dirección de la persona que llama, el número de teléfono y las cantidades de artículos, distinguiéndolos como tres categorías distintas. También existe la opción de grabar los subtítulos en un archivo para que la transcripción pueda mostrarse junto con el video en forma de subtítulos.
La transcripción automática reduce en gran medida el tiempo y los costes que tradicionalmente se han asociado a la transcripción manual. En general, la transcripción automática resulta más rápida, barata y eficaz que realizar el trabajo de forma manual. En los casos en los que la transcripción debe ser 100% precisa, como la realizada para un tribunal, se puede contratar a un transcriptor humano para que corrija los errores de la transcripción automática y garantice un trabajo con la mayor calidad posible. De este modo, los consumidores pueden ahorrar tiempo, dinero y esfuerzo en cualquier función u operación empresarial.
Ejemplo de transcripción automática utilizando un software de edición de video con inteligencia artificial
Vea el siguiente video para conocer cómo el uso del software de edición de video con inteligencia artificial ayuda a transcribir automáticamente y con precisión el complejo audio de una audiencia del Comité del Senado con múltiples oradores, incluido Mark Zuckerberg. A continuación, vea lo fácil que es generar una transcripción imprimible con marcas de tiempo e identificadores de oradores.