Descript te permite editar audio y vídeo a partir de su transcripción a texto

Descript es una herramienta, un servicio, que permite editar audio y vídeo como si de un texto se tratase. A través de una transcripción previa, todo cambio que realices en dicho texto se verá reflejado en la línea de temporal donde está tu material multimedia. Y claro, es mucho más cómodo esto a tener que escuchar una y otra vez el mismo audio.

Descript, cómo editar audio y vídeo como si de texto se tratase

edicion audio video

El trabajo que se está realizando con todo el tema del reconocimiento de voz es impresionante. Desde el uso en la interacción con asistentes virtuales hasta herramientas como esta que te mostramos hoy: Descript.

Si has editado vídeo o audio sabrás que es un proceso lento, tienes que escuchar una y otra vez el material para revisar que todo cuadra. Aún así, lo peor es cuando te dicen que borres cualquier palabra mal sonante que pueda haber, alguna declaración, etc. En en esos momentos es cuando puedes aburrirte mucho más, además del tiempo extra que conlleva.

Pues bien, puede que todo eso cambie de cara al futuro con aplicaciones o servicios como Descript. Esta propuesta la descubrí hace unos días, pero no fue hasta ahora cuando decidí probarla y ver qué tal funciona. Aún así, antes te muestro qué ofrece.

Edicion en Descript

La base del funcionamiento de Descript es muy sencillo. Tú subes un archivo de audio, vídeo o realizas una grabación directamente con las opciones que ofrece. A continuación, el servicio analiza el material multimedia para llevar a cabo una transcripción del contenido a texto, el cual es la clave y queda asociado vía un código de tiempo al material original.

Con dicha transcripción, con la asignación de cada fragmento de audio y vídeo a la palabra o frases, empieza la magia. En la parte del texto podrás hacer cualquier modificación y se verá reflejada en la línea temporal. Es decir, si borras una palabras estarás borrando ese fragmento, si la desplazas también desplaza en el timeline.

Por tanto, si quieres buscar alguna declaración, palabra o cualquier otra cosa en texto podrás hacerlo más rápidamente que volviendo a escuchar todo el material. Lo que implica que eliminarlas también sería una tarea mucho más rápida y sencilla. Así que imagina qué podría signifcar de cara al futuro de la edición de podcasts, vídeos, entrevistas o cualquier otro tipo de contenido multimedia.

A pesar de lo llamativo y espectacular, también hay que decir que no es perfecto. Si usas material en inglés el porcentaje de acierto es muy alto, pero con otros idiomas como el español la cosa cambia. Puede que identifique bien las primeras palabras de cada frase, pero con sentencias largas le cuesta y acaba siendo inusable.

No obstante, si logra repercusión, si mejora e incluso inspira a otras compañías podríamos estar frente a una importante mejora de cara a la edición de contenido multimedia. Y no sólo eso, también para hacer cosas en las que ya sabemos que se están trabajando, como la transcripción de podcasts para mejorar las búsquedas en internet o insertar publicidad adecuada según el contenido. También para generar de forma automática subtítulos en lo vídeos que ves en YouTube.

Si te llama la atención y apetece probar Descript puedes hacerlo, de forma gratuita permiten hasta 3 horas de transcripciones. Luego, lógicamente, habrá que pagar (10 dólares por mes para individual y 15 dólares para equipos) para tener más tiempo, crear nuevos proyectos, etc.