Introducción.
Encantado de conocerte. Me llamo Yoshinaga y soy el desarrollador de Interview AI.
Soy responsable de desarrollo de productos en Antaa, una plataforma de servicios para médicos.
Normalmente, mi trabajo consiste en dar prioridad al desarrollo de productos y celebrar reuniones de desarrollo con los miembros de ingeniería, pero el otro día tuve la oportunidad de realizar una entrevista profesional a un profesor que utiliza Antaa (Antaa también tiene un proyecto profesional llamado “D35” y publica entrevistas con profesores). (Antaa también tiene un proyecto de carrera profesional llamado ‘D35’, que publica entrevistas con profesores).
El 9 de septiembre de 2024, durante aproximadamente una hora a partir de las 21:30 de la noche, entrevistamos al Dr. Masatsugu Hamaji, Jefe del Departamento de Cirugía Respiratoria del Hospital de la Universidad Médica de Nara.
Las entrevistas se realizaron en línea utilizando la función de grabación de Zoom. La entrevista en sí fue muy informativa y amena.
Pero luego tuve que transcribir la entrevista (unas 10.000 palabras durante una hora), revisarla para que tuviera un estilo conversacional natural y añadir títulos y subtítulos, así que empecé a pensar: “ Ojalá pudiera utilizar un servicio de transcripción existente y terminarla rápidamente, pero me pregunto”. Empecé a trabajar en él pensando: “Ojalá pueda terminarlo rápidamente utilizando un servicio de transcripción existente, pero dudo que me lleve mucho tiempo reescribirlo”.
Se pueden utilizar los servicios de transcripción existentes, pero…
Utilicé un servicio de transcripción lo antes posible, pero la transcripción tardó algún tiempo en generarse y, como estaba pensando y hablando durante la entrevista, también se transcribieron todas las palabras de relleno como “um”, “uh” y muchas otras.
Así que hubo que hacer un buen trabajo de revisión, como eliminar palabras de relleno, tener en cuenta el flujo general de la conversación y modificar significativamente el orden, lo que llevó un total de 2-3 horas.
El propio artículo de la entrevista se publicó sin problemas en tres partes -primera, segunda y tercera- dos días después, gracias a la rapidísima confirmación del Dr. Hamaji, que se encargó de la entrevista.
Pero el proceso de edición fue bastante difícil,
Me pregunto si podremos gestionar este proceso de edición. Entrevistar a los profesores, transcribirlos y convertirlos en artículos es algo que va a ocurrir en el futuro, e incluso ahora lo están haciendo otros empleados, y parece mucho trabajo.”
consideró que había llegado el momento de empezar a desarrollar la IA de las entrevistas (12 de septiembre de 2024).
Mirando atrás, solía pasarlo mal.
Haciendo memoria, cuando en 2016 lanzamos Melp, un servicio web de entrevistas para instituciones médicas, también entrevistábamos constantemente casos prácticos.
Artículos de casos prácticos Melp (más de 50)
Del mismo modo, concertaba una cita para una entrevista en línea, hacía una grabación de 30 minutos con Zoom de la entrevista (en aquella época, Zoom no estaba muy extendido, así que tenía que empezar explicando qué era Zoom), reproducía el audio y paraba, ya que aún no había herramientas de transcripción con gran precisión, Reproducía el audio, paraba, transcribía, volvía a reproducir el audio, y así sucesivamente, y tardaba aún más que antes.
En aquel momento, todavía estaba buscando una herramienta de transcripción práctica. Probé a utilizar la herramienta de transcripción de Google Docs, pero la precisión de la transcripción seguía siendo baja y pensé que me llevaría más tiempo corregirla, así que acabé reproduciendo el audio y transcribiéndolo.
Centrarse en el desarrollo de la IA para entrevistas.
Así pues, con la esperanza de resolver los problemas anteriores, Interview AI se ha centrado en los tres puntos siguientes para su desarrollo.
Tardé unas dos semanas en desarrollarlo, ya que también tenía mi trabajo diario y a Mia (un robot parlante con forma de gato que habla en dialecto), pero creo que personalmente conseguí algo satisfactorio que me gustaría utilizar yo mismo.
Si tengo la oportunidad de realizar entrevistas en el futuro, podría utilizar la IA de entrevistas para completar todo el proceso en menos de 15 minutos para una entrevista de una hora, al crear tres artículos de 3.000 palabras cada uno.
Si alguien tiene dificultades para transcribir entrevistas o diálogos, que pruebe a utilizarlo.