Überlegungen zur Entwicklung

Einleitung.
Bestehende Transkriptionsdienste können genutzt werden, aber…
Wenn ich zurückblicke, hatte ich früher eine schwere Zeit.
Schwerpunkt bei der Entwicklung von Interview-KI.

Einleitung.

Schön, Sie kennenzulernen. Mein Name ist Yoshinaga und ich bin der Entwickler der Interview-KI.

Ich bin verantwortlich für die Produktentwicklung bei Antaa, einem Plattformdienst für Ärzte.

Normalerweise bestehen meine Hauptaufgaben darin, Prioritäten für die Produktentwicklung zu setzen und Entwicklungssitzungen mit den Mitgliedern der Technikabteilung abzuhalten, aber neulich hatte ich die Gelegenheit, ein Karriere-Interview mit einem Lehrer zu führen, der Antaa nutzt (Antaa betreibt auch ein Karriere-Unternehmen namens ‚D35‘ und veröffentlicht Interviews mit Lehrern). (Antaa hat auch ein Karriereprojekt mit dem Namen ‚D35‘, in dem Interviews mit Lehrern veröffentlicht werden).

https://career.antaa.jp/journal

Am 9. September 2024 interviewten wir ab 21.30 Uhr etwa eine Stunde lang Dr. Masatsugu Hamaji, den Leiter der Abteilung für Atmungschirurgie am Nara Medical University Hospital.

Die Interviews wurden online mit der Zoom-Aufnahmefunktion durchgeführt. Das Interview selbst war sehr informativ und angenehm.

Aber dann musste ich das Interview transkribieren (etwa 10.000 Wörter für eine Stunde), es in einem natürlichen Gesprächsstil überarbeiten und Überschriften und Zwischenüberschriften hinzufügen, und ich dachte: „Ich wünschte, ich könnte einen bestehenden Transkriptionsdienst nutzen und es schnell fertigstellen, aber ich frage mich. Ich begann mit der Arbeit und dachte: „Ich hoffe, dass ich es mit einem bestehenden Transkriptionsdienst schnell fertigstellen kann, aber ich bezweifle, dass das Umschreiben viel Zeit in Anspruch nehmen wird.

Bestehende Transkriptionsdienste können genutzt werden, aber…

Ich habe so schnell wie möglich einen Transkriptionsdienst in Anspruch genommen, aber es dauerte einige Zeit, bis die Transkription erstellt war, und da ich während des Interviews dachte und sprach, wurden auch alle Füllwörter wie „äh“, „äh“ und viele andere transkribiert.

Es war also einiges an Überarbeitungsarbeit zu leisten, wie z. B. das Entfernen von Füllwörtern, die Berücksichtigung des allgemeinen Gesprächsflusses und eine erhebliche Änderung der Reihenfolge, was insgesamt 2-3 Stunden in Anspruch nahm.

Der Interview-Artikel selbst wurde dank der sehr schnellen Bestätigung von Dr. Hamaji, der das Interview führte, zwei Tage später in drei Teilen – Teil eins, Teil zwei und Teil drei – sicher veröffentlicht.

https://career.antaa.jp/archives/1265

https://career.antaa.jp/archives/1275

https://career.antaa.jp/archives/1277

Aber der Bearbeitungsprozess war ziemlich schwierig,

Ich frage mich, ob wir diesen Redaktionsprozess bewältigen können. Interviews mit Lehrern zu führen, sie zu transkribieren und in Artikel umzuwandeln, wird in Zukunft passieren, und schon jetzt machen das andere Mitarbeiter, und es scheint eine Menge Arbeit zu sein“.

war der Meinung, dass es an der Zeit sei, mit der Entwicklung von KI für Interviews zu beginnen (12. September 2024).

Wenn ich zurückblicke, hatte ich früher eine schwere Zeit.

Als wir 2016 Melp, einen webbasierten Interview-Service für medizinische Einrichtungen, auf den Markt brachten, führten wir auch ständig Interviews für Fallstudien durch.

Melp-Fallstudienartikel (mehr als 50)

https://monshin.melp.life/users

Auf die gleiche Weise vereinbarte ich online einen Termin für ein Interview, machte eine 30-minütige Zoom-Aufnahme des Interviews (damals war Zoom noch nicht weit verbreitet, so dass ich zunächst erklären musste, was Zoom ist), spielte den Ton ab und stoppte, da es noch keine Transkriptionswerkzeuge mit hoher Genauigkeit gab, Ich musste den Ton abspielen, anhalten, transkribieren, den Ton erneut abspielen und den Vorgang wiederholen, was noch länger dauerte als zuvor.

Damals war ich noch auf der Suche nach einem praktischen Transkriptionstool. Ich habe versucht, das Google Docs-Transkriptionstool zu verwenden, aber die Genauigkeit der Transkription war immer noch gering und ich dachte, es würde mehr Zeit in Anspruch nehmen, sie zu korrigieren, also habe ich das Audio abgespielt und es transkribiert.

Schwerpunkt bei der Entwicklung von Interview-KI.

In der Hoffnung, die oben genannten Probleme zu lösen, hat sich Interview AI auf die folgenden drei Entwicklungsbereiche konzentriert.

Verringerung der für die Transkription benötigten Zeit
→Erfolgreiche Reduzierung der Transkriptionszeit auf 15 Sekunden für eine Stunde Audio.
Verkürzung des Arbeitsaufwands für die Korrektur von Füllwörtern usw.
→Æ Automatische Korrektur durch KI, um einen natürlichen Gesprächsstil zu erreichen.
Verkürzen Sie den Zeit- und Arbeitsaufwand, der erforderlich ist, um über Titel und Komidien und deren Einfügepunkte nachzudenken.
→AI generiert automatisch Titel und Komidien und fügt diese automatisch ein.

Ich habe etwa zwei Wochen für die Entwicklung gebraucht, da ich nebenbei noch meinen Job und Mia (ein sprechender katzenförmiger Roboter, der Dialekt spricht) hatte , aber ich denke, ich habe etwas erreicht, das mich persönlich zufrieden stellt und das ich auch selbst benutzen würde.

Sollte ich in Zukunft die Möglichkeit haben, Interviews zu führen, könnte ich mit Hilfe von Interview-KI den gesamten Prozess in weniger als 15 Minuten für ein einstündiges Interview abschließen und dabei drei Artikel mit jeweils 3.000 Wörtern erstellen.

Wenn jemand Probleme mit der Transkription von Interviews oder Dialogen hat, versuchen Sie es bitte mit diesem Tool.

https://www.interview-ai.site/