開発への思い

はじめに

はじめまして。インタビューAIを開発している吉永と申します。

医師向けプラットフォームサービス『Antaa』でプロダクト開発責任者をしています。

普段は、プロダクト開発の優先順位を決めたり、エンジニアメンバーと開発ミーティングをしたりなどが主な仕事なのですが、先日とあるきっかけで、Antaaをご利用の先生にキャリアインタビューを行うことがありました(Antaaでは『D35』というキャリア事業も行っており、先生方のインタビュー記事を掲載しています)。

2024年9月9日の夜21:30から1時間ほど、奈良県立医科大学附属病院の呼吸器外科の診療科長をされていらっしゃる濱路 政嗣先生にインタビューを行わせていただきました。

インタビューはオンラインでZoomの録画機能機能を使って行いました。インタビュー自体は、大変勉強になりましたし、楽しかったのです。

ただ、その後、インタビュー内容(1時間なので大体10,000文字)を文字起こしして、かつ自然な会話形式になるように修正して、タイトルと小見出しをつける作業がありましたので、「既存な文字起こしサービスを使って、早く終われば良いのだけど、どうかなぁ?結構リライトに時間かかるかもなぁ」と思いながらとりかかり始めました。

既存の文字起こしサービスを使うも…

早速、文字起こしサービスを使ったのですが、文字起こしが生成されるまでにいくらか時間がかかるのと、インタビュー中は考えながら話すので、「あのー」「えーっと」などといったフィラーワードが多く入ったりするのも全て文字起こしされていました。

なので、フィラーワードを削除したり、全体の会話の流れを加味して、大幅に順序を修正したりなどと結構修正作業が発生してしまい、合計で2-3時間ほどかかってしまいました。

インタビュー記事自体は、インタビューを引き受けてくださった濱路先生のご確認がとても早かったこともあり、無事2日後には前編・中編・後編の3部構成でリリースすることができました。

ただ、編集作業が結構大変で、

「この編集作業なんとかならないかなぁ。先生方へインタビューを行い、それを文字起こしして記事化していくのは今後も発生しそうだし、現に今でも他の社員も行っていて大変そうだし。。。」

と感じたのがきっかけで、インタビューAIの開発に取り掛かり始めました(2024年9月12日)。

思い返せば昔も苦労していた。。

思い返せば、2016年に医療機関向けのWEB問診サービス「メルプ」 を立ち上げた時も、導入事例のインタビューをひたすら行っていました。

メルプ導入事例の記事(50以上)

同じようにオンラインでインタビューのアポを取って、30分ほどZoom録画でインタビューを行い(当時はZoomも浸透していなかったので、Zoomとは何かを説明するところからでした)、まだ文字起こしツールで精度が高いものがなかったので、音声を再生して止めて、書き写して、また音声を再生してというのを繰り返して今までよりもさらに時間がかかっていました。

当時も「便利な文字起こしツールがないかな?」と色々と模索をしていて、Googleドキュメントの文字起こしツールを使ってみたりしたのですが、文字起こしの精度がまだ低く、修正する方が時間かかると思い、結局音声を再生して書き写してという作業になっていました。

インタビューAIの開発で注力した点

というわけで、上記のような課題を解決できればと思い、インタビューAIでは次の3点に注力して開発しました。

  • 文字起こしにかかる時間を短くする
    1時間の音声で文字起こし時間15秒までの短縮に成功
  • フィラーワードなど修正にかかる作業を短くする
    自然な会話形式になるようにAIで自動修正
  • タイトルやコミ出しとその挿入場所を考える手間を短くする
    AIでタイトルとコミ出しを自動生成し、自動挿入

本業やミーア(方言を話すおしゃべり猫型ロボット)もある中での開発でしたので、開発に2週間ほどかかりましたが、個人的には自分が使いたくなるような満足いくものができたのではと思います。

今後もしインタビューを行う機会があったら、インタビューAIを使って、1時間のインタビューの場合で、1記事3000文字×3記事作成する場合には全部で15分以内で作業が終わるようにできるのではと思います。

インタビューや対談の文字起こしに、課題を感じていらっしゃる方がいましたら、ぜひ使ってみてください。

タイトルとURLをコピーしました