Zoom のリアルタイム字幕ツールをつくった。雑なやつ。

2020年6月16日

はじめに

Zoomにリアルタイムに字幕を付ける機能があります。
以外と簡単にツールを作成できるのではご自由に。

いろいろここに置いときます。
https://github.com/jkudo/zoomcaption

Zoomに字幕を付ける方法は下記を参考にしています。
https://support.zoom.us/hc/en-us/articles/115002212983

基本は表示したい文字列をBODYとしてPOSTするだけです。
あと、POSTするときに、lang、seqを付けます。
langは日本語（jp-JP）を指定します。
seqは送信するごとに1増やしていきます。

Zoom側のルールはこの2つだけです。

事前にZoomのWeb設定画面から字幕を有効にしておきます。

アプリを立ち上げます。
zoomcaption\bin\x64\Debug あたりにexeあります。

Zoomを起動してAPIトークンをコピーします。

貼り付けます。

キーをコピーします。

貼り付けます。

リージョンとスピーカーの言語を指定します。

入力が完了後、マイクにしゃべると文字起こしが始まります。

実際にZoomに字幕が最初に表示されるまではタイムラグがあります。
字幕が利用できます。と表示されると問題なく動作しています。

あとはサブタイトルを表示したり、トランスクリプトの画面を開き確認します。

以上です。

Zoomの字幕がちょっと微妙な感じでしか動作しないので動いたり動かなかったり。
表示されない場合は暫くマイクにしゃべり続けると表示されます。

勉強がてら作った簡単なアプリなので次回がもうちょっとまともなの作成します。