ここでは、OpenAIの「ChatGPT」を利用して、MP3などの音声ファイルの文字起こしが行える「音声データの文字化機能」をご説明します。
ChatGPTとは
ChatGPTはOpenAIによって訓練された大規模な自然言語処理モデルです。チャットボット、自動翻訳、機械学習など、様々なアプリケーションで使用されています。ChatGPTは、多数の文章を読み込んで、自然言語理解、文章生成、質問応答などのタスクを実行することができます。
※本機能を使用するにあたり、OpenAIとの利用契約は不要です。
音声データの文字化機能でどんなことが出来るようになるか
例として、下記の変換処理を使用可能になります。
①文字起こし
音声データから人間の言葉を抽出し、その内容を文字に起こします。
②文字起こしした文章の要約
「①文字起こし」で抽出した文章を、要約して箇条書きに変換します。
③通話内容の整形・要約
通話の録音データを文字起こしした際に有用な変換処理です。「この発言はどの登場人物のものか」をAIが類推して、文章内に記載出来ます。通話内で「お世話になっております、◯◯社の××と申します」のように名乗っている場合は、その名前が記載されます。
④その他、任意の変換処理
ChatGPTに送信する命令文を自由に変更することも可能です。
設定方法
本機能を利用するためには、「ファイル」「複数行テキスト」項目が必要です。
音声データの文字起こしだけでなく、文字起こしデータに何かしらの変換処理も実行したい場合は、それを保存するための「複数行テキスト」項目も必要です。
- 音声データを登録する「ファイル」項目(必須)
- 文字起こしデータを登録する「複数行テキスト」項目(必須)
- 文字起こしデータを変換処理したデータを登録する「複数行テキスト」項目(任意)
①音声データを保存するファイル項目を登録する(必須)
- 「ファイル」項目をドラッグ&ドロップする
- ファイルタイプは「音声」に設定する
- 登録ボタンを押して、変更内容を確定する
②文字起こしデータを保存する項目を登録する(必須)
- 「複数行テキスト」項目をドラッグ&ドロップする
- 登録ボタンを押して、変更内容を確定する
③変換処理された後の文字起こしデータを保存する項目を登録する(任意)
- 必要に応じて、「複数行テキスト」項目を追加する
- 登録ボタンを押して、変更内容を確定する
④変更内容を保存する
- 「変更を保存する」ボタンを押して、設定内容をアプリに反映する
⑤「外部サービス連携」から「音声データの文字化」機能の設定を開始する
- サイドメニューから「外部サービス連携」を選択する
- 音声データの文字化機能の「設定する」ボタンをクリックする
⑥各種設定を行う
- 「サービスの利用」にて、「利用する」を選択する
- 「ファイル項目」にて、文字起こししたい音声データを登録するファイル項目名を選択する
- 「変換データの保存場所」にて、文字起こしした文章を登録する複数行テキスト項目を選択する。この際、②と③はどちらも「メインレコードの項目」もしくは「同一サブレコードの項目」の必要がある。
- 「変換オプション」では、必要に応じて下記の中から利用したい機能を選択する。この際、③で指定した複数行テキストとは別に、もう一つ複数行テキストを用意しておく必要があります。
-
- 箇条書きで要約 … 文字起こしデータを要約し、箇条書きに変換します。
- 電話音声の整形 … 通話データを文字起こしした際、どの発言がどちらの人物の発言かを区別できるよう変換します。
- 電話音声の整形と要約 … 発言者を区別した上で、通話内容を要約します。
- 任意の指示による変換 … 文字起こしデータをどのように変換するか、自身で決められます。
文字化処理が実行される条件とタイミング
下記の条件を満たすレコード・サブレコードに対して、約10分に一度文字化処理を実行します。
- 音声データが登録されている
- 文字起こしデータが登録されていない
具体的な使用例① 〜会議の議事録アプリ〜
会議の議事録音声を保存しておくことで、面倒な「文字起こし」「要点まとめ」業務を自動化できます。
具体的な使用例② 〜顧客対応履歴の管理アプリ〜
こちらは、株式会社インターパークが提供しているIP電話サービスのSUBLINEをサスケWorksと連携して利用する方法です。通話履歴連携によってサブレコードに保存した音声データを文字起こし・要約することで、顧客対応の履歴を残す業務を自動化できます。
音声データの文字化料金とクレジットのご購入について
音声データの文字化機能は、アプリへの機能実装に際して追加料金はありませんが、 実行時に別途文字化料金が必要となります。
文字化料金はご利用に応じて料金が発生する従量課金制です。
1.起こした文字数
文字起こしデータ1,000byteごとに料金が発生します。
日本語は1文字3byteのため、約300文字ごとに料金が発生する計算です。
2.変換オプションを利用した場合、変換処理後の文字数
変換処理後のデータ1,000byteごとに料金が発生します。
日本語は1文字3byteのため、約300文字ごとに料金が発生する計算です。
変換オプションを利用した場合は、1と2の料金の合算となります。
ご利用いただくには、事前に「APIクレジット」をご購入いただく必要があり、 機能実行時に購入いただいたクレジットから減算されていく方式となっております。
(文字起こしは1,000byteごとに5クレジット、変換オプションは1,000byteごとに2クレジット減算)
購入数が増えるほど1,000byteあたりの単価が割安になりますので、まとめてご購入いただくと大変お得です。