ここでは、OpenAIの「ChatGPT」を利用して、MP3などの音声ファイルの文字起こしが行える「音声データの文字化機能」をご説明します。
ChatGPTとは
ChatGPTはOpenAIによって訓練された大規模な自然言語処理モデルです。チャットボット、自動翻訳、機械学習など、様々なアプリケーションで使用されています。ChatGPTは、多数の文章を読み込んで、自然言語理解、文章生成、質問応答などのタスクを実行することができます。
※本機能を使用するにあたり、OpenAIとの利用契約は不要です。
音声データの文字化機能でどんなことが出来るようになるか
例として、下記の変換処理を使用可能になります。
①文字起こし
音声データから人間の言葉を抽出し、その内容を文字に起こします。
②文字起こしした文章の要約
「①文字起こし」で抽出した文章を、要約して箇条書きに変換します。
③通話内容の整形・要約
通話の録音データを文字起こしした際に有用な変換処理です。「この発言はどの登場人物のものか」をAIが類推して、文章内に記載出来ます。通話内で「お世話になっております、◯◯社の××と申します」のように名乗っている場合は、その名前が記載されます。
④その他、任意の変換処理
ChatGPTに送信する命令文を自由に変更することも可能です。
設定方法
本機能を利用するためには、「ファイル」「複数行テキスト」項目が必要です。
音声データの文字起こしだけでなく、文字起こしデータに何かしらの変換処理も実行したい場合は、それを保存するための「複数行テキスト」項目も必要です。
- 音声データを登録する「ファイル」項目(必須)
- 文字起こしデータを登録する「複数行テキスト」項目(必須)
- 文字起こしデータを変換処理したデータを登録する「複数行テキスト」項目(任意)
①音声データを保存するファイル項目を登録する(必須)
- 「ファイル」項目をドラッグ&ドロップする
- ファイルタイプは「音声」に設定する
- 登録ボタンを押して、変更内容を確定する
②文字起こしデータを保存する項目を登録する(必須)
- 「複数行テキスト」項目をドラッグ&ドロップする
- 登録ボタンを押して、変更内容を確定する
③変換処理された後の文字起こしデータを保存する項目を登録する(任意)
- 必要に応じて、「複数行テキスト」項目を追加する
- 登録ボタンを押して、変更内容を確定する
④変更内容を保存する
- 「変更を保存する」ボタンを押して、設定内容をアプリに反映する
⑤「外部サービス連携」から「音声データの文字化」機能の設定を開始する
- サイドメニューから「外部サービス連携」を選択する
- 音声データの文字化機能の「設定する」ボタンをクリックする
⑥各種設定を行う
- 「サービスの利用」にて、「利用する」を選択する
- 「ファイル項目」にて、文字起こししたい音声データを登録するファイル項目名を選択する
- 「変換データの保存場所」にて、文字起こしした文章を登録する複数行テキスト項目を選択する。この際、②と③はどちらも「メインレコードの項目」もしくは「同一サブレコードの項目」の必要がある。
- 「変換オプション」では、必要に応じて下記の中から利用したい機能を選択する。この際、③で指定した複数行テキストとは別に、もう一つ複数行テキストを用意しておく必要があります。
-
- 箇条書きで要約 … 文字起こしデータを要約し、箇条書きに変換します。
- 電話音声の整形 … 通話データを文字起こしした際、どの発言がどちらの人物の発言かを区別できるよう変換します。
- 電話音声の整形と要約 … 発言者を区別した上で、通話内容を要約します。
- 任意の指示による変換 … 文字起こしデータをどのように変換するか、自身で決められます。
文字化処理が実行される条件とタイミング
下記の条件を満たすレコード・サブレコードに対して、約10分に一度文字化処理を実行します。
- 音声データが登録されている
- 文字起こしデータが登録されていない
具体的な使用例① 〜会議の議事録アプリ〜
会議の議事録音声を保存しておくことで、面倒な「文字起こし」「要点まとめ」業務を自動化できます。
具体的な使用例② 〜顧客対応履歴の管理アプリ〜
こちらは、株式会社インターパークが提供しているIP電話サービスのSUBLINEをサスケWorksと連携して利用する方法です。通話履歴連携によってサブレコードに保存した音声データを文字起こし・要約することで、顧客対応の履歴を残す業務を自動化できます。
料金設定
音声データの文字化機能には2種類の課金体系がございます。
①音声データの文字起こし
「文字起こしデータの文字数」に対する従量課金が発生致します。
【料金設定】
文字起こしデータ1,000byteあたり5円(税別)の料金が発生します。
日本語は1文字が3byteのため、約300文字で税別5円の料金が発生する計算です。
②文字起こしデータの変換処理
「文字起こしデータの文字数」と「変換処理後のデータの文字数」の合計に対する従量課金が発生致します。
【料金設定】
文字データ1,000byteあたり2円(税別)の料金が発生します。
日本語は1文字が3byteのため、約300文字で税別2円の料金が発生する計算です。