【UiPath】音声をテキスト化する方法|RPAデモ

Speech to textをUipathで利用してみよう!
音源をアップロードすると、テキスト化したCSVファイルを出力する方法を紹介します。

動画解説

目次

  • 1.Speech to textサイトのご紹介
  • 2.ロボットの作業工程全容
  • 3.各工程解説

1.Speech to textサイトのご紹介

今回はSpeech to textというサイトを使います。

Speech to text

このサイトは、音源をテキストに変換してくれる便利サイトで、なかなかに精度が高いので驚かされます。AIの進歩はすごいですね。外部サイトと連携したロボットは開発できる幅が広がるので積極的に利用しましょう。

2.ロボットの作業工程全容

ロボットの作業工程全容
  • ①音源選択
  • ②サイトを開いて音源アップロード
  • ③音源再生終了後にデータスクレイピングで取得

3.各工程解説

①音源選択

音源選択

アクティビティ:Assignを挿入
左辺値:音源list_名 文字列型のリスト変数
右辺値:New list(of String) 新規でリストを作成する

アクティビティ:Foreach(コレクション)を挿入
コレクション:system.IO.Directory.GetFiles(“フォルダパス”)
指定したフォルダ以下のすべてのファイルのパスを取得するには、Directory.GetFilesメソッドを使用します。
要素:item 一時変数 取得したファイルパスを一つずつ格納します。
本体内容(繰り返し実行)

アクティビティ:Assignを挿入
左辺値:ファイル名 文字列型の配列変数
右辺値:item.Split(“\”c) 変数”item”を”\”で分割、配列にして格納

アクティビティ:AddtoCollection

アクティビティ:AddtoCollection

TypeArgument:追加するデータの型を選択
コレクション:音源list_名 先ほど新規作成したリスト変数に追加する。
項目:ファイル名(7) 配列変数”ファイル名”の7番目を追加する。

アクティビティ:Input Dialogを挿入
タイトル:”音源選択” ダブルクォーテーションでくくりましょう。
ラベル:”テキスト化する音源を選択してください。”
オプション:音源list_名.ToArray リスト変数”音源list_名”を配列型に変換
結果:音源 文字列型変数”音源”に格納

②サイトを開いて音源アップロード

アクティビティ:StartProcessを挿入

アクティビティ:StartProcessを挿入
ファイル名:”C:\Program Files (x86)\Google\Chrome\Application\chrome.exe”
引数:https://speech-to-text-demo.ng.bluemix.net/ 最初に開くURLを入力する。

音源アップロード

シーケンス”音源アップロード”はレコーディングによって生成したものです。
レコーディングによるアクティビティ生成は解説動画を参照してください。

③音源再生終了後にデータスクレイピングで取得

画像を探すBUTTON

音源再生中のマークと再生終了後のマークは違います。
上のマークは再生終了後です。
つまり、音源再生終了後に次のアクティビティに進むため、この画像を探すアクティビティがあります。

テキスト化したデータをデータスクレイピングで取得

テキスト化したデータをデータスクレイピングで取得します。
取得したデータはデータテーブル” ExtractDataTable”に自動出力されます。

CSVに書き込む

ファイルのパス:Left(音源, 音源.Length-4)+”.csv”

Left関数は文字列の左端から指定された文字数分の文字列を返します。
⇒文字列変数”音源”の左端から文字数-4個分を返します。
選択した音源のファイル名と同じ名前のCSVが出力されます。
データテーブル:ExtractDataTable

CSV書き込み結果

UiPathを利用すれば、これまで手作業で繰り返していた業務も自動化できるため、大変便利です。個人でも無料で導入できるソフトですので是非利用してみてください。楽しいRPAライフを…

RPAツール「UiPath」を使ったロボット作成ハウツー記事を紹介

2019.09.27

sweeep|請求書AI-OCR

請求書の会計処理を自動化します
請求書AI-OCR「sweeep」

面倒な請求書の会計処理をAIで自動化。100枚をたった3分で処理できます。月末に貯まった請求書を一掃しましょう。