文字起こし支援アプリちゃん
最終更新: 2022/10/22

内容:
　音声データを手作業で書き起こししたいことがあります。そういうときに使えるツールです。自動文字起こしツールではありません。
　書き起こしと、書き起こしたデータの自動レイアウトを支援するためのツールです。元々は自分用と、自分が学生時代に仕事していた事業所で使うために作ったのですが、要望があったので、一般化したバージョンを派生版として作成しました。

動作環境:
　動作にはWindowsを搭載したコンピュータが必要です。BootcampやVmwareなど、仮想環境での動作は未確認であり、無保証です。

ツール群の構成:
　今のところ、以下のツールがあります。
・書き起こしアプリちゃん -- 書き起こしを支援します。
・レイアウトアプリちゃん -- 書き起こしアプリちゃんで作った中間データをレイアウトして、テキストファイルに書き出すことができます。

書き起こしアプリちゃん:
　起動すると、ファイルを選ぶ画面が出てくるので、案件のファイルを選択してください。そうすると書き起こし画面になり、音声データの再生が始まります。なお、画面は目視で確認していないので、枠が小さかったりとか色々するかもしれませんがまぁそこはご愛敬ということで。っていうか、発言欄2000文字まで書けるのに、明らかに1行分しかなくてわくが小さすぎるのは分かってる。そのうち直すかも。
　現在搭載している機能は以下の通りです。
発言の書き込み -- 発言の入力欄に文字を入力し、コントロール+エンターを押すと、入力した内容を原稿に書き込みます。
入力開始時の自動ストップ -- 音声データの再生中、文字を入力し始めると、自動的に音声を一時停止します。再開するには、エンターキーを押します。
自動的なタイムスタンプの付与 -- 発言が書き込まれた時間を、タイムスタンプとして自動的に記録します。しかし、記録のタイミングはあくまでも「発言の登録時」ですので、正確なタイムではありません。どうするか考え中です。考え中なので、現段階では、レイアウトアプリちゃんは自動的に付与されたタイムスタンプの情報を無視します。
手動でのタイムスタンプの付与 -- ctrl+Tで、現在再生中の位置をタイムスタンプとして、原稿の最後に書き込みます。タイムスタンプを書き込んだ後、入力エリアのカーソルを自動的に最後尾に移動させます。
キー操作による話者の分類と振り分け -- コントロール+数字キーの1から9のキーを押すと、次に登録する発言に対して、話者を設定できます。現段階では、話者の名前は登録されません。あくまで、入力の段階で話者を番号で区別するために使います。これを設定しておくと、レイアウトアプリちゃんがあとで拾ってくれて、「1番として設定した話者はだれですか？」という感じで、後から聞いてきてくれるようになっています。話者を設定すると、小さなクリック音が鳴ります。
音声データの巻き戻し/早送り -- ボタンを押すと、いろんな基準で音声データを送ったり戻したりできます。なお、ボタンをキーボードで押すには、エンターではなくスペースを使ってください。エンターでも押せるようにできるんだけど、ちょっとめんどかったからまだやってないです。
音声データのリアルタイム加工 -- 全体の音量を増幅したり、左右の音量バランスを調整したり、再生速度を変化させたりできます。なお、音量については、音が割れようが何しようが問答無用でいくらでも大きくできるので、耳が壊れない程度で使ってください。
おこし状況の確認 -- 自分が今どのぐらい書き起こしたかを、画面表示&音声読み上げで確認することもできます。状況を確認するには、ctrl+shift+Tを押します。
定期的な自動バックアップ -- 原稿に書き込むたびにバックアップを作成します。なので、途中でPCが落ちたりしても、データが失われることはありません。
作業終了時の自動保存 -- ソフトをバツボタンやらなんやらで閉じたとき、作業終了として、自動的に原稿を更新してくれます。更新したデータは、internalフォルダの中に中間形式で保存されています。
前回終了位置からの復帰 -- これまでに読み込んだ案件を選択すると、前回終了した位置を覚えているので、自動的にそこまで移動してくれます。また、音量や再生速度の設定状態も保存されます。なお、progressフォルダの中にわけわからんファイルがいっぱいありますが、これをむやみやたらに消すと、前回どこまでやったかの記録がぶっ飛ぶかもしれないのでご注意ください。
保存前に書き込んだ発言の確認・修正 -- 登録した発言をリスト形式で閲覧できます。過去に書き起こした発言を修正することもできます。


以下のショートカットキーを利用できます。
alt+左矢印: 3秒戻ります。
alt+右矢印: 3秒進みます。
ctrl+t: 現在の位置に、タイムスタンプを挿入します。なお、カーソル位置ではなく、入力の一番最後に挿入されますので、ご注意ください。
ctrl+shift+t: 現在の音源上の時間と、音源全体の時間を表示します。
ctrl+j: 「指定位置へ」ボタンの機能を実行します。時間/分/秒などを入力して、直接ジャンプできます。
指定時間への移動の際には、以下のようなパターンの入力を受け付けます。
01:03:20 -- 1時間3分20秒。0は自動的に無視される。
3:5 -- 0時間3分5秒。0はなくてもいい。数字が2つの場合は、0時間、分:秒として扱う。
5 -- 5分0秒。数字が1個だけの場合は、分だけが入力状態になり、他は0になる。
80 -- 1時間20分0秒。60を超えた数字を入力してもいい。ないと思うけど、00:50:1227とかやってもちゃんと計算してくれる。
発言一覧のリストボックス内の該当の業にフォーカスを当てた状態でctrl+eを推す：その行を編集状態にする。登録されていた文字が発言の入力欄に入りますので、あとは通常通り内容・話者共に変更可能です。なお、編集中の行に関しては「編集中」という表示・読み上げで案内されます。
編集状態で再度ctrl+eを押すと編集を取り消して通常の発言入力モードに移行、編集中の行以外の場所でctrl+eを押すと、その行が新しく編集状態になります。

レイアウトアプリちゃん:
　書き起こしアプリちゃんで作った中間データを読み込んで、いい感じにレイアウトしたテキストデータを作成するツールです。
　起動すると、ファイルを選ぶ画面が出てくるので、internalフォルダの中に入っている案件の中間データ(TSVファイル)を選択してください。あとは、聞かれたことにへーへー答えていけば、こまかいことは勝手にやってくれます。
　現在搭載している機能は以下の通りです。
自動レイアウト -- いくつかの質問に答えていくことで、自動で原稿をレイアウトします。
話者と名前の関連付け -- 書き起こしアプリちゃんで番号別にしていた話者の登録データを探し、見つかったそれぞれの番号に対して名前を聞いてきます。入力すると、その番号と話者の実際の名前を関連付けし、原稿に反映します。
テキストデータの出力 -- レイアウトした原稿のデータを、テキスト形式で保存します。

注意:
releaseフォルダ、internalフォルダ、logフォルダには、案件に関わる文字データが保存され続けます。ツール側からは、一切の削除操作を行いません。案件が亡くなったときに中身を消去するなど、秘密保持契約およびデータの取り扱いに関する各種規則に違反しないよう、ご自身の責任においてメンテナンスをしてください。


更新履歴:
※更新履歴に付記してある記号は、K/書き起こしアプリちゃん、L/レイアウトアプリちゃん。A/追加,F/修正、C/変更。
2022/10/22
general editionにしました。差分は以下。
LC: wordファイルへの出力機能を消しました。
LC: 担当者名とコメントを付ける機能を消しました。
KF: 話者をセットしたときのクリック音が、本当は鳴らしているはずなんだけどなぜか鳴らなくなっていたので、再生方法を変更して、ちゃんと鳴るようにしました。

最後に:
なんか、思ったよりも使ってもらっていていい感じです。general editionができるぐらいだからね。なんかあったら要望などくださいー。さよならばいばいぴっぴかちゅ。
