登壇者の声が聞き取れないトークイベント動画の音質改善に失敗
- Sound Reformer / yamakaWA
- 2024年3月16日
- 読了時間: 6分
サウンドリフォーマーの山川@HSRです。
先日、定期的に音声コンテンツの整音をオーダーいただく方の紹介でトークイベントの音質改善依頼を受けました。
結論からすると時間をかけて丁寧な処理を行なったものの採用に至りませんでした。

会場の反響音と客席ノイズに埋もれたゲスト登壇者の声
動画素材(MP4)の収録内容は司会者がゲストを招き、各種活動にまつわるエピソードを伺うといったプログラム。画面では10人前後のお客様がよくある折りたたみ椅子に座ってイベントを観覧しているという内容です。
その内容を客席後方からスマートフォン(もしくはハンディカム)のみで撮影しているといった素材でした。
音質問題の概要
・壇上の2名はマイクを使って講演
・会場の反響がかなり強い
・客席のノイズ(所作による)が強め
・男性ゲストが話し出すとなぜかシャッター音や物音が増える
・男性の声がかなり小さい(滑舌が悪い)
司会者の女性ははっきりと大きな声でよく通るのですが、男性ゲスト(年配の方)の声が小さい上、会場の反響音や客席の所作ノイズ、シャッター音に埋もれてほとんど聞き取れないという問題の解決。
かなり難易度の高い音質改善作業でした。
マイクを使ったトークイベントはマイクからダイレクトのLINE録音が必須
自分はプロカメラマン撮影の映像エディターという一面もありますが、講演会やトークイベントなど、演者のお話がメイン収録内容の場合、マイクダイレクトのLINE録音が鉄則となっています。
演者がマイクを使って会場のスピーカーから声を出す場合、スピーカーと経由するミキサーなどから分岐した音声データをビデオカメラの入力や専用録音機に送って記録します。(ない場合は卓上などにマイクを立ててビデオカメラとは別に収録)
これはマイクダイレクト音声なので、響きも何もないのですが、このハッキリした音声を
会場内のマイクと混ぜてミックスするのがプロがトークイベントを収録するときの基本スタイルの一つ。
客を入れたトークイベント会場はそれぞれの所作やノイズも増え、広い会場ほど場内の響きも多くなります。そのため、客席後方から撮影するカメラマン位置で音声をプロが録音してもほとんど使い物になりません。
客席後方のカメラにガンマイクを装着することもありますが、あくまでもトラブル時のサブ音声素材としての役割。会場の音声は舞台に近い場所から客席側を背にして演者を狙う形で収録します。
素人のスマホ撮影だと起こる会場のノイズ問題

冒頭で説明した通り、素人さんが自らのビデオカメラやスマートフォンで撮影した場合、
集音マイクはビデオカメラ(スマホ)に内蔵されているマイクから音を拾います。そのため、客席後方から撮影した場合、演者の間に客席が入ります。
演者が話す言葉よりも客席の音をダイレクトで拾う形となり、静かに観覧している客でも椅子の軋みや資料をめくる音、カメラのシャッター音、撮影者自らの所作(やカメラの操作)による物音が壇上の演者よりもハッキリと強い音で録音されてしまいます。
それでも場内のスピーカーが大きな音で鳴っていればしっかり拾えるのですが、この事例素材ではゲスト演者の声量とマイクボリューム設定のバランスが劇的に良くなかったですね。
現場のお客さんも非常に聞きづらかったのではないかと想像しています。
私が取った改善編集方法
①全体的なエコー(残響音)の軽減
②男性ゲスト部分のボリューム処理
③ボリューム処理で持ち上がった客席内の強ノイズ(シャッター音や物音)除去
④人間の声部分の強調処理
⑤元音声とのミックス
年々、音声編集技術の進歩は著しいですが、未だ最も効果的な改善が難しいのが
残響音(エコー)の軽減。部屋でオンマイク録音した歌などの響きは軽減できても
大きな部屋や体育館などの広い場所での長い残響はやはり劇的な改善が困難です。
これらの繊細なオーディオ修正は記録方式にも大きく影響します。プロ用機材のリニア録音方式ならまだしも、記録時点から音声データに圧縮がかかるMP4などでは劇的な改善は困難です。除去レベルを上げるほど、音像が歪み曇ってしまう性質があるためやはりほんの少し軽減できる程度。
ゲストの声が小さく、滑舌も微妙なためゲスト男性のコメントのみボリューム処理。しかし、周囲の音も同時に大きくなってしまうため、耳障りなノイズがかえって持ち上がってしまいます。そのため、特に強い打撃音やシャッター音を中心に軽減。これらは発生都度に消し込み処理が発生してしまうため、数分のデータでもかなりの作業工数がかかります。
修正限界の結末
もちろん音源はカメラマイク1本のステレオトラック素材ですが、ここまで処理で声の成分は大きくなっても、ややカオスな仕上がりになってしまい使い物にはなりません。
そこで元音源を薄くMIXしてなんとか許容となるバランスを目指し、サンプルとして提示しました。「残響だらけで声が聞こえづらい元音源」に「声成分を強調した素材」を混ぜるという苦肉の策。このようなトークイベント的な事例でたまに使うテクニックの一つです。
コストパフォーマンスが担保しづらい素人収録素材

冒頭で記載した通り、この改善素材は見積と改善サンプルを提示するも不採用となりました。素人撮影の酷い音はそもそもの素材クオリティが乏しいことで、プロの素材を扱うよりも数倍手間がかかる上に、劇的な改善が難しいケースがほとんど。見積するとコストパフォーマンスがどうしても落ちてしまいます。
どれくらい手間がかかっているかは、特に音声編集詳しくない方に説明するのは困難です。「この程度の音でXXXXX円かよ〜」と感じられる方も多く、不採用のメール文章がやや冷ややかだたり、攻撃的に感じることがあります。(めっちゃ時間かけて限界までやってるんですけどね)
まとめ(世界クラスの整音エンジニアでも改善不能)
いかがでしたか。私は映画の整音作業では国際映画祭で「音のグレード」の最高評価であるベストサウンドデザイン受賞歴もありますが、素人さんの素材を手がける場合はやはり万能ではありません。(厳しい状態の音声を手がけている数は日本有数という自負あり)
最近のスマホはiPhoneを筆頭に素晴らしい技術で録音録画も簡単になり続けていますが、
一般の方がスマホで咄嗟に撮影した素材をプロクラスの音にするには限界があります。
初めからお披露目を前提に収録されたプロが収録した素材とは雲泥の差。文字起こしできるレベルの改善はできても間違ってもテレビ番組のようなクオリティにはなりづらいのが結論です。
トークイベントなどを素人が撮影(公開)する場合は、必ず演者の近くでスマートフォンのボイスメモ録音をしておくか、面倒でも各演者にピンマイクなどを用意しておくと良いでしょう。動画は簡単に撮影できても音声は結構見えない分、奥が深いのです。
音質改善サービスは運営しておりますが、万能ではありません。そんなこともあり、フリートライアルシステムを採用しているのです。そんな1面も知っていただきたく、執筆させていただきました。
最後までお読みいただきありがとうございました。
Comments