Classic Revival Gate -glänzend-

Revival Gate の中の人による、夢がいっぱいフリルいっぱいなメモ帳。話題はアニメや漫画やネットなど。

Maintext

2008-04-04 16:10
Re: Classic Revival Gate -glänzend- - Re 「ふれふれっぽんぽん!」 - Amaranth

「感じる」だけでは客観性に乏しいので、人の声の識別に使われるフォルマント(または声紋;Voice print; Spectrogram)の観点で調べてみました(いわゆるモノマネでもフォルマントには違いが出るといわれるので)。

Re: Classic Revival Gate -glänzend- - Re 「ふれふれっぽんぽん!」
あまりにも素晴らしい内容で正直に申し上げてただただ驚愕しました。こういう問題を誰か音そのものに詳しい方が解析してはくれないかといつもいつも願っていたのですが、それがこういう形で読むことが出来たのは大変嬉しく思っていますし、なによりも感謝に堪えません。元となった私の記事になんの興味も持たなかったという方にも是非読んでいただきたい内容です。もっと評価されるべき。
いままで私がやってきたこともそうでしたけれど、こういう際に問題を解決する方法は人間の感覚で判断されることがほとんどでした。 2ch のような場所で「この声は誰のものか」というような話題が出た際も、大抵は優秀で説得力のある書き込みの登場が第一にあって、それに対する支持で全てが決着することが一般的だったと思います。そういう「感覚的解決法」が当たり前のように説得力を持たせられてきたなかで、こういった「技術的鑑定法」の存在は実に貴重。もっとも、読めば読むほど短時間の声の識別の困難さを認識させられることになりましたが、それでもこういう鑑定は(同じように試してみた以上の真似はとても出来なさそうですが)興味深いものがあります。
[ この項目にコメントする / コメントを表示 / Tag: Audio ご愁傷さま二ノ宮くん / Permalink&Trackback URL ]
Comment1: SF (2008-05-01 13:30)
こんにちは。

改めて別の記事として、私(SF)の「鑑定」(というのは大げさですが)を取り上げていただき、ありがとうございます。件のページでは、思いつく範囲で、通日間はいろいろな角度から検証を試みましたが、検証すればするほど判断に困る要素が出てきてお手上げ状態となり、(誤字修正程度は別として)更新をほぼ停止していました。

ふと、「やはり無理」なのか「まだなにか調べる余地(ブレークスルー)があるのか」を直接専門家に訪ねてみればいいのではと思い立ち、無謀ながら、数日前に甲南大学の北村達也准教授にメールでアドバイスを仰ぎました。

非常に快く丁寧な回答を戴くことができましたが、要旨を端折って書くならば、今回の疑問点であるデータでの判断は、データの短さ/2人の声質の酷似/データへの楽器音の混入/声へのエフェクトなどの観点で、「なかなか難しい」そうです。

また、私がWebで提示している音声データが、MP3であること(しかもそのデータはMP2→WMV→MP3と不可逆圧縮を数度経ている)で、細かい議論は意味がないとの前置きで、

二人で歌っているということを知っているからかもしれないが、母音「あ」の時間波形で後者は雑音成分が多いように見える(楽器音やエフェクトの影響である可能性もあるが)。スペクトルの高周波数成分(約3kHz以上)のパワーが低いのはその影響かも。/前者は、波形に雑音成分が少なくスペクトルの高周波数領域まで倍音があるようにも見える。との比較結果を述べてくださいました。

更に、それを意識して聞き分けると、前者は透明感のある印象、後者は喉頭雑音が混ざっているように聞こえる。/ただし1人の人でも、喉頭の制御によってこのような声質の違いを生み出せるので、それを理由に2つの声が別人と結論づけることはできない点に注意とのご意見も戴きました。

上記に関しては、Page.7として、もう少し細かく記述しておきました。
また、今頃になってフルバージョン・データをのWaveSurferで解析していなかったことに気付き、Page.2に追加しました(Page.1やPage.3なども結果を受けて変更しました)。
これまでに記述した判断が、更に否定される事実が出てきて、余計にグダグダになりましたが…。

また、解析の方向性などに関しても回答を戴いたので、質の良いデータを使った検証は、余力があれば実施するかもしれませんが、私には荷が重いので全く未定です。実施した場合でも、今回のデータに関しては、明確な結論を導き出せそうにはない気がしますので、その面での情報追加は多分しないと思います。

でも伴奏成分の混入が少なく聞こえるフルバージョンならば、私の持つデータよりは明確な結果が得られる気もしており、ちょっと興味があります。

長く書きすぎました。Nameも毎回違うし… (^^;。
コメントフォーム W

  • 原則としてどのようなコメントも歓迎しますが、投稿内容が PD としての扱いを受けることに同意してください。著作権にかかる種々の権利を投稿者は一切主張できません。コピー/転載/編集/削除されても怒らないこと。
  • たまに送信に失敗します。コメントを送信される前に、念のためコメント本文をコピーしておくことを強く推奨します。
  • どうしても投稿できない場合、メールフォームで送っていただければ手動で追加できます。
  • えらく長くなる場合や本文とあまり関係がない内容の場合には、この記事の最下部にあるメールフォームをご利用ください。

Mailform

Name
Mail
URI
Text
注意
ここはコメント欄ではありません。また、フォームから送付されたメールには、通例的に記事中で返信させていただいています(つまり公開されます)。返信まで時間がかかることがあります。
送信

Search

Address/Information

A few rights reserved. Since 2005-10-03. Caren (TAKAEDA Caren) / Classic Revival Gate -glänzend-.