[[ノート/ノート]]~
訪問者 &counter();       最終更新 &lastmod();~

[[一般化調和解析(1)>ノート/一般化調和解析(1)]]

*一般化調和解析による音階抽出 (2) [#h2058255]

**ピアノ音源の音階抽出結果3 和音の場合 [#i5d1ac99]
サンプリング周波数 44100Hz (帯域 22050Hz)~
フレーム標本点数 1024点、 フレーム長 23mS ~

RWCの音源サンプルからきらきら星の先頭部分を、1拍ずつに手で分解したものを、
一般化調和解析で分析してみる。~
表内の項目は、周波数Hz(音程), パワー(log) である。

kira1.wav (C5, 523.25Hz + C3, 130.81Hz)
|frame |1         |2         |3         |4         |5         |6         |
|成分1 |BGCOLOR(LightBlue):524Hz(C5), 19.074 |BGCOLOR(LightBlue):523Hz(C5), 19.114 |BGCOLOR(LightBlue):522Hz(C5), 18.906 |BGCOLOR(LightBlue):522Hz(C5), 18.656 |BGCOLOR(LightBlue):522Hz(C5), 18.376 |BGCOLOR(LightBlue):522Hz(C5), 18.114 |
|成分2 |1046Hz(C6), 17.246 |1045Hz(C6), 16.895 |BGCOLOR(Pink):129Hz(C3), 16.791 |BGCOLOR(Pink):130Hz(C3), 16.833 |BGCOLOR(Pink):131Hz(C3), 16.585 |BGCOLOR(Pink):130Hz(C3), 16.325 |
|成分3 |1570Hz(G6), 16.322 |BGCOLOR(Pink):134Hz(C3), 16.31 |1045Hz(C6), 16.546 |1045Hz(C6), 16.304 |1046Hz(C6), 16.093 |1047Hz(C6), 15.89 |
|成分4 |      |1574Hz(G6), 16.143 |      |      |264Hz(C4), 15.69 |264Hz(C4), 15.679 |

kira2.wav (C5, 523.25Hz + C4, 261.62Hz)
|frame|1         |2         |3         |4         |5         |6         |
|成分1 |BGCOLOR(LightBlue):522Hz(C5), 19.556 |BGCOLOR(LightBlue):522Hz(C5), 19.247 |BGCOLOR(LightBlue):520Hz(C5), 19.161 |BGCOLOR(LightBlue):521Hz(C5), 18.883 |BGCOLOR(LightBlue):521Hz(C5), 18.656 |BGCOLOR(LightBlue):523Hz(C5), 18.416 |
|成分2 |1046Hz(C6), 17.792 |BGCOLOR(Pink):261Hz(C4), 18.039 |BGCOLOR(Pink):261Hz(C4), 18.348 |BGCOLOR(Pink):263Hz(C4), 17.933 |BGCOLOR(Pink):262Hz(C4), 17.866 |BGCOLOR(Pink):261Hz(C4), 17.846 |
|成分3 |1571Hz(G6), 16.858 |1044Hz(C6), 17.452 |1046Hz(C6), 17.194 |1047Hz(C6),17.025 |1048Hz(C6), 16.822 |1048Hz(C6), 16.597 |
|成分4 |      |1572Hz(G6), 16.491 |      |      |      |      |

kira3.wav (G5, 783.99Hz + E4, 329.62Hz)
|frame|1         |2         |3         |4         |5         |6         |
|成分1 |784Hz(G5), 18.714 |786Hz(G5), 18.595 |785Hz(G5), 18.495 |785Hz(G5), 18.303 |784Hz(G5), 18.221 |783Hz(G5), 18.066 |
|成分2 |327Hz(E4), 17.523 |330Hz(E4), 17.389 |330Hz(E4), 17.118 |330Hz(E4), 16.998 |329Hz(E4), 17.012 |329Hz(E4), 16.834 |
|成分3 |1572Hz(G6), 17.181 |1570Hz(G6), 16.931 |1569Hz(G6), 16.915 |1569Hz(G6),16.885 |1571Hz(G6), 16.794 |1572Hz(G6), 16.521 |
|成分4 |      |661Hz(E5), 15.92 |661Hz(E5), 15.556 |658Hz(E5), 15.548 |657Hz(E5), 15.541 |658Hz(E5), 15.585 |


kira4.wav (G5, 783.99Hz + C4, 261.62Hz)
|frame|1         |2         |3         |4         |5         |6         |
|成分1 |786Hz(G5), 19.031 |785Hz(G5), 18.858 |784Hz(G5), 18.748 |784Hz(G5), 18.569 |784Hz(G5), 18.395 |784Hz(G5), 18.281 |
|成分2 |261Hz(C4), 17.524 |258Hz(C4), 17.558 |264Hz(C4), 17.397 |263Hz(C4), 17.08 |263Hz(C4), 17.155 |262Hz(C4), 17.05 |
|成分3 |1571Hz(G6), 17.15 |1572Hz(G6), 17.068 |1571Hz(G6), 16.971 |1570Hz(G6), 16.76 |1569Hz(G6), 16.524 |1569Hz(G6), 16.29 |
|成分4 |      |      |523Hz(C5), 15.871 |525Hz(C5), 15.589 |522Hz(C5), 15.648 |521Hz(C5), 15.619 |

kira5.wav (A5, 880.00Hz + F4, 349.22Hz)
|frame|1         |2         |3         |4         |5         |6         |
|成分1 |880Hz(A5), 18.821 |880Hz(A5), 18.782 |881Hz(A5), 18.644 |880Hz(A5), 18.44 |880Hz(A5), 18.248 |879Hz(A5), 18.032 |
|成分2 |1765Hz(A6), 17.386 |346Hz(F4), 17.508 |351Hz(F4), 17.031 |350Hz(F4), 16.949 |1761Hz(A6), 17.076 |348Hz(F4), 16.728 |
|成分3 |782Hz(G5), 16.879 |1762Hz(A6), 17.118 |1765Hz(A6), 16.696 |1763Hz(A6), 16.864 |348Hz(F4), 16.814 |1764Hz(A6), 16.297 |
|成分4 |336Hz(E4), 16.402 |782Hz(G5), 16.302 |782Hz(G5), 15.846 |703Hz(F5), 15.456 |701Hz(F5), 15.543 |701Hz(F5), 15.462 |


kira6.wav (A5, 880.00Hz + C4, 261.62Hz)
|frame|1         |2         |3         |4         |5         |6         |
|成分1 |884Hz(A5), 18.883 |881Hz(A5), 18.702 |880Hz(A5), 18.583 |880Hz(A5), 18.398 |879Hz(A5), 18.129 |879Hz(A5), 18.049 |
|成分2 |1764Hz(A6), 16.949 |259Hz(C4), 17.461 |260Hz(C4), 17.202 |262Hz(C4), 16.873 |261Hz(C4), 16.911 |260Hz(C4), 16.813 |
|成分3 |264Hz(C4), 16.504 |1764Hz(A6), 16.92 |1763Hz(A6), 16.939 |1764Hz(A6), 16.852 |1763Hz(A6), 16.717 |1763Hz(A6), 16.391 |
|成分4 |      |      |522Hz(C5), 15.636 |523Hz(C5), 15.425 |523Hz(C5), 15.288 |523Hz(C5), 15.357 |


kira7.wav (G5, 783.99Hz + E4, 329.62Hz)
|frame|1         |2         |3         |4         |5         |6         |
|成分1 |783Hz(G5), 18.616 |783Hz(G5), 18.491 |784Hz(G5), 18.254 |784Hz(G5), 18.041 |785Hz(G5), 17.916 |784Hz(G5), 17.722 |
|成分2 |262Hz(C4), 17.355 |260Hz(C4), 17.505 |263Hz(C4), 17.148 |261Hz(C4), 16.951 |261Hz(C4), 17.086 |259Hz(C4), 16.843 |
|成分3 |1573Hz(G6), 16.799 |1571Hz(G6), 16.8 |1571Hz(G6), 16.901 |1571Hz(G6), 16.853 |1570Hz(G6), 16.536 |1570Hz(G6), 16.139 |
|成分4 |      |521Hz(C5), 16.043 |522Hz(C5), 15.633 |523Hz(C5), 15.524 |523Hz(C5), 15.468 |522Hz(C5), 15.472 |

kira8.wav (G5, 783.99Hz + C4, 261.62Hz)
|frame|1         |2         |3         |4         |5         |6         |
|成分1 |788Hz(G5), 18.795 |783Hz(G5), 18.571 |783Hz(G5), 18.465 |784Hz(G5), 18.215 |783Hz(G5), 17.994 |784Hz(G5), 17.85 |
|成分2 |1570Hz(G6), 16.849 |261Hz(C4), 17.668 |261Hz(C4), 17.352 |263Hz(C4), 16.981 |264Hz(C4), 17.106 |261Hz(C4), 16.911 |
|成分3 |252Hz(B3), 16.554 |1572Hz(G6), 16.798 |1572Hz(G6), 16.78 |1571Hz(G6), 16.937 |1571Hz(G6), 16.762 |1570Hz(G6), 16.406 |
|成分4 |      |      |523Hz(C5), 15.817 |522Hz(C5), 15.587 |523Hz(C5), 15.454 |523Hz(C5), 15.503 |


ここまでで分かったことは、
-ピアノ2声程度の重なりであれば、周波数はかなり正確に推定できそうだ。
--一般調和解析を使うと、かなりきれいに(FFTと違って裾野の広がり無しに、単一周波数に)周波数分解できる。
-パワー値の大きさの順に並べれば、およその基本波の状況は推定できそうだ。
--もっと声部が増えたときは、現在でも倍音のパワー値が基本波に近いので、弱い声部の基本波のパワーを越えてしまい、分離できなくなるだろう。
-倍音比率の情報は使っておらず、最大パワーが基本波というルールだけで見ているが、それはいずれ対応しきれなくなる。
--特に、オクターブ離れた声部を重ねた場合、区別がつかないはずで、パワーの差だけでは、単音で高調波が出ているのか、オクターブ差で2音鳴っているかの区別をするのは、限度があるだろう。
--もし、高調波の組成がある程度分かっていれば(楽器に依る)、音の分離をできるだろうが、一般には仮定したくない。また同じ楽器でも高音域と低音域で高調波組成が異なるだろう。更には、持続する音の場合、初めと終りで音色が変化する可能性もある。


倍音比率が同じだと仮定して、複数音を分離することを考える。但し比率の数字は(事前に既知とは)仮定しない。


kira1

|frame|1         |2         |3         |4         |5         |6         |
|成分1 |524Hz(C5),1.19e+19 |523Hz(C5),1.30e+19 |522Hz(C5),8.05e+18 |522Hz(C5),4.53e+18 |522Hz(C5),2.38e+18 |522Hz(C5),1.30e+18 |
|成分2 |1046Hz(C6),1.76e+17 |1045Hz(C6),7.85e+16 |129Hz(C3),6.18e+16|130Hz(C3),6.81e+16 |131Hz(C3),3.85e+16 |130Hz(C3),2.11e+16 |
|成分3 |1570Hz(G6),2.10e+16 |134Hz(C3),2.04e+16 |1045Hz(C6),3.52e+16 |1045Hz(C6),2.01e+16 |1046Hz(C6),1.24e+16 |1047Hz(C6),7.76e+15 |
|成分4 |      |1574Hz(G6),1.39e+16 |264Hz(C4),4.27e+15 |264Hz(C4),3.47e+15 |264Hz(C4),4.90e+15 |264Hz(C4),4.78e+15 |
|成分5 |      |269Hz(C1),8.89e+15 |      |      |      |      |
|成分6 |      |      |      |      |      |      |

kira2

|frame|1         |2         |3         |4         |5         |6         |
|成分1 |522Hz(C5),3.60e+19 |522Hz(C5),1.77e+19 |520Hz(C5),1.45e+19|521Hz(C5),7.64e+18 |521Hz(C5),4.53e+18 |523Hz(C5),2.61e+18 |
|成分2 |1046Hz(C6),6.19e+17 |261Hz(C4),1.09e+18 |261Hz(C4),2.23e+18|263Hz(C4),8.57e+17 |262Hz(C4),7.35e+17 |261Hz(C4),7.01e+17 |
|成分3 |1571Hz(G6),7.21e+16 |1044Hz(C6),2.83e+17 |1046Hz(C6),1.56e+17|1047Hz(C6),1.06e+17 |1048Hz(C6),6.64e+16 |1048Hz(C6),3.95e+16 |
|成分4 |      |1572Hz(G6),3.10e+16 |1572Hz(G6),5.98e+15 |2109Hz(C7),2.95e+15 |     |      |
|成分5 |      |      |      |      |      |      |
|成分6 |      |      |      |      |      |      |

[[一般調和解析(3)>ノート/一般調和解析(3)]]
[[一般化調和解析(3)>ノート/一般化調和解析(3)]]

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS