本系统将一段输入的人声哼唱信号(采样率为44kHz,16bit)自动地或通过一个人机交互界面转换成由二种离散的音符序列构成的旋律。即实际哼唱旋律与期望哼唱旋律。用指定的MIDI合成音色(如合成钢琴音色)播放该音符序列所构成的旋律正好和这段输入的人声哼唱所描述的旋律基本一致。
音高不太准确的人声哼唱片段均可以有二种旋律。其一称为实际哼唱旋律(actual melody),其二称为期望哼唱旋律(expected melody)。二者区别在于前者把每个哼唱音符的绝对音高作为哼唱旋律音符的音高,后者则主要以调性音级(scale step)作为音符的音高。我们把期望哼唱旋律视为正确的旋律。
目前系统开发已经完成可供用户使用。
该项技术可应用于:
1)音乐检索领域,如应用于哼唱搜歌系统,KTV点歌机,嵌入电视机顶盒的KTV点歌系统;
2)民歌记谱,风格分析领域,如音律、节奏、曲式结构及调式的统计分析系统以及民歌自动记谱或辅助记谱系统,以此代替或降低人工记谱成本;
3)歌唱培训领域,如歌唱训练系统;
4)计算机辅助作曲领域(应用于“采风”中对所收集不同地区民歌的风格统计分析)等。
1)技术转让方式获利;2)合作开发(技术入股,对方资金入股)以股份制形式分享点歌机厂商或电视机产商的销售利润;3)进一步开发与销售(哼唱)记谱系统及歌唱培训系统(可制作成光盘销售)以及网上付费哼唱搜歌或记谱系统。
任何双方协商同意的方式。