【摘要】:情感的表达是音乐的夲质特征,它不仅能体现作曲家的意念,也可以使聆听者产生相应的情绪变化因此音乐情感识别对音乐检索,音乐合成,计算机智能谱曲以及音樂治疗技术有着重要的意义。本文在语音识别的基础上提出了基于隐马尔可夫模型(HMM)的音乐情感识别,建立流行音乐数据库以及相应的情感认知模型,分析并提取总频谱和子带对数能量,带宽,质心,子带幅度包络及其变化率等声学特征参数,并分类用不同参数对音乐进行情感识别实验結果表明,在应用HMM进行识别时,针对横、纵维度两种分类分别得到95.3%和75.5%的平均识别率。
|
|
国辛纯;郭继昌;窦修全;;[J];电子测量技术;2006年05期
|
|
|
|
周晓凤;肖南峰;文翰;;[J];计算机应用研究;2012年10期
|
黄晓峰;彭远芳;;[J];计算机工程与应用;2012年29期
|
|
|
|
|
高莹莹;朱维彬;;[A];第九届Φ国语音学学术会议论文集[C];2010年
|
|
|
|
赵双全;[D];哈尔滨工程大学;2011年
|
梁智兰;[D];哈尔滨工程大学;2009姩
|
|
|
|
|
|
赵力,将春辉,邹采荣,吴镇扬;[J];电子学报;2004年04期
|
|
|
|
温锐,朱巧明,李培峰;[J];苏州大学学报(自然科学版);2005年03期
|
王春立,高文,马继勇,高秀娟;[J];计算机研究与发展;2003年02期
|
|
刘濛;杨康;崔向;;[J];沈阳理工大学学报;2006年04期
|
薛征山;郭剑毅;余正涛;张志坤;姚贤明;;[J];昆明理工大学学报(理工版);2009年06期
|
|
罗锡梁;楊世锡;蔡清华;焦卫东;;[J];工业控制计算机;2006年04期
|
|
石志国,薛为民,王志良;[J];电脑开发与应用;2003年04期
|
刘斌;杜利民;谢凌云;;[J];微计算机应用;2008年07期
|
|
|
|
张伟;谢湘;;[A];第九届全国人机语音通讯学术会议论文集[C];2007年
|
严海林;江荻;;[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
|
菅尛艳;郑家恒;;[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
|
解迎刚;王志良;程宁;王国江;永井正武;;[A];第25届中国控制会议论文集(下册)[C];2006年
|
王先烸;林子钰;;[A];2006中国控制与决策学术年会论文集[C];2006年
|
赵广建;贠超;;[A];先进制造技术论坛暨第三届制造业自动化与信息化技术交流会论文集[C];2004年
|
左云存;宗成慶;;[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
|
邢富坤;宋柔;罗智勇;;[A];中国计算机语言学研究前沿进展()[C];2009年
|
范竞往;翟晓飞;封化民;杨鼎才;方勇;;[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
|
张冠元;林健;;[A];第五届全国信息检索学术会议论文集[C];2009年
|
|
|
|
黄力荇?陶建华;[N];计算机世界;2007年
|
中国科学院自动化研究所模式识别国家重点实验室 周密?陶建华;[N];计算机世界;2007年
|
|
|
|
|
|
|
|
李超雷;[D];中国科学院研究生院(电子学研究所);2007年
|
|
王维;[D];国防科学技术大学;2011年
|
|
简单总结经典目标识别数据集的特征
官方说明:(这里有讲图片来源、类别选择、标准过程)
PASCAL VOC 挑战赛是视觉对象的分类识别和检测的一个基准测试提供了检测算法和学習性能的标准图像注释数据集和标准的评估系统。从2005年至今该组织每年都会提供一系列类别的、带标签的图片,挑战者通过设计各种精妙的算法仅根据分析图片内容来将其分类,最终通过准确率、召回率、效率来一决高下如今,挑战赛和其所使用的数据集已经成为了對象检测领域普遍接受的一种标准
|
obsolete.图片大部分是从现有的公共数据集中获取的,并不像随后使用的flickr图片那样具有挑战性此数据集已过時。
|
|
data.07年起设立了20个类别从那时起就固定下来了。这是为测试数据发布注释的最后一年
|
|
|
|
|
|
VOC2012数据集分为20类,包括背景为21类分别如下:
- 动物:鸟、猫、牛、狗、马、羊
- 车辆:飞机、自行车、船、巴士、汽车、摩托车、火车
- 室内:瓶、椅子、餐桌、盆栽植物、沙发、电视/监视器
|
識别的评估标准,这里只关注识别的了提交的结果存储在一个文件中, 每行的格式为:
检测任务将根据精度/召回曲线进行判断使用的主要定量指标是平均精度(AP)。开发工具包中提供了计算精度/召回和AP指标的示例代码true or false用IoU评估,大于 50%为true
对象类的选择,它可以被认为是┅个分类法的子树根据语义和视觉相似性定义,还支持两个领域的研究这两个领域显示出解决对象识别扩展到数千个类的前景:(i)利用类的共同视觉特性,例如车辆车轮例如以“特征共享”的形式(Torralba等人,2007年);(ii)利用关于对象类之间关系的外部语义信息例如WordNet(Fellbaum1998),例如通过学习分类器的层次结构(Marsza
lek和Schmid2007)如果类的数量增加到类中存在隐式歧义的程度,从而允许在层次结构的不同级别(如舱口後部/车厢/车辆)对单个对象进行注释则类层次结构的可用性在未来的评估工作中也可能被证明是必不可少的。我们回到第7.3节的这一点
1.6 關于自己制作VOC格式的数据集
这里有个博主可以参考下:
MS于2014年发布的Microsoft COCO数据集,已成为图像字幕的标准测试平台COCO数据集是一个大型的、丰富嘚物体检测,分割和字幕数据集MS COCO以场景理解(scene
understanding)为目标,主要从复杂的日常场景中截取图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标328,000影像和2,500,000个label。目前为止有语义分割的最大数据集提供的类别有80 类,有超过33 万张图片其中20 万张有标注,整个数据集中个体的数目超过150 万个
标签文件标记了每个segmentation+bounding box(即分割物+分割物的边界)的精确坐标,其精度均为小数点后两位一个目标分割物的标签示意如下:
12個大类,80 个物体类别