首页 >>产品中心 >> 语音2020语料库

语音2020语料库一站式解决方案


专业专注于语音2020技术领域,语音2020语料库从录音到数据质量严格把控,专业级品质。

  • 录音外围赛设计:平衡外围赛设计、覆盖率设计、工具开发,软件设计和开发;
  • 语音数据采集:中文专业发音人的遴选和评估、录音过程组织协调、项目管理与控制等;
  • 语音数据标注:标注工具软件的开发、多层级语音数据标注(音节音素切分与标注、多层次韵律标注,字/词边界标注);

提供从录音外围赛设计、覆盖率设计、数据采集、标注规范、标注图片在内的一站式数据定制解决方案
,帮助我们的客户在自然语言处理、机器学习等人工智能领域取得技术进步和市场突破。录音语料由文字、短语、句子组成,语料人工复检,准确 度高。适用于人工智能、智能家居、智能车载系统、智能安防等领域。

标注图片
:  

 
语音2020语料库-总体介绍

我公司现有语料库包括:

  • 纯中文语音2020库  :提供6女2男
  • 纯英文语音2020库  :提供2女1男
  • 中英混合语音2020库:提供2女
平均每句语料包含12字,部分可作为产品库,部分可作为试验库

中文女声晓玲语料库-详细介绍

中文语音2020语料库-女声晓玲:

•  国家一级播音员,语音甜美
• 
专业录音棚录音
• 
时长15小时左右


标注规范:
• 
2020语音数据的音节音素切分与标注
• 
重音与多层次韵律标注
• 字/词边界标注
• wav
语音文件44K采样率,16bit,单通道)
• 
基频标注文件(全部经过人工标注)
• 
外围赛标注文件(韵律词+韵律短语+韵律句+汉字+拼音,全部经过人工校对,与实际录音一致)
• 
音节切分文件(全部经过人工切分)


语料库外围赛类型:
• 
中文基础句     :共6005
• 
中文行业句    1463
• 
中文数字多形态293
• 
中文轻声       541
• 
中文儿化音     137
• 
中文儿化音     137
• 
中文单汉字     2075
• 
英文字母多形态603
• 
英文单词       625
• 
英文句子       316
• 
英文多形态     51


晓玲语料库——部分录音试听:(请用ie浏览器试听)


晓玲语料库——语音2020应用试听:(请用ie浏览器试听)



其他更全面的语音2020试听效果,请点击下方资料下载,下载emTTS语音2020软件



资料下载:点击进入相关页面

收缩
  • 电话咨询

  • 010-62986600
  •  15321801789
  • 投诉建议
  •  官方微信号