为便于供应商了解采购信息,根据《物资服务集中采购需求管理暂行办法》等有关规定,现将*****************************某方言语音标注项目的采购意向公开如下:
序号 | 采购项目名称 | 需求概况 | 初步技术参数 | 预算金额(万元) | 预计采购时间 | 备注 |
---|---|---|---|---|---|---|
** | *****************************某方言语音标注项目(包**) | 采购内容:采集并标注指定**个地区各**小时总计**小时某方言有效话音语料。 采购数量:**项 主要功能或目标:采集并标注指定**个地区各**小时总计**小时某方言有效话音语料 需满足的要求:一、需要实现的功能或者目标 采集并标注指定**个地区各**小时总计**小时某方言有效话音语料。 二、应当执行的标准或规范 参照中国翻译协会《中国语言服务行业规范》、《GB/T**-**翻译服务译文质量要求》、《语音同一性鉴定技术规范》(SF/T**-**)、《面向人工智能的数据集质量通用评估方法总体要求》(**-**T-YD)、《面向人工智能的数据生产和和标注服务能力通用成熟度模型》(**-**T-YD)等规范文件,编制本项目应当执行的标准或规范如下: **、标注过程中对标注字正确率的计算标准通常如下: 字正确率=(N-D-S-A)/N***%,式中: N:标准答案的总字数; D:删除错误数,是指识别结果相比标准答案少的字数; S:替代错误数,是指识别结果相比标准答案被替换的字数; A:增加错误数。 **、标注数据来源及要求。标注服务所需的语音数据由供应商自行采集。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。 **、标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 **、标注数据涵盖目标要求。所标注数据中需包含不同年龄段和特点的说话人,具体标准按采购单位要求执行。 三、主要功能要求 **.标注数据来源及要求。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。标注的语音数据由中标供应商按照采购单位要求自行采集,采集区域为甘肃、青海**个省内指定的共计**个州(县)区域。 **.标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 **.标注数据涵盖目标要求。所标注数据具体标准按采购单位要求执行。 **. 标注人员要求。须保证标注人员稳定,至少**名标注管理人员现场管理。 | 四、技术指标要求 ★**.标注结果准确率要求。某方言语音语料标注字正确率≥**%。 ★**.采集语音数据要求。**KHz采样**bit量化PCMa律、PCMu律,**KHz采样**bit量化PCM线性及Wav等主流格式。标注语料分为**个地区方言,每个地区方言需采集并标注**小时,总共**小时有效话音,每个地区的语料标注时长与要求的**小时偏差不超过**小时。中标供应商履约过程中应根据用户要求详细列明语料场景及说话人类别。 ★**.标注结果格式要求。标准的“textgrid”文本文件。 **.单个语音文件的时长须控制在**.**-**分钟内。标注文本起止时间和语音起止时间误差不超过**-**毫秒。 | **.** | **年**月 | 五、验收标准及方法 中标供应商需提供项目实施计划,需要在标注语料达到**小时时进行中期检查,标注语料达到**小时时方能申请最终验收,质检验收按照验收测试大纲执行。其中,标注字正确率不低于中标承诺值。由采购方提供第三方复查单位,按照标注要求及指标对所标注数据进行复检并负责答疑。验收未通过,中标供应商需在**个月内整改并达到指标要求;若整改后未达到指标要求,采购方有权终止合同并要求中标供应商支付赔偿,具体赔偿事宜需与采购方协商后在合同中明确。 |
** | *****************************某方言语音标注项目(包**) | 采购内容:采集并标注指定**个地区各**小时总计**小时某方言有效话音语料。 采购数量:**项 主要功能或目标:采集并标注指定**个地区各**小时总计**小时某方言有效话音语料。 需满足的要求:一、需要实现的功能或者目标 采集并标注指定**个地区各**小时总计**小时某方言有效话音语料。 二、应当执行的标准或规范 参照中国翻译协会《中国语言服务行业规范》、《GB/T**-**翻译服务译文质量要求》、《语音同一性鉴定技术规范》(SF/T**-**)、《面向人工智能的数据集质量通用评估方法总体要求》(**-**T-YD)、《面向人工智能的数据生产和和标注服务能力通用成熟度模型》(**-**T-YD)等规范文件,编制本项目应当执行的标准或规范如下: **、标注过程中对标注字正确率的计算标准通常如下: 字正确率=(N-D-S-A)/N***%,式中: N:标准答案的总字数; D:删除错误数,是指识别结果相比标准答案少的字数; S:替代错误数,是指识别结果相比标准答案被替换的字数; A:增加错误数。 **、标注数据来源及要求。标注服务所需的语音数据由供应商自行采集。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。 **、标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 **、标注数据涵盖目标要求。所标注数据中需包含不同年龄段和特点的说话人,具体标准按采购单位要求执行。 三、主要功能要求 **.标注数据来源及要求。语音标注是指标注语音对应的文字内容,音与字一一对应的标注。标注的语音数据由中标供应商按照采购单位要求自行采集,采集区域为四川省内指定的共计**个州(县)区域。 **.标注数据覆盖领域要求。标注的语音数据须为日常生活中的自然对话场景数据,不得为录音棚数据,覆盖领域具体按采购单位要求执行。 **.标注数据涵盖目标要求。所标注数据具体标准按采购单位要求执行。 **. 标注人员要求。须保证标注人员稳定,至少**名标注管理人员现场管理。 | 四、技术指标要求 ★**.标注结果准确率要求。某方言语音语料标注字正确率≥**%。 ★**.采集语音数据要求。**KHz采样**bit量化PCMa律、PCMu律,**KHz采样**bit量化PCM线性及Wav等主流格式。标注语料分为**个地区某方言,每个地区方言需采集并标注**小时,总共**小时有效话音,每个地区的语料标注时长与要求的**小时偏差不超过**小时。中标供应商履约过程中应根据用户要求详细列明语料场景及说话人类别。 ★**.标注结果格式要求。标准的“textgrid”文本文件。 **.单个语音文件的时长须控制在**.**-**分钟内。标注文本起止时间和语音起止时间误差不超过**-**毫秒。 | **.** | **年**月 | 五、验收标准及方法 中标供应商需提供项目实施计划,需要在标注语料达到**小时时进行中期检查,标注语料达到**小时时方能申请最终验收,质检验收按照验收测试大纲执行。其中,标注字正确率不低于中标承诺值。由采购方提供第三方复查单位,按照标注要求及指标对所标注数据进行复检并负责答疑。验收未通过,中标供应商需在**个月内整改并达到指标要求;若整改后未达到指标要求,采购方有权终止合同并要求中标供应商支付赔偿,具体赔偿事宜需与采购方协商后在合同中明确。 |
注:**.本次意向公开的采购意向仅作为供应商了解初步采购安排的参考,采购项目具体情况以最终发布的采购公告和采购文件为准;
**.供应商可以通过采购平台反馈参与意向和意见建议。
联系人:*******
联系方式:*******