上海市人工智能行业协会自我承诺
上海市人工智能行业协会发布的T/SAIAS 015—2024《语料库建设导则》团体标准遵循开放、公平、透明、协商一致和促进贸易和交流的原则,按照在本平台公布的《标准制定程序文件_SAIAS》制定。T/SAIAS 015—2024《语料库建设导则》团体标准规定的内容符合国家有关法律法规和强制性标准的要求,没有侵犯他人合法权益。
上海市人工智能行业协会在自愿基础上作出本承诺,并对以上承诺内容的真实性负责。
上海市人工智能行业协会
2024年07月03日
团体详细信息 | |||
---|---|---|---|
团体名称 | 上海市人工智能行业协会 | ||
登记证号 | 51310000MJ4904153L | 发证机关 | 上海市民政局 |
业务范围 | 专业咨询、行业调研、技术指导、人才培训、编辑出版、会展招商、产品推介、参与标准制定、国内外业务交流、承接政府购买服务等 | ||
法定代表人/负责人 | 季昕华 | ||
依托单位名称 | |||
通讯地址 | 上海市浦东新区世博村路231号330室 | 邮编 : 200125 |
标准详细信息 | |||
---|---|---|---|
标准状态 | 现行 | ||
标准编号 | T/SAIAS 015—2024 | ||
中文标题 | 语料库建设导则 | ||
英文标题 | |||
国际标准分类号 | 35.240.60 信息技术在运输和贸易中的应用 | ||
中国标准分类号 | |||
国民经济分类 | I657 数字内容服务 | ||
发布日期 | 2024年07月02日 | ||
实施日期 | 2024年08月01日 | ||
起草人 | 山栋明、黄海清、贺仁驹、尹浩、王宇、李薇、陈芳、随志浩、郭俊波、金煜纯、薛佳嵩、刘红、龚旺海、陈浩、李璟、陈巧慧、吴其玲、杨文恺、傅伊浩、郭汉杰、苏彤、赵鹏宇、胡永祎、钟俊浩、陈曦、党赞、徐琦、沈涛、陈望都、欧如峰、郭永进、章磊、刘鹏宇、葛丁菱、郑茂宽、胡琼方、贺仁龙、陈雪晖、刘嵘、刘泽雷、黄杨、林晔、王海涛、廖慧霞、李秋蓉。 | ||
起草单位 | 上海库帕思科技有限公司、上海人工智能创新中心、上海市人工智能行业协会、人民网股份有限公司上海分公司、上海信投数字科技有限公司、上海阶跃星辰智能科技有限公司、中国电信股份有限公司上海分公司、咪咕视讯科技有限公司、上海教育软件发展有限公司、北京星尘纪元智能科技有限公司、华为技术公司、商汤集团有限公司、上海稀宇科技有限公司、上海谷羽网络科技有限责任公司、上海流程智造科技创新研究院有限公司、汇纳科技股份有限公司、上海新兴信息通信技术应用研究院、中国联合网络通信集团有限公司上海市分公司、上海报业集团、上海智慧城市发展研究院。 | ||
范围 | |||
主要技术内容 | 本标准主要涵盖了人工智能语料库建设的相关内容。规定了其一般要求和方法,适用于多种相关工作。 在数据资源方面,要求数据规模大、覆盖广、具多样性,密级设置合规且质量高。对不同数据表征模式,如文本、图像、音频、视频数据的类别、语种等有详细规定。提供方式包括实体存储介质等,数据文件标识有命名规则。 语料数据方面,通则有规范性要求,结构和内容分为多个区段并有特定说明,质量要具备规范性等,交付宜用实体存储介质。 语料生产系统中,总体架构包含多个层次,语料库管理系统应具多种功能,工具链的标注工具需满足最低功能要求。 语料生产过程涵盖资源数据检查,文本、图像、音频、视频语料的生产流程。 语料的价值对齐需合法合规,具有正确价值导向且持续进行。 数据安全方面,提供方要实施多方面安全策略和措施,对全过程进行安全性评价,建立相关制度,配置软硬组件,参与人员要签署保密协议并建立安全团队。 |
||
是否包含专利信息 | 否 | ||
标准文本 | 不公开 |
标准公告 | |||
---|---|---|---|
标准发布公告 | 2024/7/3 14:04:38 | ||
*由上海市人工智能行业协会于2024/7/3 14:04:38在团体标准信息平台公布,最后修改时间:2024/7/3 14:04:38
评论