news 2026/4/15 9:32:19

首批!景联文入选杭州语料库高质量数据集建设先行先试清单

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
首批!景联文入选杭州语料库高质量数据集建设先行先试清单

|首批高质量数据集建设先行先试清单的发布,不仅是官方对数据价值的认证,更是景联文科技从数据服务商迈向“AI数据基础设施”的关键一步。

近日,在浙江省数据局指导下,杭州市数据资源管理局联合杭州市数据集团等单位,通过“揭榜挂帅”机制,正式发布首批50个杭州语料库高质量数据集建设先行先试清单。景联文《教育大模型英文知识数据集》成功入选,成为教育教学领域代表性高质量数据产品,标志着公司在教育垂直领域的数据服务能力获得了官方与市场的双重认可

5637万道结构化英文试题,打造教育大模型“黄金语料”

本次入选的《教育大模型英文知识数据集》,是景联文科技历时一年自主研发的行业专用类高质量数据资产。数据集总量超5760万道英文试题,其中:

  • K12英文试题5637万道,覆盖商业、计算机、教育等20+学科,76%配备详细解析;
  • 大学英文试题9.7万道,涵盖英语、数学、生物等19门核心课程,每题均含专业解析;
  • 多模态试题150万道,图像规格不低于768×1024像素,支持图文理解与跨模态训练;
  • 指令微调数据达5637万条提示问答对,重复率<0.05%,专为大模型对齐优化设计。

所有数据采用JSONL结构化格式,字段完整覆盖学科、考点、题型、学段、年级、难度、题干、选项、答案、解析及媒体资源,严格遵循《2025高质量数据集实践指南(1.0)》标准,题目完整度≥95%,答案准确率≥95%。

接入杭州语料库,推动教育数据要素市场化流通

根据杭州市数据资源局政策,首批高质量数据集将通过数据产权确认,接入杭州语料库,面向社会提供创新性、示范性数据服务。此次入选,不仅验证了景联文数据产品的技术领先性,更打通了从“数据资源”到“数据资产”再到“数据产品”的转化路径。

景联文构建了“采集-清洗-标注-质检-迭代”全生命周期治理体系,自研AI治理平台支撑百万级数据日处理能力,已为教育科技公司、出版集团及大模型研发机构提供专项数据服务,助力智能教育生态高质量发展。

景联文也明确了下一步方向:持续提升数据质量至更高标准。并计划向STEM、前沿科技等更高价值学科拓展,构建包含音视频的多模态3.0版本题库,以适配教育大模型更复杂的交互需求。让AI真正赋能因材施教,促进教育公平与质量提升。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 15:39:30

未来 AIDC 基础设施规范沙龙成功举办

GCC-Open AI Infra社区成立一个月以来,机房基础设施、AI整机柜在内的4个项目群正有序运行。到目前为止,基础设施项目群已经启动了机房液冷、机房供配电、DC智能化等项目;AI整机柜规项目组已经启动了供电、散热、高速互联等项目;板…

作者头像 李华
网站建设 2026/4/10 21:15:22

从EtherNet/IP到DeviceNet:一场驱动智能仓储升级的“协议融合”实践

从EtherNet/IP到DeviceNet:一场驱动智能仓储升级的“协议融合”实践1. 项目背景:智能仓储升级的异构网络之困近年来,国内某大型电商区域配送中心面临仓储自动化升级需求。现场控制系统核心为三套罗克韦尔ControlLogix系列PLC(采用…

作者头像 李华
网站建设 2026/4/12 12:10:38

数据升级 | CnOpenData 2000-2024年中国企业环保行政处罚数据

一、数据简介中国企业环保行政处罚数据库系统收录了由中国各级生态环境部门依法公开的企业环保行政处罚记录,涵盖全国各省、市、区(县)的企业违规处罚信息。该数据库包含公开日期、被处罚方名称、所属地区、处罚类型、处罚结果、罚款金额、违…

作者头像 李华
网站建设 2026/4/14 8:01:33

Segment Anything Model(SAM)介绍

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 文章目录概要SAM的定义SAM的网络架构任务设计模型设计数据引擎和数据集SAM的结构对任何 10 亿个掩模数据集进行分割SAM 如何支持现实生活…

作者头像 李华
网站建设 2026/4/15 6:31:45

AI开发避坑指南:原来大模型也有“情绪链“!GPT稳定如老狗,Claude敏感如少女,开发时需注意这些“情绪雷区“

【前言】AI 正以前所未有的速度发展,新的机遇不断涌现,如果你希望:与技术专家、产品经理和创业者深度交流,一起探索 AI如何改变各行各业。欢迎在文末扫二维码,加入「AI思想会」交流群,和一群志同道合的伙伴…

作者头像 李华
网站建设 2026/4/3 2:35:36

paperzz AI:毕业论文写作的「隐形搭子」,这波操作太懂毕业生了

Paperzz-AI官网免费论文查重复率AIGC检测/开题报告/文献综述/论文初稿 paperzz - 毕业论文-AIGC论文检测-AI智能降重-ai智能写作https://www.paperzz.cc/dissertation 临近毕业季,当别人还在对着空白文档抓耳挠腮时,有人已经靠paperzz AI把毕业论文进度…

作者头像 李华