首页

喝馨雨女王的洗脚

时间:2025-05-26 10:13:37 作者:2027年要初步建立的“国家关键语料库”是什么? 浏览量:78356

  2027年要初步建立的“国家关键语料库”是什么 怎么建

  “当前,随着新一轮科技革命和产业变革,大语言模型、人工智能技术快速发展,语料库的建设规模与应用范围也经历了大幅度完善和拓展。”前不久,教育部语言文字信息管理司相关负责人提到,决定实施国家关键语料库共建共享计划,扩展关键领域,支持共建共享,推进应用转化,为全方位释放语言文字在经济社会发展中的数据要素价值奠定更加宽厚基础。

  近期,教育部、国家语委、中央网信办印发《关于加强数字中文建设 推进语言文字信息化发展的意见》(以下简称《意见》)。其中提到,到2027年,国家数字中文建设行动取得重要成效,语言文字数据要素价值有效释放。基本形成“政府主导、部门协同、社会参与、共建共享”的语言文字信息化工作机制;基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库;语言文字信息化标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。

  “国家关键语料库”是什么

  《意见》提出,推动基础性语言资源建设,实施国家关键语料库共建共享计划,重点支持建设大规模中文语料库及高质量民族语言文字语料库、手语盲文语料库、行业领域语料库、语言监测动态语料库等。

  教育部语言文字信息管理司相关负责人在接受中青报·中青网记者专访时提到,语料库是自然语言处理、大语言模型、人工智能技术创新应用的重要支撑,是经济社会信息化建设、数字化赋能和智能化发展的基础要素,促进语言数据赋能信息技术创新与信息技术赋能语言文字资源使用的双向赋能。

  以文化传承领域为例,目前已经建设了中华思想文化术语库、中华精品字库、甲骨文数据库、中国语言资源保护数据库等。

  其中,中华思想文化术语库包括了中华民族所创造或构建,凝聚、浓缩了中华哲学思想、人文精神、思维方式、价值观念,以词或短语形式固化的概念和核心词。该语料库中包括1200余条思想文化术语、中医文化关键词、典籍译本、典籍译名、博雅双语词等。

  教育部语言文字信息管理司相关负责人提到,2024年,智能化学习工具“AI小语”正式上线。“AI小语”是以中华思想文化术语库为基础训练语料、以大语言模型技术为核心技术的高交互感智能平台,对赋能中华优秀传统文化对内传承和对外传播具有重要意义。

  截至目前,教育部、国家语委通过组织开发、集成汇聚、动态更新等方式,组织高校、企业、科研院所等,建设大规模高质量语料库30余项,相关语料库已广泛应用于经济社会发展的关键领域。

  “国家关键语料库”怎么建

  “信息技术深刻融入经济社会发展各领域,需要推动语言文字与信息技术的深度融合,找准两者的结合点、融合点、发力点。”教育部语言文字信息管理司相关负责人说。

  长期以来,国家语委会同有关部门研制并发布了《信息技术中文编码字符集》等国家通用语言文字和民族语言文字信息化规范标准100多项,为自然语言处理技术在人工智能、数字产品和信息产业领域的应用创新奠定规范基础。

  面向人工智能时代,该负责人介绍,要开展语言资源建设、管理、应用、共享标准研究,重点推进语料库、数据标注、数据评价等规范标准的制订;服务教育教学,研制大语言模型能力素养(师生版),引导师生有效、安全使用大语言模型等人工智能技术;助力文化传承,研制甲骨文数字化共享技术标准。

  此外,既要支持语言文字信息处理基础标准研究,也要鼓励高校、企业开展行业标准、企业标准研制。加强与工信部、国家民委、国家标准委等部门单位合作。推动已有语言文字信息化相关规范标准的修订工作,加强已有规范标准的宣传推广等。

  在专业化人才队伍培养上,教育部语言文字信息管理司相关负责人提到,推动高校增设语言智能、计算语言学等交叉学科方向,增设“语言文字+人工智能”核心课程。此外,鼓励企业建设产教融合实训基地,开展中文信息处理、多语种机器翻译、语料加工处理、数据标注等技能培训,提升中文专业以及相关专业学生的职业技能,扩大就业范围和就业渠道。

  “今年是落实《教育强国建设规划纲要(2024-2035年)》的关键之年,语言文字信息化发展将展望十年、谋划五年、立足三年,把握赋能全局高度,加快试点先行进度,激发协同创新力度,在落实重点任务上下功夫、见实效。”在前不久举行的教育部新闻发布会上,教育部语言文字信息管理司司长刘培俊说。

  中青报·中青网记者 杨洁来源:中国青年报

展开全文
相关文章
两万余选手角逐宜昌马拉松

AD的主要病理特征主要体现在人类大脑内存在的一种名为β-淀粉样蛋白(Aβ)的致病元凶,它是一种具备毒性的“垃圾物质”,如Aβ在大脑内异常沉积,得不到清除,继而会形成“斑块”,损伤神经元细胞,进而影响记忆、思考和其他认知能力。临床研究数据显示,使用乐意保®后,患者大脑内的Aβ沉积即显著降低,用药3个月后,脑内Aβ负荷下降23%, 18个月后脑内Aβ负荷下降71%,有效延缓疾病进展27%。其中,处于AD早期阶段的患者在18个月的治疗期间,整体认知和功能水平被按下“暂停键”,60%的患者甚至出现改善,有望让记忆之舟重新扬帆起航。

第二十一届中国国际农产品交易会在广州开幕

首先,在军事层面,战场局势变化跌宕,呈现出的战场形式备受关注。2022年,俄先攻后守,乌局部反攻。双方见招拆招,战场大开大合,对抗日趋白热化。行动初期,俄对乌全境重要目标实施突袭,派遣地面部队分四路对基辅等枢纽城市实施纵深穿插奔袭,力图以闪电战击垮乌抵抗意志,实现速战速决。虽取得一定成效,但并未达成既定目标。乌克兰则在美北约持续军援的支撑下,开始稳住阵脚,实施攻势防御,并通过秋季攻势收复哈尔科夫、赫尔松等大片区域。俄此后收缩战线、局部动员,放弃南北对进围歼乌东重兵集团目标,在近千公里战线上逐步平推,并宣布“乌东四地公投入俄”,战事再次陷入僵持。一方面,在反复拉锯争夺中,双方出现了类似一战时期的堑壕战战况。另一方面,民用卫星、人工智能、无人机的广泛使用,大幅改写了现代战争的作战方式。

北京强化科技赋能 已在7个高森林火险区部署无人机集群

柯文哲当天离开台北地检署时,对支持者和媒体表示,“这两天可说是极尽压迫和凌虐”;京华城840%的容积率,在今年三四月媒体报道前他完全不知情,目前所有证据,无法证明他干预过。

美国这地流浪汉激增:盗窃、吸毒泛滥,缺少法治

中山11月28日电 (记者 邓媛雯)28日10时,伴随着汽笛声,搭乘219名旅客的豪华高速双体客轮“中山20”从新中山客运口岸首航出发,开往香港中港城,标志着新中山客运口岸正式开通。

现场直击第九批国家集采,42个品种再迎“降价风暴”

这家工厂实现“黑灯”运行,得益于旷视科技提供的一体化智慧仓储解决方案。“推动人工智能技术落地,必须与各行各业的场景进行深度融合。场景创新是人工智能技术升级、产业增长的新路径。”旷视联合创始人、CEO印奇说。“AI将在制造、金融、城市治理、交通物流、绿色低碳等关乎国家经济命脉的重要领域发挥关键作用。AI只有与行业场景深度融合,构建起成熟的产品体系,才能落地生根、释放价值。在这个过程中,AI的研发能力、软硬产品化能力和行业场景,都是必不可少的要素。”

相关资讯
热门资讯