news 2026/6/9 8:29:45

华为OD机试真题精讲:新词挖掘(Python/Java/C++多语言实现)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为OD机试真题精讲:新词挖掘(Python/Java/C++多语言实现)

华为OD机试真题精讲:新词挖掘(Python/Java/C++多语言实现)

一、题目描述(2025B卷高频100分题)

在自然语言处理场景中,「新词挖掘」是指从一段文本中识别出未被收录在词典中的连续字符序列,这些序列需满足特定的频率和长度条件。给定一段仅包含中文汉字的文本字符串text、词典集合dict_words、最小长度min_len、最小出现频率min_freq,请完成以下要求:

  1. 提取文本中所有连续子串,过滤掉词典中已存在的子串;
  2. 筛选出长度≥min_len且出现频率≥min_freq的子串作为候选新词;
  3. 最终返回按出现频率降序、长度降序、字典序升序排序后的候选新词列表。

关键约束

  • 文本长度1 ≤ len(text) ≤ 10^4,词典规模1 ≤ len(dict_words) ≤ 10^3
  • 子串长度范围1 ≤ min_len ≤ 5,最小频率1 ≤ min_freq ≤ 100
  • 时间限制1秒,空间限制256MB;
  • 中文文本无标点符号,仅包含单个汉字组成的连
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 4:59:14

降AI不伤专业术语?2026年实测这2款工具做到了

降AI不伤专业术语?2026年实测这2款工具做到了 很多同学担心:用降AI工具处理后,专业术语会不会被改乱? 我测试了几款工具,结论是:选对工具,专业术语基本不会变。 为什么专业术语容易被改乱&…

作者头像 李华
网站建设 2026/6/7 18:22:58

金手指PCB结构原理与失效机理深度解析

在终端产品返修与失效分析案例中,金手指 PCB 的故障占比常年居高不下,很多用户只关注插拔与清洁,却忽略其结构本质与失效根源。​金手指 PCB 是各类接口类电路板的核心形态,广泛应用于内存条、显卡、PCIe 扩展卡、工业控制板、车载…

作者头像 李华
网站建设 2026/6/9 6:10:31

YOLO26优化:最新注意力机制 | 低计算复杂度的 多尺度线性注意力机制(MSLA)

💡💡💡问题点:基于CNN的方法由于卷积操作的固有局限性,难以有效捕捉全局上下文信息;而基于Transformer的方法则存在局部特征建模不足的问题,同时面临自注意力机制带来的高计算复杂度挑战。 💡💡💡引入多尺度线性注意力机制,旨在以低计算复杂度高效提取图像中的…

作者头像 李华
网站建设 2026/6/8 16:29:26

手动降AI还是用工具?2026年效果对比告诉你答案

手动降AI还是用工具?2026年效果对比告诉你答案 降AI到底要不要花钱?自己手动改行不行? 这是很多同学纠结的问题。这篇文章做个对比,帮你做决定。 手动降AI 做法:一段一段手动改写,打破AI的句式规律。 效…

作者头像 李华
网站建设 2026/6/1 2:42:19

本科论文AI率多少算合格?2026年各高校标准汇总

本科论文AI率多少算合格?2026年各高校标准汇总 本科论文AI率多少算合格? 这是2026届毕业生最关心的问题之一。这篇文章帮你搞清楚各高校的标准,以及怎么达标。 2026年本科论文AI率标准 根据我收集到的信息,大多数高校的标准如…

作者头像 李华