【学术大纲】NOAI 2026 - NOAI国际人工智能奥赛俱乐部

【学术大纲】NOAI 2026

2025年10月修订，版本号V1.5

修订说明

本次更新经NOAI科学委员会专家审定，作为[2026]年度活动的正式大纲发布;
B区神经网络的大部分描述都从“知道”上升为“理解”;
B区神经网络增加“知道典型的大语言模型” 描述。

一、目标

本大纲列举了NOAI学术活动的参与者在活动中需要熟悉或掌握的技能和知识。它将作为NOAI科学委员会开发任务题目的指南，同时也帮助参与者有效地对活动进行学术准备。为了保持大纲的时效性，本文件内容正式发布后每年重新修订一次。每次修订将由科学教育委员会共同讨论并对内容进行删增或提升、降低掌握程度的要求。

二、 内容说明

本大纲分为4个组成部分，其中A, B部分针对NOAI中国区学术活动的第一轮即水平测试轮，要求参与者通过预先学习，掌握A, B中所要求的知识和技能。大纲的C, D部分是NOAI中国区学术活动的第二轮即人工智能应用实践轮的考查要求。

注意：

本大纲中所提及的人工智能指向科学共同体认可的学科边界之内的人工智能概念，是其适合高中生水平的子集，以机器学习、深度学习领域为主，以数据驱动为主要特征。此人工智能并非“泛人工智能”，不包括开源硬件、教育机器人、图形化编程等领域。
其他学科核心素养要求：选手需具备《普通高中课程方案》规定的全部核心素养和基本能力。其中，对于数学、物理、化学、生物、信息技术学科，需达到对应学科《普通高中课程标准》中 “希望大学选择人工智能相关专业” 方向的必修（含选择性必修）与选修内容及能力要求。

三、 大纲细则

A.一般性计算机技能

NOAI学术活动要求参与者具备最基本的Python编程能力，能够使用Python编写程序解决实际问题（例如简单数据处理、简单算法问题）。

熟练掌握Python基本语法，包括：算数运算、关系运算、输入输出语句等。
熟练掌握基本的程序结构，包括：顺序、分支、循环等。
会使用Python基本数据结构及其基本操作，包括：字符串(String)、列表(List)、字典(Dictionary)、元组(Tuple)等。
理解函数(Function)、模块(Module)和包(Package)的概念，能调用Python的内置函数和标准模块例如os, math, random, sys等，能自定义函数。
在文档的帮助下，能使用第三方库解决简单问题。
能读懂代码，在文档的帮助下能使用Python语言编写排序(Sorting)、查找(Searching)等简单算法。

B.人工智能基础知识

NOAI学术活动要求参与者对人工智能有一定了解，理解人工智能的基本方法和基本概念。

理解机器学习的基本方法范式，能对训练和推理过程进行描述。
理解关键概念中涉及的机器学习、深度学习方法所适用的典型问题范围。
能在文档的帮助下，尝试解决机器学习、深度学习的简单问题，其中编程实践中涉及第三方库的调用，题干中将给出调用方法。

B区考核中主要涉及的关键概念包括：

人工智能：
- 知道连接主义(Connectionism)、符号主义(Symbolism)、行为主义(Behaviourism)和图灵测试(Turing Test)。
- 理解人工智能技术带来的风险问题与伦理挑战，如数据隐私、算法偏见、人工智能的责任归属等问题。树立正确的价值观，能够通过案例分析讨论这些问题背后的原因、影响及应对措施。
机器学习：
- 理解监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)，能够描述两者的区别和联系。
- 知道强化学习(Reinforcement Learning)的概念及其典型应用场景。
- 理解回归(Regression)、分类(Classification)、聚类(Clustering)，知道回归、分类和聚类的常见算法。
- 理解线性回归(Linear Regression)、逻辑（斯蒂）回归(Logistic Regression)的基本原理，能对其进行简要描述。
- 知道线性(Linear)与非线性(Non-linear)。
- 知道机器学习中的基本数学概念，包括：概率论基本知识；常见分布，例如正态（高斯）分布(Normal/Gaussian Distribution)；统计学基础知识；距离的定义。
- 知道残差(Residual)、偏差(Bias)、标准差(Standard Deviation)。
- 理解模型评估(Module Evaluation)和模型评估的常用指标：混淆矩阵(Confusion Matrix)、精确率(Precision)、准确率(Accuracy)、召回率(Recall)、交叉验证(Cross Validation)、F1分数(F1-Score)等，能够根据实际场景选取或者设计合适的模型评估指标并计算。
- 理解欠拟合(Underfitting)、过拟合(Overfitting)、正则化(Regularization)，并能对其含义进行简要描述。
- 理解集成学习(Model Ensembles)的概念，知道梯度提升(Gradient Boosting)、Bagging、随机森林(Random Forest)的核心思想。
神经网络：
- 理解感知机(Perceptron)、神经网络(Neural Network, NN)。
- 理解误差反向传播(Back propagation, BP)算法，能描述训练中正向传播和反向传播的过程。
- 理解梯度下降(Gradient Descent)，能对其进行简要描述。
- 理解局部最优(Local Optima)、全局最优(Global Optima)。
- 理解卷积神经网络(Convolutional Neural Network, CNN)，能简要描述网络结构。
- 理解神经网络中常用层的原理和计算过程：卷积层(Convolutional Layer)、池化层(Pooling Layer)、全连接层(Full Connected Layer)。
- 理解神经网络中决策函数(Decision Function)、激活函数(Activation Function)、损失函数(Loss Function)，能够描述各个函数的作用。
- 知道动量优化方法(例如Adam、AdamW)的核心思想，能描述其与普通梯度下降的差异。
- 知道大语言模型（LLM）的核心思想。
数据：
- 理解数据清洗(Data Cleaning)的一般过程。
- 理解训练集(Training Set)、测试集(Testing Set)、验证集(Validation Set)。

C.进阶计算机技能

NOAI要求参与者能应用Python语言和已有工具解决真实的人工智能问题。其中Numpy、Pandas和Matplotlib是比较常用的数据处理和可视化工具。NOAI学术活动第二轮要求参与者能掌握上述3个包的基本使用方法，并能在在文档的帮助下在程序中加以应用从而对数据进行处理。

熟练运用数据清洗、数据可视化、统计分析等数据处理与分析技巧。
熟练掌握Numpy的数据处理、统计和转化功能。
熟练掌握Pandas的数据读取、查询、抽取、融合、缺失值处理等功能。
熟练掌握Matplotlib的数据可视化功能。
掌握特征工程核心技术：包括滑动窗口、池化操作、One-hot 编码、统计矩特征（均值、标准差）提取，以及基于神经网络的嵌入生成。
掌握数据处理细节：包括序列数据缺失值的前向填充、图像翻转 / 裁剪 / 加噪增强、文本 tokenization 与词汇表构建、图像 patching 操作。

D.人工智能进阶知识与技能

NOAI第二轮要求参与者掌握Scikit-Learn机器学习工具包和PyTorch框架的基本应用，并能在文档的帮助下解决人工智能相关研究问题。问题可能涉及计算机视觉、语音识别、自然语言处理、大语言模型等多个子领域。

掌握 PyTorch 基础语法，包括张量（Tensor）的创建、基本运算、数据类型转换，以及简单神经网络的定义与初始化方法。
理解 CPU 与 GPU 训练模型的性能差异；能在 PyTorch 中实现设备选择（CPU/GPU）、数据与模型的设备迁移，以及混合精度训练的基础配置。
掌握常见权重初始化方法（如 Xavier、He 初始化）
理解批量归一化(Batch Normalization)的原理，能在神经网络中添加批量归一化层并调试参数。
能在文档帮助下，在模型训练中配置 Adam/AdamW 优化器的参数，例如学习率(Learning Rate)等。
熟悉神经网络、卷积神经网络(CNN)，简单了解循环神经网络(Recurrent Neural Network, RNN)、生成对抗网络(Generative Adversarial Network, GAN)等深度学习模型的基本原理与应用，能在PyTorch框架中独立完成相关实验。
掌握文本预处理(Text Preprocessing)、词法分析(Lexical Analysis)、文本分类(Text Classification)等自然语言处理技术，能在PyTorch框架中独立完成相关实验。
理解图像分割(Image Segmentation)、特征提取(Feature Extraction)、目标检测(Object Detection)等计算机视觉的基本概念和方法，并使用常见的计算机数据库（例如OpenCV）进行实验。
理解语音信号处理(Speech Signal Processing)、语音识别(Speech Recognition)、语音合成(Text to Speech)等人工智能在语音领域的基本概念和方法，并能完成相关实验。
理解以大语言模型(Large Language Model, LLM)为代表的生成式人工智能(Generative Artificial Intelligence)的原理，知道多模态(Multi-modal)的概念，并能应用生成式人工智能模型解决生活中的问题。了解开源预训练语言模型（例如Qwen）的本地部署流程，以及相关 API 调用方法（例如使用Openrouter进行调用）;能使用上述模型完成文本生成、问答等基础任务。

注，围绕大纲的推荐阅读资料及课程，请参看《学生活动指南》任务卡1.4

NOAI新赛季备赛已开启，扫码领取NOAI备赛资料

欢迎咨询【NOAI竞赛辅导课程】