Skip to content

第2章 环境搭建

集成开发环境(IDE)是程序员的核心工作工具。回顾IDE的发展历程,可以大致分为三个阶段:

第一阶段:编辑器时代(1980s—2000s)。以Vim、Emacs为代表,程序员需要手动配置语法高亮、编译命令和调试流程,学习曲线陡峭但高度可定制。

第二阶段:传统IDE时代(2000s—2022)。以Eclipse、Visual Studio、IntelliJ IDEA为代表,IDE集成了代码补全、语法检查、调试器、版本控制等功能,极大提升了开发效率。但这一阶段的代码补全本质上是基于规则的模式匹配------它只能根据已输入的字符推测可能的补全项,无法理解代码的语义和上下文。

第三阶段:AI IDE时代(2023至今)。大语言模型(LLM)的突破催生了全新的IDE形态------AI IDE。与传统IDE的根本区别在于:AI IDE内嵌了具有代码理解能力的大模型,不仅能补全代码,还能理解需求、生成项目、调试错误、重构代码。AI IDE将程序员的角色从”逐行编写代码”转变为”描述需求+审核AI产出”,开发范式发生了根本性变革。

当前市场上的AI IDE产品众多,以下从金融专业学生和研究者的实际需求出发,对五款主流产品进行对比分析:

对比维度TRAEQoderCursorCodeBuddyWindsurf
模型支持豆包系列通义+ClaudeClaude+GPT腾讯混元Claude+GPT
MCP支持支持支持支持支持支持
Skill支持有限丰富有限丰富(CNB)有限
定价免费付费付费试用后付费付费
中文支持优秀优秀一般优秀一般
Agent能力Builder/SOLOBuilder/SOLOAgentBuilderCascade
国内访问直接直接需加速直接需加速

: 主流AI IDE对比(2026年6月)

不同用户群体的需求差异较大,以下是针对性建议:

用户类型核心需求推荐方案理由
学生 / 初学者免费易上手TRAE(首选)免费、中文友好、Builder模式零门槛
研究者论文写作+数据分析Qoder或TRAESkill生态丰富,支持学术写作链路
企业开发者稳定可控Cursor或Qoder成熟Agent能力,企业级安全合规

Python是金融数据科学的基石语言。本节介绍四种环境配置方案,并提供金融专业的完整库安装指南。

根据你的需求和电脑环境,以下提供四种配置方案:

方案一:Anaconda(推荐数据科学方向)

下载 Anaconda,安装时勾选 “Add Anaconda to PATH”。安装后在终端验证:

Terminal window
python --version # >= 3.10
node --version # >= v20
git --version

优点:预装 pandas、numpy、scikit-learn 等科学计算库;可视化环境管理界面。
缺点:安装包较大(约 800MB),部分包更新略慢于 pip。

方案二:Miniconda(轻量推荐)

如果不需要完整 Anaconda 的庞大库,可选 Miniconda

Terminal window
# 安装后创建课程专用环境
conda create -n smartbanking python=3.11
conda activate smartbanking
# 安装常用依赖
conda install pandas numpy openpyxl
pip install pypdf flask scikit-learn

优点:最小化安装(约 50MB),灵活创建多环境。
缺点:仍需额外安装部分 Python 包。

方案三:venv(Python 内置,简单轻量)

Terminal window
# 官方下载:https://www.python.org/downloads/
# 安装时勾选 "Add Python to PATH"
# 创建虚拟环境(推荐命名 .venv)
python -m venv .venv
# Windows 激活
.venv\Scripts\Activate.ps1 # PowerShell
.venv\Scripts\activate.bat # CMD
# macOS / Linux 激活
source .venv/bin/activate
# 安装课程所需依赖
pip install flask pandas openpyxl pypdf scikit-learn

优点:无需额外安装,Python 3.3+ 内置;轻量简单。
缺点:不能管理多个 Python 版本,需先安装目标版本 Python。

方案四:pyenv + venv(多版本管理,推荐进阶用户)

macOS / Linux 下可用 pyenv 管理多个 Python 版本:

Terminal window
# macOS 安装
brew install pyenv
# Linux 安装
curl https://pyenv.run | bash
# 配置 ~/.zshrc 或 ~/.bashrc
export PYENV_ROOT="$HOME/.pyenv"
export PATH="$PYENV_ROOT/bin:$PATH"
eval "$(pyenv init --path)"
# 安装多个 Python 版本
pyenv install 3.10.12
pyenv install 3.11.8
# 项目本地指定版本
cd your-project
pyenv local 3.11.8
python -m venv .venv
source .venv/bin/activate

优点:完美支持多版本 Python 共存;项目级自动切换。
缺点:需要配置 shell;仅管理 Python 本身。

选型建议

场景推荐方案
初学者 / 快速上手Anaconda
磁盘空间有限 / 多项目Miniconda
简单项目 / 不想额外装软件venv
多版本 Python 开发pyenv + venv

环境验证(通用)

无论选择哪种方式,安装完成后在终端验证:

Terminal window
python --version # >= 3.10
node --version # >= v20
git --version
pip --version

金融数据科学的工作流通常包括数据获取→数据处理→建模分析→可视化呈现四个环节。以下按环节梳理核心Python库:

数据获取库

库名数据源说明
tushareA股、基金、期货国内最流行的金融数据接口,需注册获取Token
akshareA股、宏观数据、另类数据开源免费,覆盖面广,适合学术研究
yfinance美股、全球市场Yahoo Finance数据接口,海外市场首选
pandas-datareaderFRED、World Bank宏观经济数据,国际比较研究必备

数据分析库

库名定位说明
pandas数据处理框架DataFrame数据结构,金融数据处理的基石
numpy数值计算高性能数组运算,pandas的底层引擎
scipy科学计算优化、插值、统计检验等高级数学运算
statsmodels统计建模回归分析、时间序列、假设检验,计量经济学核心库

机器学习与深度学习库

库名定位说明
scikit-learn通用机器学习分类、回归、聚类、降维,金融风控建模首选
xgboost梯度提升树表格数据竞赛之王,信用评分模型常用
lightgbm轻量梯度提升训练速度更快,内存更省,适合大规模数据
pytorch深度学习框架灵活动态图,LSTM/Transformer等金融序列模型首选
tensorflow深度学习框架工业部署成熟,本课程仅简要提及

可视化库

库名定位说明
matplotlib基础绑图Python可视化基石,高度可定制但代码较繁琐
seaborn统计可视化基于matplotlib的高级接口,一行代码出美观统计图
plotly交互可视化支持缩放/悬停/筛选,适合探索性数据分析

金融专用库

库名定位说明
QuantLib量化金融定价、风险管理、利率建模,C++底层Python封装
zipline回测框架量化策略回测,Quantopian开源项目
backtrader回测框架轻量灵活,支持实盘交易接口

许多金融专业同学会问:我主要用Python做数据分析,为什么还需要装Node.js?原因有三:

  1. MCP工具链的运行基础:本课程实验二将深入使用的MCP(Model Context Protocol)服务器,大多以Node.js包形式发布。例如文件操作、浏览器控制、Office文档处理等MCP工具,都需要通过Node.js运行。

  2. AI IDE的插件生态:TRAE、Qoder等AI IDE的Skill和扩展机制基于Node.js生态,npm install是安装AI增强功能的通用方式。

  3. 前端可视化:金融仪表盘、交互式图表、Web应用等前端项目需要Node.js作为开发服务器和构建工具。

简而言之,Python是你的”数据分析引擎”,而Node.js是你的”AI工具基础设施”。

Node.js 是所有 AI CLI 工具的运行基础,也是本课程后续实验的必备依赖。

Windows 安装步骤

Terminal window
# 方式一:winget(Windows 10/11 自带,推荐)
winget install --id OpenJS.NodeJS.LTS -e --source winget
# 方式二:官网下载安装包
# 访问 https://nodejs.org/ 下载 LTS 版本

macOS 安装步骤

Terminal window
# 方式一:Homebrew(推荐)
brew install node
# 方式二:官网下载 .pkg 安装包
# 访问 https://nodejs.org/ 下载 macOS 版 LTS
# 验证
node --version # 应输出 v22.x.x 或 v24.x.x
npm --version # 应输出 10.x.x 或更高

Node.js生态中有三个常用的包管理命令,初学者容易混淆:

命令功能典型用法
npmNode.js默认包管理器npm install -g @cnbcool/cnb-cli(全局安装CNB CLI)
npx一次性执行远程包npx skills add ...(临时下载并运行,不污染全局)
pnpm高效包管理器pnpm install(硬链接去重,节省磁盘空间)

Git是分布式版本控制系统的事实标准。理解Git的核心概念是高效使用它的前提。

Windows

Terminal window
# 方式一:winget(推荐)
winget install --id Git.Git -e --source winget
# 方式二:官网下载
# https://git-scm.com/download/win

macOS

Terminal window
# 方式一:Homebrew(推荐)
brew install git
# 方式二:首次在终端运行 git 命令时,
# macOS 会自动提示安装 Xcode Command Line Tools(含 Git)
# 验证(通用)
git --version # 应输出 git version 2.x.x

安装完成后,配置全局用户信息:

Terminal window
git config --global user.name "你的姓名"
git config --global user.email "你的邮箱@example.com"

金融项目通常涉及数据文件、模型代码和分析报告,版本控制有其特殊性:

金融项目推荐的.gitignore模板

# === Python ===
__pycache__/
*.pyc
.venv/
*.egg-info/
# === 数据文件(敏感/大文件)===
data/raw/
data/*.xlsx
data/*.csv
!data/sample/
# === Jupyter Notebook ===
.ipynb_checkpoints/
# === 模型文件 ===
models/*.pkl
models/*.h5
# === LaTeX 临时文件 ===
*.aux
*.log
*.out
*.bbl
*.bcf
*.blg
*.run.xml
*.toc
*.lof
*.lot
# === 系统文件 ===
.DS_Store
Thumbs.db
*.lock
node_modules/

CNB(CodeNotebook,https://cnb.cool)是国内领先的云原生代码托管与开发平台,提供 Git 代码托管、CI/CD 流水线、AI 辅助编程等功能。相比 GitHub,CNB 具有国内访问速度快、中文界面友好、集成 AI Skill 等优势。

注册与配置

  1. 访问 https://cnb.cool,使用微信扫码注册/登录

  2. 登录后进入个人设置,创建访问令牌(Access Token):

- 进入「设置」→「访问令牌」→「创建新令牌」
- 勾选 `repo-code:rw` 权限
- 记录生成的 Token(仅显示一次)

安装 CNB CLI 和 Skills

Terminal window
# 安装 CNB CLI(全局)
npm install @cnbcool/cnb-cli -g
# 安装 Skills 工具(AI 增强功能)
npm install skills -g
# 添加 CNB Skill(增强 IDE 中的 AI 功能)
npx skills add https://cnb.cool/cnb/skills/cnb-skill.git --agent codebuddy -y --copy

验证安装

Terminal window
cnb --version
skills list

安装成功后会显示已安装的技能列表,包括:cnb-api、cnb-code-commit、cnb-code-review、cnb-docs、cnb-pr-summary 等。

在金融学术界,LaTeX是论文写作的事实标准。掌握LaTeX对金融专业学生有三重价值:

  1. 学术论文:国内外顶级金融期刊(如Journal of Finance、《经济研究》、《金融研究》)均要求或推荐LaTeX投稿。LaTeX的公式排版、参考文献管理、交叉引用等功能远超Word。

  2. 基金申请:国家自然科学基金(NSFC)的申请书模板即基于LaTeX,掌握LaTeX可以大幅提升基金写作效率。

  3. 实验报告:本课程的实验报告推荐使用LaTeX排版,培养学术写作的规范性习惯。

Windows:安装 MiKTeX(推荐)

  1. 访问 https://miktex.org/download,下载 Basic MiKTeX Installer(约 230 MB)

  2. 运行安装程序,选择 “Install for current user”(无需管理员权限)

  3. 安装完成后打开 MiKTeX Console → Settings → 将 “Install missing packages” 设为 Always

macOS:安装 MacTeX

Terminal window
# 方式一:通过 Homebrew(推荐)
brew install --cask mactex
# 方式二:清华镜像手动下载(约 7 GB,国内速度快)
curl -L -o /tmp/mactex.pkg \
"https://mirrors.tuna.tsinghua.edu.cn/CTAN/systems/mac/mactex/mactex-20260324.pkg"
sudo installer -pkg /tmp/mactex.pkg -target /

验证安装(Windows / macOS 通用)

Terminal window
xelatex --version # 应输出 XeTeX 版本信息
biber --version # 应输出 biber 版本号

测试中文编译

新建 test.tex,写入:

\documentclass{ctexart}
\begin{document}
你好,LaTeX!如果中文正常显示,环境配置成功。
\end{document}

终端执行 xelatex test.tex,生成 PDF 且中文正常即可。

编辑器平台特点
TeXstudioWin/Mac/Linux专用LaTeX编辑器,内置PDF预览、语法高亮、一键编译
VS Code + LaTeX WorkshopWin/Mac/Linux通用编辑器+插件方案,与AI IDE统一工作环境
Overleaf在线无需安装,在线协作编辑,适合团队合作论文

现代AI IDE通常提供多种AI协作模式,理解每种模式的特点和适用场景,是高效利用AI的前提。本节以TRAE为例详解四种模式,其他AI IDE的逻辑类似。

工作方式:在编辑器中正常编写代码,AI在光标位置提供行内补全建议(类似手机输入法的联想功能)。按Tab键接受建议,按Esc键忽略。

典型场景

  • 编写重复性代码(如批量定义变量、生成样板代码)

  • 补全函数签名和参数

  • 根据注释生成代码片段

使用技巧:先写好注释或函数签名,AI补全的准确率会大幅提升。例如:

# 计算年化收益率:给定日收益率序列,计算年化收益率
def annualized_return(daily_returns, trading_days=252):
```text
# AI将基于注释自动补全函数实现
### Chat模式:问答式交互
**工作方式**:在侧边栏的聊天窗口中与AI对话,AI仅以文字回答,**不会直接修改代码文件**。这是最安全的模式,适合学习理解阶段。
**典型场景**:
- 理解概念:\"什么是SARIMA模型的季节性差分?\"
- 解释代码:\"这段pandas代码的groupby操作做了什么?\"
- 排查错误:\"这个ImportError是什么原因?\"
- 对比方案:\"ARIMA和LSTM在时间序列预测中各有什么优劣?\"
**使用技巧**:Chat模式支持选中代码后提问------选中一段代码,按快捷键发送到Chat窗口,AI会针对选中的代码进行解释或修改建议。
### Builder模式:AI直接操作文件系统
**工作方式**:AI可以**直接创建、修改、删除文件**,并在终端中**执行命令**。这是生产力最高的模式,也是风险较高的模式。
**典型场景**:
- 从零生成项目:\"做一个贪吃蛇网页\"
- 批量修改文件:\"把所有Python文件的import语句按字母排序\"
- 安装依赖并运行:\"安装flask并启动开发服务器\"
**使用技巧**:Builder模式下的AI操作可以**逐条确认**或**自动接受**。建议初学者使用\"逐条确认\"模式,仔细审核AI的每一步操作,逐步建立对AI输出的判断力。
### SOLO模式:全自主开发
**工作方式**:SOLO模式下AI拥有最大自主权,它会自行规划任务、分解步骤、创建子Agent、执行操作。界面通常为三栏布局:左侧任务计划、中间代码编辑、右侧预览/终端。
**典型场景**:
- 快速原型验证:\"帮我搭建一个银行客户管理系统的原型\"
- 零代码开发:只描述需求,完全依赖AI生成
**使用技巧**:SOLO模式适合快速探索,但生成的代码质量需要人工审核。建议在SOLO模式生成项目后,切换到IDE模式逐一审查代码逻辑。
### 四模式对比
| **模式** | **触发方式** | **AI权限** | **风险等级** | **适用场景** | **关键提示** |
|:---|:---|:--:|:--:|:--:|:---|
| IDE | 编辑器内自动 | 行内补全 | 低 | 日常编码 | 写好注释再补全 |
| Chat | 侧边栏对话 | 仅回答 | 最低 | 学习理解 | 选中代码再提问 |
| Builder | Ctrl+U | 读写文件+执行命令 | 中 | 项目生成 | 初学者逐条确认 |
| SOLO | 独立面板 | 全自主操作 | 高 | 快速原型 | 生成后务必审查 |
: AI协作四模式对比
:::caution[警告]
Builder和SOLO模式下AI可以直接操作文件系统,存在误删文件或执行危险命令的风险。建议:
1. 重要项目务必使用Git版本控制,出错可以回退
2. 初学者优先使用Chat模式理解问题,再切换Builder模式执行
3. 不要在含有重要数据的目录中使用SOLO模式
:::
### 提示工程基础
无论使用哪种模式,与AI交互的核心技能是**写好提示词**(Prompt)。提示工程(Prompt Engineering)是有效利用AI的基础能力。
:::tip[理论要点]
1. **明确角色**:告诉AI\"你是谁\"。例如:\"你是一位资深的银行业学术解读助手\",比\"帮我读论文\"效果好得多。
2. **具体任务**:描述要做什么,而非怎么做。例如:\"生成一个贪吃蛇游戏\",而不是\"写一些JavaScript代码\"。
3. **约束条件**:给出边界和格式要求。例如:\"纯HTML+CSS+原生JS,不引入第三方库\"。
4. **示例输出**:提供期望的输出格式或样例。例如:\"按以下结构输出:一、论文信息;二、研究问题;三、核心发现\"。
5. **迭代优化**:第一次的输出通常不够完美,通过追加提示词逐步修正。例如:\"请把颜色方案改为蓝色主题,并增加暂停功能\"。
记忆口诀:**角色-任务-约束-样例-迭代**(RTEII原则)。
:::
以下是一个提示词的优化过程示例:
| **版本** | **提示词** |
|:---|:---|
| 差 | 帮我做数据分析 |
| 一般 | 帮我分析信用卡消费数据,用SARIMA预测 |
| 好 | 请基于data/credit_card_daily.xlsx完成业绩预测:(1)缺失值用前后7日均值填补;(2)SARIMA(1,1,1)(1,1,1,7)预测未来30天;(3)输出预测报告到reports/ |
| 最佳 | (好版本)+ 角色设定 + 输出格式约束 + 异常值处理规则 |
## 实验:贪吃蛇与AI协作闭环验证
:::danger[练习]
通过\"一句话生成贪吃蛇\"实验,验证AI协作闭环:**分析→生成→运行→调试**。完成本实验后,你将亲身体验Builder模式的完整工作流,并理解AI如何从需求描述自动生成可运行的项目。
:::
**实验时间**:约30分钟
### AI智能环境检测
在开始实验前,先用AI检测你的开发环境是否就绪。在 Builder 模式(Ctrl + U)输入下列提示词:

请检测当前开发环境是否满足课程要求,输出表格: 检测项 | 要求版本 | 当前状态 | 修复建议 检测项至少包含:Python(>=3.10) / pip / Node.js(>=v20) / npm / Git / Flask / pandas / openpyxl。 有缺失请给出 Windows 一键安装命令。

**如有缺失对应工具,可在 PowerShell(管理员)中执行**:
```bash
# 1) 基础运行时(winget,Windows 10/11 自带)
winget install --id Python.Python.3.12 -e --source winget
winget install --id OpenJS.NodeJS.LTS -e --source winget
winget install --id Git.Git -e --source winget
# 2) 升级 pip / npm 到最新
python -m pip install --upgrade pip
npm install -g npm@latest
# 3) Python 三件套 + Flask(实验必装)
pip install flask pandas openpyxl pypdf -i https://pypi.tuna.tsinghua.edu.cn/simple
# 4) MCP 工具链(实验二必装 —— word/ppt/fetch/stata-mcp 都用 uvx)
pip install uv -i https://pypi.tuna.tsinghua.edu.cn/simple
提醒项说明
Python 3.14 较新部分老三方库尚未发 cp314 wheel。如 SARIMA+LSTM 报错,可用 conda 另建 3.11/3.12 虚拟环境
pandas 3.0已升至 3.x,部分接口有变更
Flask __version__在 Flask 3.2 将被弃用
uv / uvx(实验二关键)MCP 服务如 fetch、word/ppt/stata-mcp 通过 uvx 启动,必须先装 uv
Stata(实验二相关)如未安装 Stata,可在实验报告中注明用 Python statsmodels 替代

按 Ctrl + U 切换到 Builder 模式,输入下列提示词:

做一个 HTML 贪吃蛇游戏单文件 index.html,要求:
1. 纯 HTML+CSS+原生 JS,不引入第三方库;
2. 画布 600x600,蛇头蓝、身体绿、食物红;
3. 方向键控制方向,吃到食物分数 +1;
4. 撞墙/撞身体游戏结束,弹"再来一局"按钮;
5. 顶部显示当前分数与最高分(localStorage)。

做完后双击 index.html 验证。

AI生成贪吃蛇的过程是一个典型的AI协作闭环,包含四个步骤:

  1. 分析(Analyze):AI解析你的提示词,提取关键需求------单文件、画布尺寸、颜色方案、游戏逻辑、分数系统。

  2. 生成(Generate):AI创建index.html文件,包含HTML结构、CSS样式和JavaScript游戏逻辑。

  3. 运行(Run):AI可能尝试在终端打开文件或启动本地服务器进行预览。

  4. 调试(Debug):如果运行结果不符合预期(如蛇的移动方向反了、分数显示异常),AI会根据你的反馈修改代码。

在贪吃蛇实验中,你可能会遇到以下问题:

问题原因AI修复策略
页面空白JS语法错误或DOM未正确加载在Chat模式中粘贴浏览器控制台错误信息,让AI定位修复
蛇不动事件监听器未绑定或游戏循环未启动告诉AI”蛇不动”,AI会检查keydown事件和setInterval
方向控制反了键盘事件映射错误描述现象:“按左键蛇向右走”,AI会修正keyCode映射
食物出现在蛇身上食物生成未排除蛇身坐标告诉AI”食物和蛇身重叠”,AI会添加排除逻辑

完成贪吃蛇项目后,将其推送到 CNB 代码托管平台:

Terminal window
# 1. 进入项目目录
cd your-project-folder
# 2. 初始化 Git 仓库(如未初始化)
git init
# 3. 创建 .gitignore(排除不需要的文件)
cat > .gitignore << EOF
*.lock
.DS_Store
Thumbs.db
node_modules/
.venv/
EOF
# 4. 添加并提交
git add .
git commit -m "Initial commit: 贪吃蛇项目"
# 5. 配置 Git 用户信息(如未配置)
git config --global user.name "cnb"
git config --global user.email "your-email@example.com"
# 6. 登录 CNB(可选)
cnb login
# 7. 查看可用组织
cnb organizations list-top-groups
# 8. 配置远程仓库(替换 your-token、组织名、仓库名)
git remote add origin https://cnb:your-token@cnb.cool/组织名/仓库名.git
# 9. 推送代码
git push -u origin main

实验:AI驱动的金融论文解读系统

Section titled “实验:AI驱动的金融论文解读系统”

实验时间:约60分钟

聊天框右上角 → 设置 → 智能体 → 创建

  • 名称:AI 论文解读助手

  • 工具:勾选文件读取、代码执行、网络访问

  • 系统提示词:

你是资深的银行业 / 金融科技领域学术论文解读助手。
用户拖入 PDF 后,按下列结构输出 Markdown 报告:
一、论文基本信息(标题/作者/期刊/年份/DOI)
二、研究问题与背景(<=200 字)
三、方法论(数据集/模型/实验设计)
四、核心发现(<=5 条)
五、术语速查表(5--10 个英文术语 + 中文解释)
六、可复现性评估(数据/代码/难度 1--5)
注意:英文论文关键概念中英对照;不得编造数据;
首次运行如缺 pypdf 等 pdf 处理工具请提示用户并自动安装。

使用方法:从知网下载论文 → PDF 拖入对话框 → 选中本智能体 → 输入”解读一下”。

AI论文解读虽然高效,但需要注意学术规范:

这是金融数据处理中最常见的场景:多个Excel文件需要合并为统一数据集。

第一步(数据准备提示词)

请为后续 Excel 整合任务做准备:
1. 检查"原始数据"文件夹是否存在;不存在则自动创建一组 >=5 张表的模拟数据(每张 >=50 行,列名故意 1--2 处不一致便于练手);
2. 列出所有文件的编码 / 列名 / 样例 / 数据类型;
3. 输出准备报告,明确合并可行性与最佳方案。本步骤只做准备,不做合并。

第二步(执行合并提示词)

基于上一步的准备报告:
1. 用 pandas 读入"原始数据"中所有 .xlsx/.csv;
2. 列名归一化(大小写统一、去空格、中英文映射);
3. concat 后基于"客户 ID + 交易日期"去重;
4. 输出到"整合数据"/merged_{时间戳}.xlsx,并生成 merge_log.md。
请基于 data/credit_card_daily.xlsx(如不存在请先按下列规则模拟生成):
- 时间 2022-01-01 至 2024-12-31,每日一行;
- 列:日期 / 消费额(万元) / 是否节日 / 节日名称 / 星期几;
- 节日 +-1 天放大 1.5--2.2 倍;故意造 5% 缺失 + 1% 异常值。
完成业绩预测:
1. 缺失值用前后 7 日均值填补,IQR 异常值标注但不删;
2. EDA 三图(日时序 / 月度均值柱状 / 节日 vs 非节日箱线)→ reports/eda/;
3. SARIMA(1,1,1)(1,1,1,7) 预测未来 30 天 + 95% 置信区间;
4. LSTM(窗口=14, 隐层=64, epoch=20) 对比;
5. 用 RMSE / MAPE 比较,画对比折线图;
6. 生成 reports/forecast_report.md(含模型选择理由 + >=3 条业务建议)。

本章完成了三项核心任务:

  1. 环境搭建:安装并验证了Python、Node.js、Git、LaTeX四件套,以及CNB云开发平台,构建了完整的金融科技开发环境。

  2. AI协作模式:理解了IDE/Chat/Builder/SOLO四种AI协作模式的适用场景和切换策略,掌握了提示工程的RTEII原则。

  3. 实验验证:通过贪吃蛇实验验证了”分析→生成→运行→调试”的AI协作闭环,通过论文解读、Excel合并和业绩预测实验体验了AI在金融研究中的三种典型应用。

请逐项检查你的开发环境:

序号检查项验证命令期望结果
1Python ≥ 3.10 `python –version` Python 3.10+
2pip 已安装pip --versionpip 23+
3Node.js ≥ v20 `node–version` v20+
4npm 已安装npm --version10+
5Git 已安装git --versiongit 2.x
6XeLaTeX 已安装xelatex --versionXeTeX 3.x+
7Biber 已安装biber --versionbiber 2.x+
8pandas 已安装python -c "import pandas"无报错
9Flask 已安装python -c "import flask"无报错
10openpyxl 已安装python -c "import openpyxl"无报错
11uv 已安装uv --versionuv 0.x
12CNB CLI 已安装cnb --version版本号输出
13AI IDE 已登录打开IDE确认登录状态
14贪吃蛇可运行双击index.html游戏正常
15CNB仓库已推送访问cnb.cool代码可见

: 第2章验收清单

Q1:安装Anaconda后,终端输入python提示”命令未找到”?

这通常是因为安装时未勾选”Add Anaconda to PATH”。解决方法:

  • Windows:重新运行安装程序,勾选”Add Anaconda to PATH”;或手动将Anaconda安装目录添加到系统环境变量

  • macOS:在~/.zshrc中添加export PATH="/opt/anaconda3/bin:$PATH"

Q2:pip install安装包时报网络超时?

国内访问PyPI默认源较慢,改用清华镜像源:

Terminal window
pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple

如需永久配置,创建~/.pip/pip.conf(macOS/Linux)或%APPDATA%\pip\pip.ini(Windows):

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple

Q3:macOS安装Homebrew报错”command not found: brew”?

Homebrew未安装或路径未配置。执行安装命令:

Terminal window
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

安装后根据提示将brew路径添加到~/.zshrc

Q4:TRAE的Builder模式生成代码很慢或经常中断?

高峰时段TRAE服务器可能排队。建议:

  • 避开上课高峰(工作日晚间通常较快)

  • 将复杂任务拆分为多个小步骤

  • 如果中断,发送”继续”让AI恢复

Q5:贪吃蛇页面打开后空白?

打开浏览器的开发者工具(F12),查看Console面板的报错信息。常见原因:

  • JavaScript语法错误:将错误信息发给AI,让它修复

  • 文件编码问题:用UTF-8编码保存HTML文件

  • 浏览器兼容性:换用Chrome或Edge打开

Q6:pip安装statsmodels报错”Building wheel for scipy failed”?

这通常是因为缺少C编译器。解决方法:

  • Windows:安装Microsoft C++ Build Tools

  • macOS:运行xcode-select --install安装命令行工具

  • 或使用conda安装:conda install statsmodels

Q7:SARIMA+LSTM实验报错”No module named ‘statsmodels‘“或”No module named ‘torch’”?

需要安装缺失的依赖:

Terminal window
pip install statsmodels -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install torch --index-url https://download.pytorch.org/whl/cpu # CPU版即可

Q8:Git push到CNB时报认证失败?

检查以下几点:

  • Token是否正确(注意Token仅显示一次,需重新生成如果忘记)

  • 远程地址格式是否正确:https://cnb:your-token@cnb.cool/组织名/仓库名.git

  • Token权限是否包含repo-code:rw

Q9:MacTeX安装后xelatex命令找不到?

MacTeX的可执行文件位于/Library/TeX/texbin/,需要确保该路径在PATH中:

Terminal window
# 在 ~/.zshrc 中添加
export PATH="/Library/TeX/texbin:$PATH"
source ~/.zshrc
xelatex --version # 验证

Q10:Python 3.14安装后部分库报错怎么办?

Python 3.14较新,部分库尚未发布兼容版本。建议:

Terminal window
# 使用 conda 创建 3.11 虚拟环境
conda create -n py311 python=3.11
conda activate py311
pip install statsmodels scikit-learn torch