GreenWinter Blog

时间是摸出来的,我看着你们,满怀羡慕。

cursor的使用

Cursor IDE 安装、CLI 与 IDE 实战

Cursor 是面向开发的 AI 编辑器。官方文档的核心概念包括 Tab、Agent 与 Chat,并延伸到 Custom instructions、Semantic search、MCP、Context 与 Models 等能力(下文会逐一说明)。 本文从三个部分展开:IDE 安装、CLI 使用、Concepts + Quickstart,帮助你快速上手。 一、Cursor IDE 安...

Nvidia GPU架构与并行计算分享

学习笔记

CPU & GPU 计算机的基本组成结构 计算机的基本组成单元(冯诺依曼结构): 存储器 控制单元 算数逻辑单元 输入输出 读写:由RAM(Random Access Memory)存储指令和数据; 控制单元:读取指令/数据,解码指令并串行地执行; 算数逻辑单元:基本的运算单元; 输入/输出:人机交互的输入输出接口。 What is CPU? CP...

Qwen3-Next 架构深度剖析

底层实现与优化策略

在大模型迈向“更大、更长、更快”的时代,阿里云通义团队于 2025 年 9 月发布了下一代基础模型架构 Qwen3-Next。该架构以“极致效率优化”为核心目标,通过混合注意力机制、高稀疏度 MoE、训练稳定性保障和推理性能优化四大支柱,实现了在参数规模、上下文长度与推理成本之间的精妙平衡。 混合注意力架构:Gated DeltaNet 与 Gated Attention Qwen3...

Cublas相关

cublas学习笔记

https://docs.nvidia.com/cuda/cublas/ Data Layout cublas遵循 Fortran 风格的列优先(column-major order)内存布局。因此使用下面的宏可以计算对应的C/C++风格的0-based一维数组索引: // i: 行索引, j: 列索引, ld: 矩阵的 leading dimension #define IDX2C(i...

Agentic RL

当强化学习学会主动思考

最近几年,“Agentic”这个词在机器学习圈里越来越常见。它不像“深度学习”那样有明确的数学定义,更像是一种设计哲学:让智能体不只是被动地响应环境,而是主动地规划、反思、甚至给自己布置任务。而当这种思想和强化学习(Reinforcement Learning, RL)结合,就催生了所谓的 Agentic Reinforcement Learning。 这听起来有点玄,但其实背后有很实在的...

4月底冲绳

嘉兴游

行程 4.25->4.28 天气:雨雨晴阴 机票:10人行程。实际单人往返均价:2400RMB(加了行李额度) 去程【准点】 04-25 周五 10:35 上海浦东机场T2PVG 2h25m 14:00 冲绳那霸机场IOKA 春秋航空9C6977 经济舱空客320(中) 返程【晚点】 04-28 周一 15:00 冲绳那霸机场IOKA 2h30m 16:30 上海浦东机场...

2月底大阪

嘉兴游

有着悠久文化历史的大阪是日本第二大城市,全国经济、政治和文化的中心,交通便利、贸易发达,是深受国内外旅行者喜爱的人气城市。大阪位于日本本州中西部,面积是全国都道府县中最小的,但人口却仅次于首都东京。 行程 2.28->3.02 双人行程。实际单人往返均价:1979RMB 换汇大约4W JPY(黑门市场很多商户只支持现金) 携程可以购买大阪周游券: 1️⃣大阪城御座船 1...

余数

如何计算大数的余数

乘法逆元 $k^{-1}$是$k$关于模$p$的乘法逆元的代数式可以记为: \[k \cdot k^{-1} \equiv 1 \pmod p\] 换成余数的写法即为: \[\text{rem}(k \cdot k^{-1},p) = 1\] 即存在唯一的整数$q$和$r$使$r = \text{rem}(k \cdot k^{-1},p) = k \cdot k^{-1} - q...

浮点类型的精度损失

这不数学

“几种语言中0.1 + 0.2结果的无聊记录。” 浮点数的表示方式 浮点数类型的表示方式: \[signifant \times base ^ {expont}\] 因此,显然会丢失部分精度,于是就有了经典的$0.1 + 0.2 \ne 0.3$问题。 IEEE754 双精度标准 C C语言的double类型是双精度浮点数,运算结果较为well-known: #in...