昨天DeepSeek发布了V3.2-Exp,API价格直接减少75%。看了下论文,核心改进是一个叫DSA(DeepSeek Sparse Attention)的机制。花了点时间研究,记录一下。 问题背景 先说说为什么需要这个东西。 Transformer的attention机制有个老大难问题:就是O(L²)的复杂度,计算量随序列长度平方增长。具体来…		
	
	
	
				
			设备:DJI FLIP 后期:Luminar Neo		
	
	
	
				
			我曾像一个隐身的观众,默念着舞台上每一个角色的名字。直到灯光亮起,照亮全场时才发现,我的座位,就在舞台之上。 通关Cytus II已经四年了。我以为那段旅程已经结束。 但每次看到那个界面,听着熟悉的旋律响起,依然会有些说不出的感觉。一个音乐游戏,在我心里待了四年。这让我觉得有些不对劲。 不是说游戏不好。恰恰相反,它太好了。好到我需要弄清楚,它是如何…		
	
	
	
				
			好久不打歌了,最近又开始打BeatSaber了,为了方便获取自定义谱面,就做了一个工具,可以根据你自己的音乐路径,自动去BeatSaver爬取对应的谱面。 用法很简单,例如 D:\Music 路径是你自己的音乐文件夹,E:\BeatSaber谱面 是你的谱面文件夹,下载项目、安装依赖后,执行`python main.py --music-dir "…		
	
	
	
				
			虽然民乐里面二胡最常和扬琴一起出场,但在我心里,最配二胡的还是钢琴		
	
	
	
				
			动君金屈卮,满酌不须降。花发多风雨,人生足别离。		
	
	
	
				
			引言:算法视角下的人工智能发展脉络 人工智能 (Artificial Intelligence, AI) 作为一门致力于模拟、延伸乃至扩展人类智能的学科,其核心目标始终围绕着如何让机器展现出类似人类的思考、学习和决策能力。在AI波澜壮阔的发展历程中,算法扮演了至关重要的角色。它们不仅是理论思想的载体,更是将抽象智能概念转化为具体可执行指令、实现智能…		
	
	
	
				
			1. 引言与背景 在近两年,大语言模型领域的更新迭代速度令人瞩目,从各种 GPT 系列、Claude 系列到开源的 LLaMa、Qwen 以及 DeepSeek 系列等纷纷崭露头角。一个核心趋势在于: 当我们需要让模型不仅“通晓”各类文本信息,而且能做多步逻辑推理、数学推导、编程验证时,传统的纯文本/对话式训练往往不足以覆盖深层次的推理能力; 于是…		
	
	
	
				
			人工智能(AI)自 20 世纪中叶萌芽以来,经过数十年的探索、争议与演进,逐渐形成了三大相对独立却又交互互补的研究流派: 符号主义(Symbolism) 连接主义(Connectionism) 行为主义(Behaviorism) 在每个发展阶段,我们不仅见证了不同流派的崛起与衰退,也见证了新算法的涌现与旧方法的革新。如今,融合多种思路的混合式系统(…		
	
	
	
				
			近年来,伴随大语言模型(LLM)的进步,“RAG”(Retrieval-Augmented Generation,检索增强生成)成为了热门技术路径。传统 RAG 通过检索外部文本作为上下文来辅助模型生成答案,大大缓解了大型模型在线回答问题时的“幻觉”问题。然而,如何在海量信息中高效而精准地检索并组织知识,始终是一个亟待解决的难点。本文将围绕以下问题…