念念不忘，必有回响

发表于2025-08-12|学习

如何用现代替代品替换传统的Linux命令Linux系统中有许多经典命令已经服务了几十年，虽然它们仍然可靠，但现代开发者已经创建了更直观、功能更强大的替代工具。本文将介绍如何用这些现代工具替换传统的Linux命令，提升你的命令行效率。为什么需要替代传统命令？传统的Linux命令如ls、find、grep等虽然功能强大，但存在一些局限性：输出格式不够直观缺少彩色高亮功能选项复杂难记执行速度较慢现代替代工具通过以下改进解决了这些问题：更美观的输出显示更快的执行速度更智能的默认行为更好的用户体验主要命令替代方案1. ls → exaexa是ls命令的现代替代品，具有以下优势：彩色输出，不同类型文件有不同颜色自动显示Git仓库状态树状结构显示目录更好的文件大小显示格式安装方法： 123sudo apt install exa # Debian/Ubuntusudo dnf install exa # Fedorabrew install exa # macOS 使用示例： 12exa -l --git #...

Linux-终端该如何粘贴内容

发表于2025-08-11|学习shell

复制粘贴后为什么会出现 ^[[200~ … ~？在用终端（Terminal）复制粘贴一段 GitHub 地址时，遇到了一个奇怪的现象： 1^[[200~https://github.com/microsoft/markitdown.git~ 好好的链接前后突然多了 ^[[200~ 和 ~。这到底是什么？会不会把命令弄坏？本文用最通俗的语言把原因、影响以及避免方法一次讲清。 1 现象还原步骤我的操作 ① 在网页上复制了地址 https://github.com/microsoft/markitdown.git ② 回到终端，先按了 Ctrl+V ③ 发现没反应，又右键选择 Paste ④ 终端里出现 ^[[200~https://github.com/microsoft/markitdown.git~ 2 罪魁祸首：终端的“括号粘贴模式”现代终端（Linux 的 gnome-terminal、macOS 的 iTerm2、Windows 的 Windows Terminal、VS Code 的内置终端等）都支持一项叫 Bracketed...

操作系统-物理机带显卡安装Ubuntu操作系统.md

发表于2025-08-11|学习

双系统安装Ubuntu时NVIDIA显卡驱动问题的完整解决方案问题背景许多用户在Windows系统基础上安装Ubuntu双系统时，会遇到由于NVIDIA显卡驱动不兼容导致的安装界面卡死或黑屏问题。这种情况通常发生在使用较新NVIDIA显卡的电脑上，原因是Ubuntu默认使用的开源驱动nouveau与部分NVIDIA显卡存在兼容性问题。问题根源分析Ubuntu安装程序默认使用开源显卡驱动nouveau来提供图形界面支持。虽然这个驱动对大多数显卡都能提供基本支持，但在以下情况下可能出现问题：较新的NVIDIA显卡架构可能尚未被nouveau完全支持某些显卡功能（如电源管理）在nouveau中实现不完善 NVIDIA专有驱动和开源驱动之间的冲突这些问题会导致安装过程中图形界面崩溃，表现为卡在Ubuntu...

循环、迭代器、生成器

发表于2025-05-23|学习

一、循环（Loop）本质循环是一种控制结构，用于重复执行代码块。它本身不是数据结构，而是一种语法机制。常见形式123456789# 1. for 循环（遍历可迭代对象）for item in [1, 2, 3]: print(item)# 2. while 循环（基于条件）i = 0while i < 3: print(i) i += 1 适用场景需要重复执行相同或相似的操作遍历容器中的元素（如列表、字典）实现需要终止条件的逻辑（如用户登录验证）优势简单直观，易于理解和使用适用于大多数重复操作场景劣势当处理大量数据时，可能占用大量内存（如生成全量数据列表）无法暂停或恢复执行流程二、迭代器（Iterator）本质迭代器是实现了迭代器协议的对象（即包含 __iter__() 和 __next__() 方法）。它是一种数据访问方式，允许你按需逐个访问元素。核心方法 __iter__()：返回迭代器自身 __next__()：返回下一个元素，若没有元素则抛出 StopIteration 异常示例1234567my_list =...

RAG-什么是RAG

发表于2025-05-21|RAG

...

RAG-向量模型选择

发表于2025-05-21|RAG

引言在检索增强生成(Retrieval-Augmented Generation, RAG)系统中，向量模型的质量直接决定了系统的检索效果，进而影响最终生成内容的相关性和准确性。本文将深入探讨如何评估和选择适合RAG系统的向量模型,如有不足请指正。一、向量模型的核心作用向量模型(嵌入模型)在RAG系统中承担着将文本转化为数值向量(嵌入)的关键任务，其质量影响以下核心环节：语义表示能力：决定模型是否能准确捕捉文本的深层含义检索相关性：影响系统找到与查询最相关文档的能力计算效率：直接影响系统的响应速度和资源消耗领域适应性：决定模型在特定领域的表现效果二、主流向量模型类型1. 通用预训练模型示例：OpenAI的text-embedding-ada-002、Cohere的embed-english-v3.0 特点：在大规模通用语料上预训练，适合大多数通用场景优势：开箱即用，无需额外训练 2. 领域专用模型示例：BioBERT(生物医学)、Legal-BERT(法律) 特点：在特定领域数据上训练或微调优势：在专业领域表现更优 3....

LLM-长文本问题

发表于2025-05-21|LLM

引言随着大语言模型(LLM)的广泛应用，处理超长文本输入已成为开发者面临的常见问题。当文本长度超过模型的上下文窗口限制（如GPT-4的32k token或Claude的100k token），或者即使长度未超限但内容过于复杂时，都需要特殊的处理策略。本文将分析现有解决方案，评估其适用场景，并介绍前沿的处理技术。(部分内容由大模型总结，请谨慎辨别) 一、长文本处理的核心挑战1. 技术限制上下文窗口限制：主流模型的token上限 graph LR A[模型类型] --> B[GPT-4-32k] A --> C[Claude-100k] A --> D[LLaMA2-4k] 注意力机制开销：Transformer的O(n²)复杂度信息衰减现象：模型对中间位置内容理解较弱 2. 业务影响关键信息丢失：超出窗口部分被截断语义连贯性破坏：拆分导致上下文断裂推理质量下降：复杂论证难以维持二、现有解决方案深度评估1. 检索增强生成(RAG)技术实现： 123456789101112131415from langchain.embeddings import...

LLN-训练与微调

发表于2025-05-21|LLM

为什么需要多种微调方法？在大模型应用落地的过程中，预训练后的微调(Fine-tuning)是使模型适应特定任务的关键环节。随着技术的发展，研究者们提出了从传统的监督微调(SFT)到基于人类反馈的强化学习(RHLF)，再到最新的直接偏好优化(DPO)等一系列方法。本文将系统解析6种主流微调技术的工作原理、适用场景及实践要点，根据具体需求选择最佳方案。一、基础方法：监督微调(SFT)1.1 技术原理**监督微调(Supervised Fine-Tuning)**是最基础的微调方法，使用标注数据集通过标准交叉熵损失进行训练： 1L_SFT = -Σ log P(y|x;θ) 其中(x,y)是输入-输出对，θ是模型参数。 1.2 典型流程准备高质量标注数据在预训练模型上继续训练使用学习率衰减策略（如cosine衰减） 1.3 优缺点分析优势：实现简单，计算成本低对小规模数据适应良好可复用传统NLP训练流程局限：依赖大量标注数据容易过拟合无法学习复杂偏好适用场景：任务明确、有充足标注数据的领域适应二、高效微调技术：参数高效微调(ReFT)2.1...

显存计算

发表于2025-05-21|LLM

了解大模型的显存占用在大型语言模型(LLM)领域，经常看到”7B”、”13B”、”70B”这样的参数规模描述，这些数字直接关系到模型运行所需的显存资源。对于开发者、研究人员和AI应用部署者来说，准确计算模型显存需求是：硬件采购的基础部署方案设计的依据模型选择的关键因素性能优化的起点本文将系统性地解析大模型显存占用的计算方法，包括全精度加载和量化加载的不同场景。一、基础概念：模型参数与显存的关系1.1 参数量的表示方法 1B参数 = 10亿(1,000,000,000)个参数常见模型规模： 7B (70亿，如Llama 2-7B) 13B (130亿，如Llama 2-13B) 70B (700亿，如Llama 2-70B) 1.2 参数数据类型与显存占用现代大模型通常使用以下数据类型：数据类型位数字节数常见用途 FP32 32 4 全精度训练 FP16 16 2 混合精度训练/推理 BF16 16 2 训练(动态范围更大) INT8 8 1 量化推理 INT4 4 0.5 极端量化二、全量加载显存计算2.1...

RAG-Chonkie实践理解分块

发表于2025-03-31|RAG

在构建高效的检索增强生成（RAG）系统时，文本分块（Chunking）是决定系统性能的关键预处理步骤。今天我们将深入探讨文本分块的重要性，并详细解析Chonkie库提供的五种分块方法，帮助开发者选择最适合自己场景的分块策略。一. 为什么文本分块如此重要？在RAG流程中，分块是数据预处理的核心环节，直接影响：检索精度：过大的块会引入噪声，过小的块丢失上下文。生成质量：LLM需要连贯的上下文理解用户查询。计算效率：合理分块减少无效计算。错误分块的典型问题案例1：将“巴黎是法国的首都。柏林是德国的首都”切分为： Chunk1: “巴黎是法国的首都。柏林” Chunk2: “是德国的首都” → 检索“德国首都”时可能漏检Chunk1。案例2：将一篇学术论文的“方法论”和“结论”合并为一个块→ 检索具体方法细节时引入无关信息。二、Chonkie的五种分块方法详解1....