全部标签

模型微调

本地部署大语言模型

1. 部署方式本地部署可以直接下载模型文件和源代码，打开安装包之后直接运行，也可以使用框架部署。本次使用的是第二种，使用ollama部署大语言模型。2. ollama下载根据自己用的操作系统选择对应的ollama安装包，直接选择windows下载即可。下载地址：官网下载链接：https://ollama.com/download/OllamaSetup.exeGithub链接：…
前沿技术
- 2
- 0
charles5月2日
AI编程如何挑选合适的大模型？4个阶段+6个建议

你是不是也遇到了这样的烦恼？想用AI帮你写代码、开发个App或者网站，结果发现市面上有这么多AI模型（什么GPT、Claude、Gemini、DeepSeek……），看得眼花缭乱，不知道该选哪个。随便试了一个，感觉好像有时候挺好用，有时候又“笨笨的”，答非所问，甚至还会“忘记”你之前跟它说过什么。比方说我自己，之前一直在用Claude3.7，结果最近几个项目发现它又不行了，一些跑了几次都失败的操…
前沿技术
- 1
- 0
charles5月2日
从workflow到ReAct提升AI Agent智能化水平

本号之前文章中介绍了用dify工具实现的针对故障拍照进行智能检索的运维神器，这个案例中Agent是使用典型的workflow方式配置出来的，“先进行OCR，然后检索知识，最后生成答案”这个执行步骤是我们预先定义好的，包括网上很多Agent文章中描述大多也和我们这个案例类似，但这似乎和AI Agent的标准定义还是有差距，我们先随便找个大模型，问问AI Agent的标准定义大概如下：AI Agent…
前沿技术
- 0
- 0
charles5月2日
冯·诺依曼架构和层级架构对构建通用agent的启示

最近在实现类似Manus系统的时候有一种无力感，之前已经尝试过多agent架构和现在的模块化的agent loop模式。但总是有种哪里不对劲的地方，这个感觉很微妙，目前所接触到的思路似乎都没有触及到一些更深层次的东西。晚上躺在床上，忽然灵感闪现，是否现在的agent状况和冯诺依曼架构出现之前的计算机的境况类似呢？从《万物原理》一书又能对当前的agent有何启示，我在考虑这个问题。冯·诺依曼之前的计…
前沿技术
- 0
- 0
charles5月2日
阿里云大模型训练与推理开发

本文主要描述阿里云大模型开发环境的搭建、训练数据集的制作流程、大模型如何训练数据集以及如何利用已训练完成的模型执行推理。与阿里云一起轻松实现数智化让算力成为公共服务：用大规模的通用计算，帮助客户做从前不能做的事情，做从前做不到的规模。让数据成为生产资料：用数据的实时在线，帮助客户以数据为中心改变生产生活方式创造新的价值。开发环境搭建ModelScope社区是阿里云通义千问开源的大模型开发者社区。如…
前沿技术
- 0
- 0
charles5月2日
教你如何10分钟内批量制作上万条大模型微调数据集

上个月上线了【运维大模型课】，最近一直忙着整理讲义和录课，所以公众号文章发的都少了。课程目前已更新21小节，目前保持周更的频率。除了跟大家简单汇报下课程进度外，还想分享一个超赞的工具。我相信所有做大模型微调的朋友，一定会为如何制作数据集发愁，尤其是想把自己专属的文档（如word、txt等）转换成符合要求格式的数据集。今天的主角就是这个开源的大模型微调数据集创建工具：Easy Dataset（htt…
前沿技术
- 0
- 0
charles5月2日
Cline v3.15 版本更新与亮点

18 项新功能，10 项更新，5 项修复这次 Cline v3.15 版本做了这么多的改动，用官方的文章里的话来说：要让 Cline 更好地成为你的“日常主力工具”（daily driver），让你的使用体验更顺畅、更精进。以下是当前版本所有内容的更新：以下是一些主要的改进：1. No more focus stealing!（不再抢占焦点！）：优化文件编辑时的用户交互流畅性它解决了用…
前沿技术
- 1
- 0
charles5月2日
得物自研DSearch3.0搜索核心引擎升级之路

目录一、背景二、引擎开发技术方案 1. DSearch1.0索引层整体结构 2. DSearch2.0的索引升级 3. DSearch3.0搜索核心升级三、性能和效果提升四、总结一背景随着交易和社区搜索业务稳步快跑，基建侧引擎越来越复杂，之前搜索底层索引查询结构已经存在较为严重的性能瓶颈。成本和运维难度越来越高。在开发效…
前沿技术
- 0
- 0
charles5月2日
国内首个AI IDE：用Trae开发会是怎样的感觉

上网的人知道：AI替代程序员。不写一段代码，完全用AI做项目。本来我是不信的，这不，字节跳动发布了国内首个AI原生IDE，它就是Trae。我看到了几个关键词，国内，首个，AI，IDE。那我就很感兴趣啦，还是字节的，嗯，字节我注册过它家的账号，那必须要用用它了！下载安装就不说，很简单，能看到这里的人都会。打开后，界面。。。咦，这不是vscode吗？好吧，我知道了。还是有一点点失望，不过没关系。那么…
前沿技术
- 2
- 0
charles5月2日
简单指令让Cursor生成高质量代码

一、如何使用简单指令生成高质量代码Cursor/Windsurf/Augment/RooCode/Cline 等工具能够快速生成代码，但是如何保证代码简单可靠，并且方便维护，我们可以使用一下简单的指令达到效果。指令Prompt如下：你是一个优秀的技术架构师和优秀的程序员，在进行架构分析、功能模块分析，以及进行编码的时候，请遵循如下规则：1. 分析问题和技术架构、代码模块组合等的时候请遵循“第一性原…
前沿技术
- 0
- 0
charles5月2日
CherryStudio配置本地Ollama连接使用本地mistral对话模型和bge-m3嵌入式模型

在昨天的文章中已经讲了如何从Ollama官方网站下载、安装Ollama软件，并配置Windows环境变量，放开防火墙端口等，最后再下载运行了“mistral-small3.1”模型（该模型具备LLM推理对话、vision、tools功能），以及“bge-m3”模型（该模型是嵌入式模型，可用于知识库）。现在万事俱备只欠东风，我们就来看看如何配置Cherry Studio这种直接与用户打交道的“AI助…
前沿技术
- 11
- 0
charles5月2日
Cursor 中 Gemini2.5 Pro 编程能力测试

Cursor 中 Gemini2.5 Pro 编程能力测试我之前已经测评过 Agrment code 这个工具，用下来很方便，重点是可以和 vs code 原生结合，这个是 Cursor 提到不了的。之前一直听说 Gemini2.5 的编程能力很厉害，但是用起来很贵；所以也一直没有尝试，结果今天发现 gmail 邮箱里面多了一个 Gemini2.5 试用邀请。这要是不去用一下，那就太不…
前沿技术
- 1
- 0
charles5月2日
OpenAI API JSON格式指南与json_repair错误修复

核心参数是response_format={"type": "json_object"} ,其他支持json调用的模型也可以这样使用的，下面我们以Openai模型为例指定OpenAI API返回JSON格式基本JSON格式响应示例import openaiclient = openai.OpenAI(api_key="your…
前沿技术
- 2
- 0
charles5月2日
Qwen3 与 ollama 兼容性问题

新模型出来后需要和 Ollama 做适配，比如v0.6.0版本后才开始支持 Gemma3，之前的版本无法运行 Gemma3。同时新版本的 ollama 对 gblic 版本有要求，在 CentOS 7 等版本上无法运行新版本的 ollama。推荐的运行环境是 Ubuntu 22.04 或 Ubuntu 24.04 等新出的 Linux 发行版，他们自带的 glibc 版本比较高，对新模型和Nvid…
前沿技术
- 1
- 0
charles5月2日
最高节省75%的Token成本，Gemini 2.5模型上线隐式缓存

2024年5月，Gemini API上线了上下文缓存功能。能在重复场景下节省75%的token成本。其实像国内的DeepSeek早就有类似的缓存模式。不过之前需要手动设置缓存，流程略显繁琐。昨天，Gemini 2.5模型带来了更聪明的“隐式缓存”功能，让省钱这件事更加简单。什么是隐式缓存？简单说，就是你不用再自己建缓存，Gemini API系统内部会自动帮你判断哪些内容可以省钱。只要你的请求和之前…
前沿技术
- 1
- 0
charles5月2日
软件公司如何为AI的下半场做准备？

姚顺雨先生的文章《The Second Half》详细阐述了人工智能（AI）发展的“下半场”战略转变。姚顺雨在2024年8月份加入的OpenAI，担任研究科学家，本科毕业于清华大学的“姚班”，，博士毕业于普林斯顿大学。文章核心观点如下：从“训练模型”转向“定义任务”：在AI发展的上半场，研究重点集中在开发新的训练方法和模型，如Transformer、深度强化学习和大规模预训练模型，推动了AI在多个…
前沿技术
- 0
- 0
charles5月2日
Cursor 0.50 来了！

Cursor 0.50 版本已经上线。这次更新带来了更简单的定价方式、全新的 Max Mode、后台 Agent，并且对编辑体验和多项目管理做了优化。统一的定价模式现在，所有模型的使用都采用统一的请求计费方式。Max Mode 也采用了基于 token 的计价。高级工具调用和长上下文模式已经移除。用户可以在仪表盘查看所有用量，方便管理和追踪支出。详细内容可以在官方文档[1]中查看。Ma…
前沿技术
- 1
- 0
charles5月2日
Cursor0.50重磅更新，离AI原生IDE更近一步，处理复杂项目能力大幅提升

Cursor今天发布了0.50的更新，是个相当大的版本修改，还挺值得关注的，我对信息做了进一步的梳理，整理了一个更清晰易读又完整的网页：cursor05.bookai.top简单来说，Cursor 0.50 版本有计费模式的调整，有Max Mode能力的提升，还引入了很特别的工作流程（Background Agent），我觉得这是Cursor 向「AI 原生 IDE」进化的一个重要节点。以下是本次…
前沿技术
- 1
- 0
charles5月2日
5分钟发布你自己的MCP服务

N8N手把手入门系列（4.3）：5分钟发布你自己的MCP服务开篇前几篇我们已经把N8N生态下如何使用MCP的各种方法讲差不多了。总是调用别人的MCP服务，能不能我们自己写个MCP给别人提供服务呢？这在N8N环境下其实也非常简单，让我们快速上手试下。• 4.1 N8N官方MCP接入指南• 4.2 N8N社区MCP Client节点使用指南• 4.2.1 N8N接入MCP之社区方案…
前沿技术
- 1
- 0
charles5月2日
DeepSeek与腾讯携手：让AI训练提速的通信优化幕后故事

大家有没有想过，我们现在用得越来越顺手的AI大模型，比如能写代码、画图、跟你流畅聊天的那些“智能体”，它们是怎么被训练出来、又怎么能飞快地给出响应的？这些模型实在是太太太庞大了！它们的参数量动辄几千亿、上万亿，如果只用一台电脑（哪怕是配备了最强GPU的电脑），根本不可能装下整个模型，更别提在合理的时间内完成训练或推理计算了。这就像要建造一座宏伟的城市，或者管理一个国家，一个人单打独斗是…
前沿技术
- 1
- 0
charles5月2日
a16z最新分享：AI时代的9大新兴开发模式

AI正在深刻改变产品传统的开发方式，这个进度远超你想象。此前，YC管理合伙人贾里德·弗里德曼透露：W25中，1/4的创业公司，用AI生成代码库。随着越来越多AI编程工具的崛起，AI已经不仅仅是开发者编写代码的工具，甚至成为软件构建的基础设施。不久前，a16z就发布了一篇文章关于AI变革软件开发模式的文章。文章里探讨了9种新兴的开发模式，这些模式很好地切准了用户的痛点，虽然它们仍然处于起步阶段，但未…
前沿技术
- 0
- 0
charles5月1日
MCP 规范新版本特性全景解析与落地实践

更新MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释。2025-03-26 版本与 2024-11-05 版本的主要更新对比表格：类别2024-11-05 版本2025-03-26 版本更新意义与影响授权机制基于 OAuth 2.0，支持隐式授权流和基本权限控制升级至 OAuth 2.1，废弃隐式授权流，强制 PKCE 和 HTTP…
前沿技术
- 0
- 0
charles5月1日
OpenAI强化微调终于上线了：几十个样本就可轻松打造AI专家

分享一个好消息！还记得去年12月就提过的强化微调（Reinforcement Fine-Tuning, RFT）吗？现在，它正式登陆 OpenAI o4-mini 模型了！简单说，RFT 就是用思维链推理和任务专属的评分机制来提升模型在特定复杂领域的表现，可以将AI模型从高中学生水平轻松提升到了专家博士水平。通过强化微调，你可以轻松将模型的某一个领域的…
前沿技术
- 1
- 0
charles5月1日
以 DeepSeek-V3为例，理解 Pre-train 和 Post-train

本文以 DeepSeek-V3 为例，带你看懂一个大模型从「什么都不会」到「聪明得体」的全过程，也彻底搞清楚两个关键概念：Pre-Train（预训练）是啥Post-Train（后训练）又是干嘛的一、预训练：用海量数据打下通识能力的底子预训练是使用大规模未标注语料，训练语言模型在无指令、无任务的前提下学会建模自然语言的概率分布，进而获得通用语言理解与生成能力。1）它解决的问题是：- 模型如何预测下一…
前沿技术
- 1
- 0
charles5月1日