全部标签

新闻资讯

🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 8
- 0
charles25年6月20日
「LLM企业实战03」三大引擎对决：Ollama、Xinference与VLLM服务框架实测

一、硬件就位，模型如何高效“跑起来”？上一篇我们详细讨论了 LLM 私有化部署的硬件选型，搞定了算力基础。但光有硬件还不够，我们需要一个“引擎”——也就是 LLM 服务框架——来负责加载模型、管理资源、接收用户请求，并高效地把模型的计算能力转化成实际的服务。市面上这类框架有不少，选择哪个直接关系到你的 LLM 应用的性能、成本和部署维护的复杂度。本篇将重点对比几个我们实践中接触较多或社区热门…
前沿技术
- 80
- 0
charles25年6月20日
MCP很好，但它不是万灵药！真正的技术进步，往往始于祛魅之后的清醒认知

作者：boyang 人人都在聊MCP，但人们口中的MCP往往只是一个拼凑而成的幻影。如今，各大厂商纷纷为它镀金包装，就像硅谷创投圈每隔几年就热炒一次的那个“改变世界”的万能工具。然而，当最初的狂热稍退，我们不得不面对更复杂的问题：MCP真的适用于所有场景吗？它是否被赋予了过高的期待？技术史上从不缺少“神话”，而真正的进步，往往始于祛魅之后的清醒认知。当下AI领域最炙手可热的概念，莫过于MCP。MC…
前沿技术
- 6
- 0
charles25年6月20日
从0到1落地一个RAG智能客服系统

目录项目背景技术怎么选？LangChain、dify、Coze、百炼都试了数据预处理：说明书+聊天记录怎么搞 Prompt设计那些事：写得好像编程一样重要 Agent流程设计：多机器人协作才靠谱测试与评估：效果咋样？问题在哪？遇到的坑 & 接下来要干啥？ 1️⃣ 项目背景：我们为啥要做这个？过年的时候DeepSeek火了，年后老板提出要做智能客服的项目。（主要是大模型api价格…
RAG技术
- 5
- 0
charles25年6月20日
万字长文深入浅出教你优雅开发复杂AI Agent

作者：walli 在 AI Agent 浪潮席卷行业的当下，高效优雅开发具备复杂推理与协作能力的智能体成为业界焦点。本文将系统梳理 AI Agent 核心理念、主流协议与思考框架，并结合 Golang 生态工程化框架，深入剖析多 Agent 协作系统的设计与落地。QQ 官方 AI 伙伴小 Q 已基于 A2A+MCP 升级 Agent 架构，完成图片清晰化、扩图等能力接入，有效提升开发效率与系统稳…
前沿技术
- 7
- 0
charles25年6月20日
首次揭秘！腾讯多模态OCR大模型最新技术演进：没有最强OCR，只有无限进化！

👉目录 1 技术演进 2 领域进展 3 技术要点 4 文档智能 5 实测体验在各行业加速智能化转型的进程中，OCR技术（即光学字符识别，一种将图像中文字转化为可编辑文本的AI技术，在文档处理、办公自动化、交通出行、教育、医疗、金融等领域应用广泛。）一直扮演着重要的角色。正所谓“金无足赤”，随着业务场景日益复杂与需求多样化，传统OCR的局限性也逐渐成为制约企业转型发展的瓶颈。从技术层面看，传统 O…
前沿技术
- 4
- 0
charles25年6月20日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 7
- 0
charles25年6月20日
AI识图，提取标题、点赞等数据，哪家效果好？

前两天，我们团队小伙伴一直在获取蝴蝶号的一些数据。主要用的是传统的一些方法。搞完后我突然想起来，获取数据这件事，能不能用AI识图的功能来做呢?毕竟，目前能展示到屏幕上的数据，都能够被AI看到。获取数据需要下拉、翻页，这不是障碍：要么手动截图，要么录屏之后自动截图，这整个过程也可以自动化。我在前一篇文章《强得怕了！用Kimi批量识图+生成Excel表，3分钟找出这10个被验证的AI商业化项目》里面，…
前沿技术
- 13
- 0
charles25年6月20日
刚上线的大模型应用，为什么总是出现报错？

林凯迪 IBM 科技事业部自动化技术专家这是企业在 AI 应用时面临的非常普遍的一个问题。主要问题在于企业的运维是滞后于开发的。虽然企业看到了生成式 AI 的价值，并快速在内部部署了大模型，上线了应用，但是企业团队并没有适应这种新技术，同时也缺少相应的工具去发现问题和解决问题，因此企业在实际使用过程中可能会遇到 API 报错，响应特别慢的情况，导致新应用的实际使用…
前沿技术
- 6
- 0
charles25年6月20日
Andrej Karpathy：对于AI Agent的安全风险，我也束手无策

当我们还在想方设法的让 AI Agent 为我们多干活的时候，有人已经看到了下一层。 Agent是否安全。今天 Andrej Karpathy 在 X 上又发一贴，表明了他对 AI Agent 的态度：不敢用！他在贴中用了一个比喻来形容现在 AI Agent 的状态。就像早期的计算机系统一样，充满了各种病毒，但缺乏有效的防御措施。正因为没有防护，导致他不敢广泛使用 AI Agent。他还…
前沿技术
- 5
- 0
charles25年6月20日
构建生产级GenAI系统：来自海外500+真实企业级大模型案例研究的经验教训

在生成式AI和大语言模型快速发展的技术浪潮中，一个问题主导着所有技术讨论："企业究竟是如何在生产环境中实施这些系统的？" 研究论文与生产实际之间的鸿沟依然巨大。虽然关于微调LLM或构建基础RAG应用的教程数不胜数，但很少有资源记录企业如何将这些系统扩展到服务数百万用户、维持高性能并提供可靠结果。为了填补这一知识空白，编译了迄今为止最大的真实GenAI和LLM系统设计案…
前沿技术
- 5
- 0
charles25年6月20日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 6
- 0
charles25年6月20日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 6
- 0
charles25年6月20日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 7
- 0
charles25年6月20日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 7
- 0
charles25年6月20日
不依赖于复杂框架，用简单易懂的实现教你二十三种RAG技巧！

在人工智能领域，检索增强生成(Retrieval-Augmented Generation, RAG)技术正成为连接大型语言模型(LLMs)与现实世界知识的桥梁。RAG技术通过在生成过程中引入外部知识检索，有效解决了LLMs的"幻觉"问题，提高了回答的准确性和时效性。本文将带你深入了解一个专注于RAG技术的开源项目，该项目以通俗易懂的方式实现了20多种RAG技术，全部使用Py…
RAG技术
- 7
- 0
charles25年6月20日
AI的认知象限：浅谈一下我们与AI的边界

最近，无论是工作上的数据分析，还是生活中的菜谱教程，我的第一反应往往不是去翻书或者查搜索引擎，而是习惯性地打开AI对话框，它似乎比我更了解这个世界，甚至比我更了解我自己。但事实真的如此吗？AI的边界究竟在哪里？它知道什么，我们又知道什么？今天聊聊关于AI的“认知象限”，或许能对你有所启发。第一象限：我知道且AI知道 (Known by Me, Known by AI) “我知道且AI知道”是我…
前沿技术
- 5
- 0
charles25年6月20日
RAG 知识库核心模块全解（产品视角 + 技术细节）

“关于知识库这块，你有什么能讲的吗？”我一脸懵逼，数据咋清洗，数据格式咋定的不是刚说完吗？？🤔复盘了一下，感觉应该是想问下面这些 🧱 1. 文档切分策略（切得好，才能召回准） 🌟 目标：把长文档切成合适的语义段，既能保证上下文连贯，又不超出 token 限制。 📌 常见策略：策略描述优点缺点固定窗口 + 重叠每 N 词/句切一段，前后有部分重叠实现简单、信息不漏语义断裂、冗余多 …
RAG技术
- 4
- 0
charles25年6月20日
从模板到指标服务：解锁AI时代的数据新可能

点击关注“有赞coder” 获取更多技术干货哦～作者：家龙部门：数据中台一、背景随着公司业务不断地发展，我们推出了众多数据产品以满足商家在各种经营场景下的数据分析需求，然而，这些数据产品在应对复杂用户问题时，仍然缺乏足够的便捷性和灵活性。为此，我们尝试结合大语言模型（LLMs）构建交互式智能问答类的数据产品。然而，当数据产品与AI结合后，传统的烟囱式开发模式，即为满足各自数据产品需求的定制化开…
前沿技术
- 9
- 0
charles25年6月20日
Al代码审查实践：从构想到快速落地

📝 初衷年初，随着 DeepSeek 的爆火出圈，相信大家一定脑暴过各种利用 LLM 的创新应用场景。在这场技术浪潮中，我们团队内部也在积极规划探索 AI 能在现有研发流程中带来哪些助力，但同时考虑到目前行业飞速进化的趋势，大致明确了几个探索原则： 🌟 核心原则快速行动，持续验证：做思想上的巨人，行动上的实践者，有想法就积极行动尝试；注重投入产出比：中小型公司不要去卷底层技术和平台建设，最…
前沿技术
- 6
- 0
charles25年6月20日
英语，是AI时代最重要的编程语言

最近看了前特斯拉AI总监Andrej Karpathy的一个演讲，分享他对AI时代的思考。听完之后我觉得，这可能是我今年听过最有启发性的技术分享了。软件的三次进化：从写代码到说人话 Karpathy提出了一个很有意思的观点：软件其实经历了三个阶段的进化。第一阶段（Software 1.0）就是我们熟悉的传统编程——写Python、Java、C++这些代码，告诉计算机一步步该干什么。这套玩法其实…
前沿技术
- 7
- 0
charles25年6月20日
AI智能地址识别实践：小帅的优化日记

无趣的早上这个男人叫小帅。拎着半杯冰美式晃进工位，键盘还残留着上周五的瓜子碎。他优雅地按下开机键，正准备点开《程序员养生指南》。有个声音不合时宜的响起："你的地址解析又双叒叕崩了！" 这个女人叫小美。踩着红色高跟鞋由远及近，混有YSL黑鸦片香水与瑞幸椰云拿铁的硝烟味破门而入时，隔壁大壮默默扣上了防噪耳机。 "三里屯能识别成三亚度假村" 小帅戳着空格键上…
前沿技术
- 6
- 0
charles25年6月20日
🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 5
- 0
charles25年6月20日
Cursor-Agent 实战：构建端到端自动化取数工具的探索与思考

在数据驱动的时代，快速、准确地获取数据是企业决策和业务发展的基石。然而，对于许多技术团队而言，日常的取数工作往往充满了挑战，耗时耗力。我们团队也曾深陷其中，直到开始探索 AI Agent 在这一领域的应用，特别是通过实践 Cursor-Agent，我们看到了一条从手动取数到自动化"数据大师"的进化之路。 1. 取数之痛与 LLM 的"未尽全功"？ 1.1 …
前沿技术
- 12
- 0
charles25年6月20日