LLM
内容介绍
TIP
深入探讨PyTorch、TensorFlow框架在大规模语言模型(LLM)领域的应用与优化,为读者提供前沿的技术洞见和实用的开发经验。
数据统计
95 文章 · 78 订阅
文章列表
浏览器跨域窗口通信技术调研:window.open 与 postMessage
浏览器跨域窗口通信技术调研:window.open 与 postMessage 一、核心结论 同源策略是浏览器安全底座:不同源页面之间不能随意读写 DOM、Cookie、localStorage 或 ...
📊 136 阅读 · 4 点赞 · 0 评论 · 5 收藏
📅 2026-05-22 🏷 前端
如何让 Claude Code 给整个项目做一次“产品级代码审查”?一个 prompt 搞定
五一节后回来,看到马斯克租赁算力,助力 Claude Code 额度增加,大喜! 既然额度放开了,那第一反应肯定是:不能浪费。 对于之前的多个项目进行梳理总结,形成一个「让 Claude Code 给...
📊 190 阅读 · 2 点赞 · 0 评论 · 3 收藏
📅 2026-05-08 🏷 人工智能
有点东西!16GB Mac 都能跑的 OpenAI 开源模型? gpt-oss-20b-tq3 惊艳!
May 7, 2026,昨天,我刷到 Hugging Face 上一个很离谱的模型: gpt-oss-20b-tq3 它本质上是 OpenAI 开源的 GPT-OSS-20B,被社区重新做了一层 Tu...
📊 342 阅读 · 2 点赞 · 0 评论 · 1 收藏
📅 2026-05-08 🏷 人工智能
谁才真正拥有 Agent Loop?从 OpenClaw、Claude Code 到 LangGraph、Temporal 的一次工程级拆解
过去一年,“Agent”这个词被说得太轻了。 很多系统只要能 调用工具 + 多轮推理,就被称为 Agent。真正做过工程落地的人很快会发现: 👉 绝大多数所谓 Agent Loop,只是“推理循环”,...
📊 240 阅读 · 1 点赞 · 2 评论 · 2 收藏
📅 2026-04-28 🏷 人工智能
ZeroClaw 社区风评冷思考:哪些是真口碑、哪些是 SEO 在叠 buff
写这个系列绕不开一个话题:ZeroClaw 到底口碑怎么样? 老实说,调研一圈下来,第一直觉是"被讨论得过头了"。30K Star 的项目当然是真火,但围绕它的中英文内容生态,泥沙俱下到一个让人警觉的...
📊 170 阅读 · 1 点赞 · 2 评论 · 0 收藏
📅 2026-04-27 🏷 人工智能
10 分钟跑通一个 ZeroClaw Telegram 助手(最小可用清单)
前面几篇都在讲架构和安全,这篇直接动手——把 ZeroClaw 跑成"一个能在 Telegram 群里用的小助手"。10 分钟够用,但前提是你有 Rust 工具链。 0. 环境准备 需要的东西: Ru...
📊 106 阅读 · 1 点赞 · 0 评论 · 1 收藏
📅 2026-04-27 🏷 人工智能
ZeroClaw 的安全模型:四层沙箱 + 默认拒绝是怎么叠出来的
把 LLM 接到 shell、文件系统和网络上,本质上就是给一个会幻觉的实习生发 root。ZeroClaw 在安全上踩了几个比同类框架更保守的默认值,这一篇把它的安全模型分四层讲清楚。 第 0 层:...
📊 104 阅读 · 1 点赞 · 0 评论 · 1 收藏
📅 2026-04-27 🏷 人工智能
ZeroClaw vs OpenClaw:把"-99% 内存"那张图拆开看
宣传海报上"内存只有 OpenClaw 的 1/200、启动快 400 倍"看着很爽,但凡是宣传图,都值得一项一项拆。这篇就把官方对比里真有数据支撑的和水分较大的部分分开讲。 一、确实站得住的差异 1...
📊 137 阅读 · 1 点赞 · 0 评论 · 0 收藏
📅 2026-04-27 🏷 人工智能
拆 ZeroClaw 架构:四个 Trait 撑起一个 Agent 运行时
上一篇科普里提过,ZeroClaw 的核心是四个 Rust Trait:Provider / Channel / Memory / Tool。这一篇把它们一个个拆开,看看一个"Rust Trait 驱...
📊 93 阅读 · 1 点赞 · 0 评论 · 0 收藏
📅 2026-04-27 🏷 人工智能
ZeroClaw 是什么?一个 Rust 写的"轻量级 AI Agent 运行时"完整科普
一句话先讲清楚 ZeroClaw 是一个用 Rust 写的 AI Agent 运行时,定位是"OpenClaw 的极致轻量替代"。整个项目最终产物就是一个二进制文件:你给它一份配置,它就能把 LLM ...
📊 258 阅读 · 1 点赞 · 0 评论 · 3 收藏
📅 2026-04-27 🏷 人工智能
林俊旸从阿里离开后首度发声:推理模型的时代快结束了
林俊旸从阿里离开后首度发声:推理模型的时代快结束了 一、全文翻译 过去两年重塑了我们评估模型的方式和对模型的期望。OpenAI的o1证明了「思考」可以成为一种核心能力——一种你专门训练并向用户开放的能...
📊 4415 阅读 · 30 点赞 · 2 评论 · 31 收藏
📅 2026-03-27 🏷 人工智能
为什么 WebGPU 也能跑大模型?多维度对比 4 种跑大模型方式
大模型推理本质就是矩阵计算,谁能提供 GPU 计算能力,谁就能跑。 WebGPU 是什么? WebGPU = 浏览器里的 GPU 计算接口(类似 CUDA / Metal 的 Web 版) 所以:...
📊 197 阅读 · 3 点赞 · 1 评论 · 0 收藏
📅 2026-03-25 🏷 人工智能
国内龙虾生态图谱:谁在做入口,谁在做技能,谁在做场景落地(v2026.3.18)
时至今日,你司要是不养龙虾,那真的是 —— (这里征集一句歇后语) 回到本文,3 月 18 日,来看看,国内龙虾,到底谁强? 底层仍然是 OpenClaw 这类执行型 Agent 框架,中间层是 Sk...
📊 613 阅读 · 5 点赞 · 0 评论 · 4 收藏
📅 2026-03-18 🏷 人工智能
llama.cpp、Ollama、LM Studio:背后是谁在做?为什么会出现?要什么机器才能跑?
书接前文,很多人把这三个当成“工具对比”。其实更有意思的是:👉 它们代表三种完全不同的力量来源,一边是纯工程黑客,一边是开发者平台,一边是产品化团队。 一、llama.cpp:个人工程师,把大模型...
📊 594 阅读 · 2 点赞 · 0 评论 · 3 收藏
📅 2026-03-18 🏷 人工智能
本地模型怎么玩?把 .GGUF 丢 进 LM Studio 跑起来
本篇分享、介绍的是: 👉 把模型转成 GGUF → 丢进 LM Studio → 直接聊天 or 当 API 用 一、先搞清楚:为什么一定是 GGUF 如果你用过 llama.cpp 或本地推理工具,...
📊 1721 阅读 · 4 点赞 · 0 评论 · 2 收藏
📅 2026-03-17 🏷 人工智能
实战经验帖:本地跑 Qwen3.5 踩过的坑
最近在折腾一套本地 AI 工作流(数字员工 / MCP / Agent 自动化),从一开始盲目追大模型,到最后收敛到合理方案,中间踩了不少坑,本篇记录分享,各位注意规避。 一、第一坑:以为有 32B,...
📊 1240 阅读 · 8 点赞 · 1 评论 · 6 收藏
📅 2026-03-17 🏷 LLM
M4 32GB 能跑的最强本地模型排行榜(2026版)
本瓜手上的是一台 M4 32G 内存的 mac,我看了一篇关于:4090 跑 Qwen 35b 模型(MoE)-0限制版本 的实战文章,所以,便想着记录一下,相关的对比情况: 项目 Apple M4 ...
📊 7129 阅读 · 38 点赞 · 6 评论 · 47 收藏
📅 2026-03-17 🏷 人工智能
养龙虾之前?先搞懂 Skills!
这段时间很多人在研究 Claude Code、OpenClaw、各种 Agent 工具,讨论最多的是模型、插件、自动化流程。 真正决定效率上限的,却往往是一个被忽略的概念:Skills。 一句话解释:...
📊 1408 阅读 · 11 点赞 · 3 评论 · 14 收藏
📅 2026-03-10 🏷 人工智能
国内大模型真实格局:用户规模 vs API调用量(v2026.3.6)
没办法,不是我们不想用 cc,谁让 dario 这个波对华有成见,罢也,看看国内大模型现状,也不错呢? 如果只看一个指标,很容易对行业格局产生误判。有些模型 用户很多,但开发者调用不多;有些模型 用户...
📊 3198 阅读 · 4 点赞 · 2 评论 · 1 收藏
📅 2026-03-06 🏷 人工智能
玩转龙虾🦞,openclaw 核心命令行收藏(持续更新)v2026.3.2
其实吧,没必要传的那么神乎其神,本质吧 node 框架打通了和各个聊天 channel 的网关层以及大模型调用....... 但是吧,也确实牛逼,开源建设势不可挡,这个确实是未来的趋势,本篇记录常用的...
📊 3537 阅读 · 31 点赞 · 2 评论 · 58 收藏
📅 2026-03-05 🏷 人工智能
Cursor:长执行模式,验证大模型“7*24h编程”的可能性
2026 年 1 月,Cursor 团队公布了一项颇具野心的实验: 让编码 Agent 连续运行数周,自主推进复杂项目。 目标很直接——验证一个问题: 如果向同一个代码库持续投入更多 Agent,自主...
📊 531 阅读 · 2 点赞 · 0 评论 · 0 收藏
📅 2026-02-26 🏷 人工智能
离了大谱!一个 prompt 生成了 7 万字!mark
背景 我也不明所以,糖糖,先记下来! 原 prompt 以下内容为一次性生成(7w字) 下面按“真实可交付项目”的标准,直接给你一套 可复制运行的完整工程骨架 + 关键代码文件(Tauri + Vue...
📊 351 阅读 · 5 点赞 · 0 评论 · 1 收藏
📅 2026-02-10 🏷 LLM
JavaScript 框架展望 2026
这一年变化很多,但更多是一种视角的变化。若说 AI 过去还不够主流,那么过去一年它已完全主导了讨论。以至于几乎没人再谈新的 JavaScript 框架或框架特性。但这并不代表事情没有进展。...
📊 729 阅读 · 5 点赞 · 0 评论 · 1 收藏
📅 2026-02-05 🏷 前端 JavaScript 面试
叒改名?? Clawd 近日完成第三次更名,这次叫:OpenClaw 😂
开源 AI 助手项目 Clawd 完成第三次更名,现正式定名为 OpenClaw,GitHub 星标数已突破 10 万。 新名称强调完全开源与社区驱动,并保留标志性的龙虾吉祥物。OpenClaw 支持...
📊 1931 阅读 · 7 点赞 · 0 评论 · 3 收藏
📅 2026-01-30 🏷 前端
花5分钟、50块体验 ClawdBot (MoltBot),值不值?
普通人,能不能用极低成本,把一个能用的 ClawdBot(moltbot) 跑起来。 花费 50 元、官方平台、尽量少折腾,最好 5 分钟内能看到效果。 阿里云的轻量应用服务器 + clawdbot...
📊 602 阅读 · 3 点赞 · 0 评论 · 3 收藏
📅 2026-01-30 🏷 前端 人工智能
代理式人工智能:让大模型从“被动回答”走向“主动执行”
过去几年,生成式 AI 带来了惊人的内容生产能力——它能写代码、能回答问题、能生成图片,但它依然是“被动的”。 无论是 ChatGPT......
📊 344 阅读 · 3 点赞 · 0 评论 · 0 收藏
📅 2025-12-18 🏷 人工智能
VSCode V1.107 发布(2025 年 11 月)
发布日期:2025 年 12 月 10 日 VS Code 1.107 引入了多智能体编排(multi-agent orchestration) ——你可以将 GitHub Copilot 与自定义 ...
📊 675 阅读 · 4 点赞 · 0 评论 · 1 收藏
📅 2025-12-17 🏷 前端 Visual Studio Code
我把设计稿扔给 Doubao-Seed-Code,它写出的前端页面让我怀疑人生
过去几年,前端开发的节奏一直在悄悄发生变化:从「组件开发 → 低代码 → 设计稿转代码工具」一路往前推进,但始终有一道过不去的坎——模型看不懂设计稿,只能看懂语言。这意味着我们依然要靠开发者手工理解 ...
📊 3171 阅读 · 15 点赞 · 5 评论 · 32 收藏
📅 2025-11-24 🏷 人工智能
本地模型 + 云端模型的 Hybrid Inference 架构设计:下一代智能系统的底层范式
过去一年,大模型的推理方式正在变得前所未有地多样化。开发者不再满足于“把请求丢给云端 API,然后等待结果”这种单向流程,而是真实地感受到:不同场景,对延迟、隐私、成本、可控性都有完全不同的要求。尤其...
📊 345 阅读 · 2 点赞 · 0 评论 · 1 收藏
📅 2025-11-17 🏷 人工智能
文心 5.0:原生全模态时代的技术分水岭
过去两年,大模型领域,我们见到无数号称“多模态”的模型,但绝大多数都停留在“能力堆叠”,而不是真正的“感知一致”。 通常的处理方式就是图像模型输出 embed...
📊 951 阅读 · 16 点赞 · 0 评论 · 3 收藏
📅 2025-11-14 🏷 人工智能
被权重出卖的“脏数据”:GPT-oss 揭开的 OpenAI 中文训练真相
前段时间,OpenAI 为展示开源诚意,公开了 GPT-oss 的全部模型参数。结果没想到,这件事反倒像一次“体检报告公开”。一些开发者顺着权重数据深挖,反向分析出了模型训练阶段“吃进去”的各种素材,...
📊 353 阅读 · 2 点赞 · 0 评论 · 0 收藏
📅 2025-11-10 🏷 人工智能
AI 生成代码,从 Copilot 到 Claude Code 的全景测评
AI 生成代码工具正在经历一场显著的流行与普及浪潮。几乎每周业界都会有新的工具发布或宣布上线.........
📊 876 阅读 · 2 点赞 · 0 评论 · 3 收藏
📅 2025-11-08 🏷 人工智能
使用 Chrome 内置 AI API 构建翻译 Demo
六月份参加 Google I/O Connect 和 Google Developer Expert 峰会后,我写过一篇关于 Chrome 内置 AI API 的文章,其中介绍了 Summarizer...
📊 477 阅读 · 6 点赞 · 0 评论 · 4 收藏
📅 2025-11-03 🏷 人工智能
Cursor 2.0 转向多智能体 AI 编程,并发布 Composer 模型
Cursor 发布了最新一代 AI 软件开发平台,引入全新的多智能体交互界面,并正式推出自研编码模型 Composer。 新模型 Composer 被描述为一款“前沿模型”。Cursor 声称,它在同...
📊 638 阅读 · 4 点赞 · 0 评论 · 0 收藏
📅 2025-10-30 🏷 人工智能
GitHub 发布 Agent HQ:欢迎回家,智能体们
当前的 AI 领域正面临一个我们再熟悉不过的挑战:强大的能力被割裂在不同的工具与界面之中。在 GitHub,我们一直致力于解决这种系统性难题——让 Git 更易用,让代码评审通过 Pull...
📊 411 阅读 · 2 点赞 · 0 评论 · 1 收藏
📅 2025-10-30 🏷 人工智能
从“打标签”到“算行为”:抖音推荐系统的进化逻辑(附打分算法深度解析)
打标签的时代为什么结束了? 在推荐系统的早期,世界是用“标签”来描述的。每个用户被贴上“爱美食”“爱旅行”“爱萌宠”的标签,每条内容也被分入“搞笑”“街舞”“Vlog”的类别。系统通过简单的“用户...
📊 1447 阅读 · 4 点赞 · 3 评论 · 12 收藏
📅 2025-10-29 🏷 人工智能
大模型嵌入浏览器,Atlas 和 Gemini 将带来怎样的变革?
大模型时代,过去上网查资料,我们大多经历过这样的场景:一边在浏览器里打开一堆网页寻找信息,一边又得切换到聊天机器人窗口去提问。 比如看到一篇复杂的技术文章不太明白,我们可能复制一段粘贴给 ChatGP...
📊 490 阅读 · 2 点赞 · 0 评论 · 0 收藏
📅 2025-10-24 🏷 人工智能
Seedream 4.0 测评:对飙 Nano Banana 生图,真的强!
9 月 11 日晚,字节跳动正式发布 豆包·图像创作模型 Seedream 4.0。这不仅是一次常规的迭代更新,更是一次针对创作者群体的全面升级: 支持 4K 超高清,推理速度提升超 10 倍,在 A...
📊 869 阅读 · 3 点赞 · 0 评论 · 4 收藏
📅 2025-09-22 🏷 LLM 人工智能 AIGC
文心快码 3.5S:多智能体自协同,引爆开发者新范式
前两天发了一篇关于《我的疑问:为什么 Anthropic(Claude) CEO 敌意这么大?!》的讨论,引起一些热议,原来 Anthropic 老板最开始也曾是百度海外的实习生;不管怎么说,“百度是...
📊 435 阅读 · 4 点赞 · 0 评论 · 0 收藏
📅 2025-09-12 🏷 人工智能
GPT-5 发布:把模型的“切换权”还给模型自己!
就在昨晚!OpenAI 正式发布 GPT-5,并把它设为 ChatGPT 的默认模型。 这一代的变化不是“再大一点的模型”,而是把快模型 + 深度推理模型 + 实时路由器整合成一个统一系统:能判...
📊 685 阅读 · 1 点赞 · 0 评论 · 0 收藏
📅 2025-08-08 🏷 人工智能 LLM
python 代码实战详解:金融风控场景下的大模型挑战
在金融风控这一对准确性、可解释性要求极高的领域,我们会发现通用大模型往往"力不从心"。 想象这样一个场景: 某银行的信贷风控系统需要评估一笔企业贷款申请。系统需要分析企业的财务报表、现金流预测、行业风...
📊 421 阅读 · 4 点赞 · 0 评论 · 3 收藏
📅 2025-08-05 🏷 人工智能 LLM
大模型为何迟迟无法真正融入微信?
当所有人都在谈论 AI 如何改变世界的时候,我们却发现一个有趣的现象:拥有 13 亿用户的微信,至今仍然是一个相对"传统"的社交平台。ChatGPT 火了两年,Claude、GPT-4 轮番上阵,但微...
📊 9137 阅读 · 27 点赞 · 77 评论 · 14 收藏
📅 2025-08-01 🏷 人工智能
AI 的十年周期规律:从专家系统到大模型,下一步是什么?
从 1980 年的专家系统,到 2023+ 年的大模型浪潮,AI 每十年一次“轮回”,技术更迭,范式切换。我们站在又一次临界点上,必须思考:下一步,到底是什么? ⏳ 一、40年简史:AI 每十年一次范...
📊 528 阅读 · 2 点赞 · 2 评论 · 1 收藏
📅 2025-07-31 🏷 人工智能
Cursor 发布 Web 和移动端 Agent:随时随地,开启编程!
Cursor 官方6.30日宣布,其智能编程助手正式登陆 Web 和移动端。开发者无需再局限于本地 IDE,无论是在电脑浏览器,还是在手机和平板上,Cursor Agent 都可以随时随地协助完成编码...
📊 1721 阅读 · 6 点赞 · 0 评论 · 6 收藏
📅 2025-07-02 🏷 面试 GitHub
百度文心4.5系列正式开源:国产大模型走到了世界牌桌正中央
2024年,DeepSeek R1 一战成名;2025年,OpenAI 不再嘴硬,终于也开始试探性地“Open”;谷歌一边推进 Gemini,一边推出轻量化的开源多模态 Gemma 系列……AI大模型...
📊 886 阅读 · 9 点赞 · 4 评论 · 1 收藏
📅 2025-06-30 🏷 人工智能
换了无数键盘、工学椅,却从没认真选过一块为程序员“注意力”设计的屏
注意力就是生产力 大模型的时代,我们意识到“自注意力”这件事情是最宝贵的!模型需要注意力,人更需要! 对程序员来说,写代码早已不是靠蛮力敲键盘,大模型能帮我们生成代码没错,但更依赖靠脑中的线程稳定运...
📊 1324 阅读 · 11 点赞 · 2 评论 · 7 收藏
📅 2025-06-13 🏷 面试 GitHub 前端
又有新的大模型训练策略啦?
过去两年,对齐技术像被按下快进键:RLHF 让模型首次听懂“好坏”,DPO 把训练成本打五折,RLAIF 把标注员换成 GPT-4,Constitutional AI 甚至给模型立了一部“宪法”。...
📊 480 阅读 · 2 点赞 · 0 评论 · 0 收藏
📅 2025-06-13 🏷 人工智能
从 0 构建 AI Demo?这份“云上 0 元清单”你值得拥有!
学习大模型相关技术,准备写个小应用跑通前后端、调用模型接口、做个简洁的可视化界面,但做到一半就卡住了—— 往往不是卡在代码,而是卡在基础设施。“服务器去哪开?云服务动不动就几百起步”...
📊 361 阅读 · 4 点赞 · 0 评论 · 2 收藏
📅 2025-06-13 🏷 面试 GitHub 人工智能
投篮左手不如右手,应该怎么练?机器学习“徐-罗奇定理”给出答案
最近参加一次关于“机器学习理论前沿”的专题讲座,听到了徐宗本院士分享的一段经历,其中提到他在误差建模领域的重要贡献——徐-罗奇定理 这是我第一次系统听说这个定理,但听完后,有种“原来一直在用,却不知道...
📊 269 阅读 · 3 点赞 · 0 评论 · 0 收藏
📅 2025-05-30 🏷 人工智能 面试 LLM
25年了,大模型最新的技术和概念“究竟”都有哪些?
突然就想来个梳理,25年又过去了一半,当下,大模型最新、最热的概念有哪些? 不妨一起来看看看👀 DeepSeek 模型蒸馏带来的颠覆 过去一年,大模型的体型越来越大,OpenAI、Google、Ant...
📊 749 阅读 · 8 点赞 · 0 评论 · 6 收藏
📅 2025-05-30 🏷 人工智能
组合优化三剑客:TSP、CVRP 和 FFSP
在强化学习、图神经网络甚至大模型应用的各类论文中,TSP、CVRP 和 FFSP 这三组缩写几乎屡见不鲜。它们是组合优化问题中的经典基准测试集,广泛用于验证优化算法、神经策略甚至 AI 规划系统的性能...
📊 781 阅读 · 3 点赞 · 0 评论 · 0 收藏
📅 2025-05-28 🏷 人工智能
强化学习不再靠奖励?组合优化迎来“偏好驱动”新框架
组合优化问题一直是工业界的经典难题。无论是旅行商问题(TSP),还是车辆路径规划(CVRP)和柔性车间调度(FFSP),一旦规模扩展,传统算法就会力不从心。 启发式搜索虽然仍在发挥作用,但面对高维度、...
📊 407 阅读 · 3 点赞 · 0 评论 · 0 收藏
📅 2025-05-28 🏷 人工智能
亚马逊云科技已实现:从 IDE 到控制台,全栈开发者的“云上副驾驶”
我们写代码的时候,到底最需要什么? 自动补全?当然好,但不是关键 查文档?太慢,常常上下文不对 重构提示?理想状态是自动 refactor 而不是“建议 refactor” 但说到底,我们需要的是...
📊 286 阅读 · 1 点赞 · 0 评论 · 0 收藏
📅 2025-05-21 🏷 GitHub 面试 架构
短信为何没落?
短信,从曾经的日常对话,变成了今天只在收验证码、收通知时才偶尔想起的工具。我们不再用它聊天,但它却以另一种方式,继续默默留在了每一部手机里——像一条永不熄灭的应急通道,安静又顽强。 为什么传统短信衰落...
📊 5324 阅读 · 24 点赞 · 30 评论 · 11 收藏
📅 2025-05-13 🏷 GitHub 面试 人工智能
还得是“靠人”!打通大模型与业务的“最后一公里”
最近,我跟团队落地了一个基于 Python 的 AI Web 应用项目,终于让我体会到,大模型与实际业务融合远比简单调用 API 更复杂,也更值得深究。 很多人觉得“大模型接入业务”不就是简单调用接口...
📊 349 阅读 · 6 点赞 · 0 评论 · 1 收藏
📅 2025-05-09 🏷 人工智能
为什么微信还不嵌入大模型?AI 不记得琐碎会话中的决策链
我们搞 AI+ 系统,搞各种 AI 加持的自动化流程,搞大模型训练和对接,搞知识库融合、函数调用、RAG 检索、Agent 编排……搞到后来,有时候真觉得:越搞越荒诞。 为啥? 因为你会发现,工...
📊 493 阅读 · 3 点赞 · 6 评论 · 5 收藏
📅 2025-05-07 🏷 人工智能
大模型+Python脚本,打造属于你的“批量生成文档”应用!
背景 每到月初、季末、年终,一项让人心累的工作总是如期而至——批量填表、批量制文档。 数十上百份,数据千头万绪,一边小心翼翼对着源数据,一边机械地复制粘贴,不仅枯燥,而且极容易出错。...
📊 637 阅读 · 2 点赞 · 0 评论 · 0 收藏
📅 2025-04-28 🏷 人工智能
以一敌百:没有 Infra 团队,那就打造自己的技术雷达
现在的节奏你应该感受到了: 大模型能生成代码、部署脚本、CRUD 界面,甚至能帮你生成一整套微服务架构。看起来开发门槛变低了,但实际上,技术栈扩散的速度却越来越快。...
📊 743 阅读 · 5 点赞 · 0 评论 · 4 收藏
📅 2025-04-21 🏷 人工智能 GitHub
DeepSeek-R1 全托管无服务器上线亚马逊云 Bedrock,为何值得关注?
DeepSeek-R1 宣布在亚马逊云科技 Bedrock 上全面上线,作为无服务器(Serverless)的完全托管服务。这意味着开发者和企业无需管理任何基础设施,就能通过一个 API 调用...
📊 311 阅读 · 3 点赞 · 0 评论 · 1 收藏
📅 2025-04-15 🏷 人工智能 LLM
颠覆 LLM?Meta 提出 LCM 这个新范式
你有没有一种感觉:这些模型生成的内容越来越“像人话”,但又不太像“有思想”? 这不是错觉。。。。。。...
📊 347 阅读 · 4 点赞 · 0 评论 · 2 收藏
📅 2025-04-15 🏷 人工智能 LLM
用亚马逊云Bedrock Guardrails 给 DeepSeek 模型部署加上“护身符”
生成式 AI 应用在落地过程中,内容安全永远是不可忽视的一环。尤其是当你用的是像 DeepSeek-R1 这种开源大模型,模型本身能力很强,但安全策略必须你自己兜底。 不管模型能力多强,拿到生产环境里...
📊 530 阅读 · 5 点赞 · 0 评论 · 1 收藏
📅 2025-04-14 🏷 人工智能
大模型预训练框架,有多重要?
预训练最常见的误解: "把模型结构写好 → 填上 tokenizer → 用 huggingface 跑起来就算训练了。" —— 错。真要训练大模型,面对的不是“代码能不能跑”,而是。。。...
📊 342 阅读 · 3 点赞 · 0 评论 · 4 收藏
📅 2025-04-11 🏷 人工智能
什么样的智能体才算“真正能干活”?
为什么大多数智能体平台不能真正“干活”?核心问题是:缺乏可调用的工具与清晰的执行结构。本文带你从实际项目出发,构建一个真正能生成报告、自动发邮件的数字员工。...
📊 564 阅读 · 4 点赞 · 0 评论 · 3 收藏
📅 2025-04-10 🏷 人工智能 LLM GitHub
🚀模型训练部署移动云平台全链路流程图(含推理 API 接入)
本篇分享:在移动云平台上模型完整部署流程,从代码上传、训练配置到推理服务与Web接入,全链路可复用,适合企业实战落地与个人模型上线参考。...
📊 602 阅读 · 4 点赞 · 1 评论 · 0 收藏
📅 2025-04-10 🏷 人工智能
llm 训练脚本怎么写?平台启动怎么配?一文搞定
本篇适合做llm训练项目前整理思路,介绍从怎么选学习率、设置 epoch 开始,到训练脚本怎么写、平台怎么配,再到用 LoRA 轻量化微调、做效果评估、导出模型部署。...
📊 598 阅读 · 5 点赞 · 0 评论 · 4 收藏
📅 2025-04-09 🏷 LLM 人工智能
DeepSeek-R1 上亚马逊云,这波是真的全方位“上云”!
如果你之前关注过亚马逊云科技的 AI 战略,你可能会记得,去年 re:Invent 大会上 Amazon CEO Andy Jassy 提出过三个关于 AI 应用落地的关键点:...
📊 438 阅读 · 6 点赞 · 0 评论 · 0 收藏
📅 2025-04-08 🏷 人工智能 LLM DeepSeek
记录 Chatgpt 辅助离线配置环境,我就像是个小丑🤡🤡🤡
记录一次”有趣的“大模型辅助离线环境配置的经历。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。...
📊 368 阅读 · 5 点赞 · 4 评论 · 1 收藏
📅 2025-04-07 🏷 人工智能 LLM 程序员
GPT-4.5 被 73% 的人误认为人类,“坏了?!我成替身了!”
我发现,现在很多文章,越来越无法分辨是不是由大模型写的,或者其中占比是多少。 今天看到消息:GPT-4.5 被 73% 的人误认为人类,又被震惊了! 别说写文章这种长篇大论了,以后聊天,也不知道对方是...
📊 631 阅读 · 3 点赞 · 3 评论 · 2 收藏
📅 2025-04-03 🏷 人工智能 程序员
为什么GPT-4o可以生成吉卜力风格照片,原理是什么?
本文深入解析GPT-4o生成吉卜力风格图像的技术原理,涵盖Transformer架构、多模态对齐机制、扩散模型生成流程,以及模型如何通过大规模图文数据学习风格特征。文章结合结构图与案例...
📊 2100 阅读 · 17 点赞 · 2 评论 · 4 收藏
📅 2025-04-02 🏷 人工智能
MCP:大模型落地的关键路径 —— 程序员的新机会
现在的大模型落地不理想,真正的落地,应该是落地到各个企业、各个生产环节,想一想:比如在浏览器中命令大模型处理公司 ERP 系统的内容 —— 帮我总结公司会议关键信息、帮我分析一下系统数据趋势。。。...
📊 4055 阅读 · 38 点赞 · 7 评论 · 53 收藏
📅 2025-04-01 🏷 面试 人工智能
🚀使用 Trae + SSH “急速开发”一个可以公网访问的 web 社区应用!!
废话背景不多说,直接开冲!本文通过一个实践,详细展示如何利用阿里云ECS、Trae SSH以及AI指令,从零开始快速搭建一个技术社区的Python Web应用。...
📊 2523 阅读 · 31 点赞 · 4 评论 · 25 收藏
📅 2025-03-17 🏷 人工智能 面试 LLM
llm落地困境破局?工作流如何成为程序员的「场景化改造」利器
最近有个感触就是:大模型想要落地,还得是依靠工作流。 众所周知,大模型是通用模型,大小公司要么是卖模型的、要么是买模型的,大家发现在专业场景下,大模型处理还是乏力。 融合大模型的重心似乎没有侧重在...
📊 236 阅读 · 4 点赞 · 2 评论 · 4 收藏
📅 2025-03-11 🏷 人工智能 LLM
说人话有多重要?大模型中的困惑度
我们常看到「困惑度」。它像一把标尺,衡量着AI生成文本的流畅度,决定着模型能否在手机端运行的生死线。 今天本篇将揭开这个指标的面纱...
📊 773 阅读 · 4 点赞 · 0 评论 · 0 收藏
📅 2025-02-27 🏷 LLM
从BERT到DeepSeek的技术跃迁,关于“认知”的革命
2025年初,大模型生态最火的莫过于 DeepSeek 的出圈了! 这家2023年7月才成立的公司,可以说是以一己之力,扭转了主流大模型竞争的方向与局面。 它靠纯强化学习训练框架,硬是把1750亿参数...
📊 530 阅读 · 4 点赞 · 0 评论 · 2 收藏
📅 2025-02-27 🏷 LLM
总被提示“服务器繁忙”?推荐10个DeepSeek R1平台入口
DeepSeek 自今年1月R1模型发布后,日活用户突破4000万,服务器负载远超预期。官方服务的卡顿问题已成为用户痛点,我们常常都会遇到"服务器繁忙,请稍后重试"提示,尤其在工作日高峰期...
📊 1167 阅读 · 10 点赞 · 0 评论 · 11 收藏
📅 2025-02-19 🏷 面试 GitHub 人工智能
大模型编码“吊打“低代码的基本逻辑
低代码平台曾像自助火锅拯救厨房小白一样解救过许多人。。。然而,当低代码还在用乐高积木搭房子时,大模型编码已经掏出3D打印机开始造电梯了。。。...
📊 1637 阅读 · 21 点赞 · 1 评论 · 19 收藏
📅 2025-02-18 🏷 人工智能 面试 GitHub
何谓 DeepSeek “蒸馏”?
可以说 DeepSeek通过“大模型强化学习+小模型蒸馏”的技术路径,不仅能与OpenAI的正面竞争,更提供了一个新的大模型研发思路。本篇一起来深入了解一下:何谓 DeepSeek “蒸馏”?...
📊 5711 阅读 · 31 点赞 · 9 评论 · 47 收藏
📅 2025-02-14 🏷 人工智能 GitHub 面试
DeepSeek再次引爆大模型,扎克伯格称:非常厉害!
最近这些天被 DeepSeek 刷屏了,简而言之, DeepSeek 用超低的成本实现了和 ChatGPT o1 类似的效果,在多项测评中甚至还能领先,且它还是开源的! 这对于当前大模型来说,简直是爆...
📊 2972 阅读 · 20 点赞 · 0 评论 · 9 收藏
📅 2025-01-27 🏷 GitHub LLM 人工智能
RAG BM25 算法和重排,微调以外的手段
许多开发者开始通过定制化的调优提升模型性能。 微调虽然能够提高模型的专门性,但也面临问题。。。。本篇介绍RAG BM25 算法和重排技术。...
📊 588 阅读 · 3 点赞 · 0 评论 · 0 收藏
📅 2024-11-28 🏷 LLM 人工智能
DSPy,让提示语工程师失业!
大模型技术还在快速发展,不得不让人感到惊叹。 前文提到提示语:《 从 Prompt 到 RAG,从 RAG 到 DSPy》,这体现出当下的大模型提示语仍然脆弱,就像沙子构筑的城堡,很容易被用户瓦解...
📊 2302 阅读 · 22 点赞 · 5 评论 · 35 收藏
📅 2024-11-19 🏷 人工智能 LLM
能不能通俗易懂翻译翻译“梯度下降法是什么”?
前面文章(通过 AutoGrad 来理解 TextGrad ,反向传播中的自动微分)提到梯度了,那么梯度到底是什么?本篇再深入一点来看看。 梯度下降法对于神经网络来说,真的是太重要了...
📊 721 阅读 · 6 点赞 · 1 评论 · 3 收藏
📅 2024-07-30 🏷 LLM 人工智能 GitHub
通过 AutoGrad 来理解 TextGrad ,反向传播中的自动微分
DSPy 很牛,它不同于 RAG 的思路(建立本地知识库,给提示语更专业的背景知识),DSPy 做了两件事情,第一是它将大模型的执行分解成为一个流程,也可以称之为“程序”,然后引入优化器,可以微调...
📊 813 阅读 · 8 点赞 · 0 评论 · 5 收藏
📅 2024-07-24 🏷 LLM AIGC 人工智能
RAG+内容推荐,应该如何实践?
最近业务有需求:结合RAG+内容推荐,针对实践部分,做一点探究。 话不多说,直接开冲! 背景 首先回顾一下 RAG 技术定义,它可以结合信息检索和生成模型的混合。简单来说,RAG = 预训练的语言模型...
📊 1139 阅读 · 12 点赞 · 1 评论 · 13 收藏
📅 2024-07-17 🏷 LLM 人工智能 GitHub
浅析优化文本提示技术 —— TextGrad
TextGrad 是一种通过文本反馈反向传播优化大模型系统的新范式,DSPy 则专注于通过参数化模块和编译器优化实现LM管道的系统化开发和优化。...
📊 2663 阅读 · 5 点赞 · 1 评论 · 3 收藏
📅 2024-06-23 🏷 人工智能 LLM GitHub
实战 Claude3 + GO + AWS,深入构建 AIGC 应用
2023 年是大模型底层技术研发‘百团大战’之年,2024 年则是大模型应用赋能千行百业‘百花齐放’之年,当然借助像扣子这样平台,我们可以做到“傻瓜式”创建 AIGC 应用,但是......
📊 809 阅读 · 4 点赞 · 1 评论 · 2 收藏
📅 2024-05-20 🏷 人工智能
再靠近亿点点,RAG 优化策略
书接上回 一脚踹开 RAG 大门,深入它所面临的挑战 本篇来看下 RAG 的架构优化策略。。。。。。。...
📊 947 阅读 · 3 点赞 · 2 评论 · 0 收藏
📅 2024-04-12 🏷 人工智能 LLM AIGC
一脚踹开 RAG 大门,深入它所面临的挑战
最近一直在看大模型 RAG 技术相关,前面写过一篇文章,可以看到 RAG 技术还有很多痛点,本篇再深入一步,思考一些解决方法~ 闲话少说,直接开冲...
📊 4221 阅读 · 6 点赞 · 0 评论 · 5 收藏
📅 2024-04-11 🏷 人工智能 LLM AIGC
Pytorch 前反馈:在神经网络训练中降低损失
今天继续来聊聊PyTorch 之神经网络 (≧▽≦*)o 冲就完事了~在 PyTorch 界里,构建神经网络的神器就是 torch.nn 包。这个包是大脑的搭建工坊,提供无限可能...
📊 1126 阅读 · 5 点赞 · 0 评论 · 1 收藏
📅 2024-04-11 🏷 人工智能 LLM 深度学习
PyTorch 揭秘 :构建MNIST数据集
构建MNIST数据集代码完成了训练循环,包括损失计算、反向传播和网络参数的优化。每100个batch打印一次训练过程中的平均损失,方便我们观察模型学习的情况。...
📊 729 阅读 · 5 点赞 · 0 评论 · 1 收藏
📅 2024-04-08 🏷 LLM
pytorch 卡点:雅可比向量积
书接前文,我们了解了 —— 刹车与油门:PyTorch Autograd 的赛车之旅,如文所说,自动微分是 PyTorch 深度学习框架的核心。既然是核心,就需要敲黑板、划重点学习。...
📊 868 阅读 · 2 点赞 · 0 评论 · 2 收藏
📅 2024-02-29 🏷 人工智能 LLM
夯基数学:PyTorch 线性回归实践
线性回归是我们中学课本中学的最基础的概念之一,用于建立变量之间线性关系的统计方法; 在简单线性回归中,会建立一个因变量与一个自变量之间的线性关系模型。 我们可以用 PyTorch 来实现一些实践案例。...
📊 774 阅读 · 3 点赞 · 3 评论 · 3 收藏
📅 2024-02-18 🏷 人工智能 深度学习 AIGC
刹车与油门:PyTorch Autograd 的赛车之旅
对于大模型的学习与探索不要停止,LLM 就是“未来已来”。 前面通过简单的实操上手 Pytorch,本篇带来 Pytorch 核心引擎:autograd...
📊 720 阅读 · 4 点赞 · 0 评论 · 3 收藏
📅 2024-02-04 🏷 LLM GitHub 面试
轻松上手:PyTorch 预测书店销售趋势
轻松上手:本篇介绍深度学习框架PyTorch来处理和预测书店销售数据
展示其在实际商业场景中的应用...
📊 903 阅读 · 5 点赞 · 1 评论 · 3 收藏
📅 2024-01-10 🏷 人工智能 前端 面试
丝滑走进深度学习之 PyTorch
在前不久写过一篇《 小白白也能看懂的 TensorFlow 及其在 AMI 的部署》,关于深度学习框架 TensorFlow 以及云部署。 本篇带来另一个著名的深度学习框架 —— PyTorch...
📊 1051 阅读 · 4 点赞 · 1 评论 · 4 收藏
📅 2023-10-11 🏷 前端 面试 人工智能
小白白也能看懂的 TensorFlow 及其在 AMI 的部署
开宗明义,本篇带来:深度学习的入门框架 —— TensorFlow,以及将其在 Amazon Deep Learning AMI 中私有化部署。...
📊 935 阅读 · 5 点赞 · 0 评论 · 2 收藏
📅 2023-09-11 🏷 人工智能 深度学习 云原生