沉着研究,水到渠成

小妍 —— 你的全能科研助理。
为你梳理文献、沉淀笔记,专注科研本质。

检查最新版本...

为高密度学术环境设计

极简文献阅读

克制的排版结构,彻底摆脱多余视觉噪音。精准的公式渲染与图表提取,让阅读回归专注。

知识网络沉淀

不再让笔记散落各处。每一次勾画与批注,都会自动汇聚成你的个人专属图谱,构建结构化的脉络。

克制的 AI 协作

AI 隐于幕后。我们拒绝花哨的对话框堆砌,AI 仅在需要时化作恰到好处的光束与提示,提供高密度学术帮助。

你的科研工作台

从工作台首页一眼掌握全局:在研主题、待办推进、关注事项和所有研究资产。

今天先把最关键的研究接上。

小妍先把值得继续的主题、刚交回来的结果和容易拖慢进展的事项整理到一起。

在研主题
3
2 个已成路线
已解读论文
5
6 篇论文已入库
知识卡片
3
可继续补证据和结构
最近对话
15
可以直接接着追问
今日推进
最近截止
确认 ACL 2025 的截止安排
07-15 有一个临近节点,建议提前把版本和材料整理好。
持续推进
继续推进「基于强化学习的大模型代码生成优化」
继续收敛问题、补证据,并安排下一步实验或写作。
补知识沉淀
给「联邦学习中的差分隐私保护机制」补第一条知识卡片
有论文解读但没有知识沉淀时,后续追问和写作都会变散。
在研主题
持续推进
基于强化学习的大模型代码生成优化
已有 8 篇论文、5 条笔记和 12 次对话沉淀。继续收敛问题、补证据,并安排下一步实验或写作。
8 篇论文5 条笔记12 次对话
论文精读
联邦学习中的差分隐私保护机制
已经关联 5 篇论文,下一步先完成首篇解读。
5 篇论文0 条笔记3 次对话
补核心论文
多模态大模型在医学影像分析中的应用
路线已经成形,但还没有和这个主题关联的核心论文。
0 篇论文0 条笔记0 次对话
关注事项
临近截止
ACL 2025 即将到期
07-15 前建议确认版本、材料和回复节奏。

深度文献解析与双栏重构

打破 PDF 静态页面的束缚。我们提供行业领先的文献解析引擎能力,将枯燥的双栏排版与截断的语境重构为流畅、响应式的高质量学术内容。

  • 高精度公式渲染:无缝识别复杂数理公式与学术图表
  • 一键引文溯源:悬浮查看并一键跳转原文,无需上下翻找
  • 沉浸式多模态交互:图文、表格并在同一视野下自由组合
论文库
搜索论文...
筛选
ReAct: Synergizing Reasoning and Acting in Language Models
Yao et al.ICLR 2023
提出推理与行动交织的范式,在代码生成任务中提升 15% 准确率。
LLM推理工具调用
已解读
Reflexion: Self-Reflective Agents with Verbal Reinforcement Learning
Shinn et al.NeurIPS 2023
通过语言反馈实现策略迭代,无需额外模型训练即可提升性能。
强化学习自我反思Agent
已解读
CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning
Le et al.NeurIPS 2022
利用编译器反馈作为奖励信号,在 APPS 数据集上达到 SOTA。
代码生成RL单元测试
已解读
InterCode: Standardizing and Benchmarking Interactive Coding with Execution Feedback
Yang et al.ACL 2023
基准测试交互式编程沙箱
处理中
SWE-bench: Can Language Models Resolve Real-World GitHub Issues?
Jimenez et al.ICLR 2023
首个在真实 GitHub 仓库上评估语言模型修 bug 能力的基准。
软件工程基准测试真实场景
已解读
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
Yao et al.NeurIPS 2023
将 CoT 扩展为多分支树搜索,在数学推理和代码规划上效果显著。
搜索规划思维树
已解读

打造无缝连接的知识库

任何有价值的思考都不应被遗忘。你在文献中产生的所有高亮、批注与灵感,都会自动被建立索引并转化为节点笔记,陪伴贯穿你的写作阶段。

  • 节点式卡片笔记:双向链接打通文献间的知识壁垒
  • 自动标签与聚类:依靠小妍算法自动整理相近的文献主题
  • 知识脉络可视化:全局视野查看引用网络,发现领域空白
知识库
ReAct 范式的核心洞察
ReAct 的关键在于将推理轨迹(Thought)与行动轨迹(Action)交织在一起。Thought 负责规划、跟踪进度和处理异常;Action 负责与外部环境交互(搜索、计算器、代码执行器)。
ReAct推理行动
2 篇关联
05-14 16:32 更新
强化学习在代码生成中的奖励设计
代码生成任务中,奖励信号可以来自:1) 编译器是否通过编译;2) 单元测试是否全部通过;3) 代码复杂度指标(圈复杂度、行数)。CodeRL 采用了渐进式奖励:语法正确 > 编译通过 > 测试通过。
RL奖励设计代码生成
3 篇关联
05-13 10:15 更新
Tree of Thoughts vs CoT 的适用边界
ToT 更适合需要探索的多步骤任务(如代码规划、数学证明),而 CoT 更适合单路径推理。ToT 的额外开销在于需要维护搜索树和评估函数,但在代码生成这种需要回溯修改的场景下很值得。
ToTCoT搜索
2 篇关联
05-12 09:48 更新
继续沉淀更多知识卡片

更纯粹的学术级表达

从草稿到顶会级写作,小妍伴随你的每一步。绝不伪造事实(幻觉),只是基于你本人的核心思路与专属知识库,为你提供贴合学术规范的高质量润色建议。

一键综述大纲

基于选定的系列文献,自动提取核心主轴并附送引用锚点,建立稳固的文章结构。

英语母语级精修

提供合乎逻辑语序的句型重构建议,修正非正式表达,保证语法清晰专业。

小妍
在线
ReAct 和 Reflexion 都用了强化学习的思想,它们的核心区别是什么?
好问题。两者虽然都涉及反馈循环,但机制不同:

ReAct 是在单轮交互中交织推理和行动,它本身不保留跨轮次的经验。每次遇到新任务都从零开始推理。

Reflexion 则引入了显式的记忆机制:当任务失败后,模型会生成一段文字总结失败原因,并将其写入「经验记忆」。下次遇到类似任务时,这段记忆会被注入 prompt 中作为先验知识。

简单说:ReAct 是「边想边做」,Reflexion 是「边做边记,下次再用」。

一切准备就绪

下载小妍产品端,解锁丝滑的离线与本地科研流。
跨平台可用,无缝衔接你的下一个重大研究突破。

检查最新版本...